Question 1

OpenAI API Rate Limits and Token Budgeting

Accepted Answer

## OpenAI API Rate Limits

OpenAI uses a dual rate limit system: limits are enforced on both requests per minute (RPM) and tokens per minute (TPM) simultaneously. You must stay within both limits.

### Rate Limits by Tier (GPT-4o)

| Tier | RPM | TPM | RPD |
|------|-----|-----|-----|
| Free | 500 | 30,000 | 500 |
| Tier 1 | 500 | 30,000 | 10,000 |
| Tier 2 | 5,000 | 450,000 | — |
| Tier 3 | 5,000 | 800,000 | — |
| Tier 4 | 10,000 | 2,000,000 | — |
| Tier 5 | 10,000 | 10,000,000 | — |

### Token

Question 2

When is this useful?

Accepted Answer

You are building a customer support chatbot using GPT-4o at Tier 2. Each customer interaction averages 2,000 tokens (prompt + response). You need to calculate how many concurrent chat sessions you can support and what happens during peak load.

OpenAI API Rate Limits and Token Budgeting

Detailed Explanation

OpenAI API Rate Limits

Rate Limits by Tier (GPT-4o)

Token Budgeting

Optimization Strategies

Use Case

Try It — Rate Limit Calculator

Related Topics

Tier	RPM	TPM	RPD
Free	500	30,000	500
Tier 1	500	30,000	10,000
Tier 2	5,000	450,000	—
Tier 3	5,000	800,000	—
Tier 4	10,000	2,000,000	—
Tier 5	10,000	10,000,000	—