Question 1

バッチ処理：OpenAI / Anthropic Batch API で 50% オフ

Accepted Answer

## バッチ割引

OpenAI と Anthropic はリアルタイムでないワークロード向けに大幅割引のバッチ API を提供しています:

| プロバイダー    | 割引   | 最大待機時間 | ファイルサイズ上限    |
| --------------- | ------ | ------------ | --------------------- |
| OpenAI Batch    | 50% オフ | 24時間       | 100 MB / 50K リクエスト |
| Anthropic Batch | 50% オフ | 24時間       | 100 MB / 100K リクエスト|

GPT-4o の 1M トークン入力は $2.50 から $1.25 に。Claude Sonnet 4.6 の 1M トークン入力は $3.00 から $1.50 に。

### 対象になるワークロード

- バックフィル / 1回限りの移行：過去のユーザーコンテンツをタグ付け、古いコーパスの Embedding 生成、静的ナレッジベースの翻訳。
- 日次バッチジョブ：前

Question 2

どのような場面で役立ちますか？

Accepted Answer

意味のあるボリュームのリアルタイムでない LLM ワークロードがあれば常に使ってください。Embedding バックフィル、コンテンツタグ付け、定期分析、評価パイプライン、オフラインデータエンリッチメント。

バッチ処理：OpenAI / Anthropic Batch API で 50% オフ

詳細な説明

バッチ割引

対象になるワークロード

対象外のワークロード

ハイブリッドアーキテクチャ

実装コスト

24時間が長すぎる場合

ユースケース

試してみる — プロンプトトークン費用計算ツール

関連トピック

プロバイダー	割引	最大待機時間	ファイルサイズ上限
OpenAI Batch	50% オフ	24時間	100 MB / 50K リクエスト
Anthropic Batch	50% オフ	24時間	100 MB / 100K リクエスト

バッチ処理：OpenAI / Anthropic Batch API で 50% オフ

詳細な説明

バッチ割引

対象になるワークロード

対象外のワークロード

ハイブリッドアーキテクチャ

実装コスト

24時間が長すぎる場合

ユースケース

試してみる — プロンプト トークン費用計算ツール

関連トピック

試してみる — プロンプトトークン費用計算ツール