Question 1

要約のコスト：Map-Reduce vs シングルコール vs ストリーミング

Accepted Answer

## 3つのアーキテクチャ

GPT-4o で 100K トークン文書を 1K トークン要約に:

### 1. シングルコール（文書全体 → 要約）

- 入力: 100K × $2.50/1M = $0.250
- 出力: 1K × $10/1M = $0.010
- 合計: $0.260

制約: 文書がモデルのコンテキストウィンドウに収まる必要があります。GPT-4o は 100K で OK（128K 上限）。Claude も 100K で OK（200K 上限）。それ以上はチャンク化が必須です。

### 2. Map-Reduce（チャンク → チャンク要約 → 最終要約）

5K トークン × 20 チャンクに分割し、それぞれを 200 トークンに要約してから20要約をさらに要約:

- Map ステップ: 20 × (5K入力 + 200出力) を GPT-4o mini で:
  - 入力: 100K × $0.15/1M = $0.015
  - 出力: 4K × $0.60/1M = $0.0024
- Reduce ステップ: 1 × (4K入力 + 1K出力)

Question 2

どのような場面で役立ちますか？

Accepted Answer

要約機能を設計する際に使ってください：文書解析、会議録要約、複数文書からのリサーチ統合、ニュース集約、顧客フィードバックの抽出など。

要約のコスト：Map-Reduce vs シングルコール vs ストリーミング

詳細な説明