Question 1

RAG パイプラインのコスト：Embedding + 検索 + 生成

Accepted Answer

## 3ステップのコスト内訳

典型的な RAG パイプラインの1クエリあたりコスト:

1. クエリ Embedding — ユーザー質問（約50トークン）を Embedding → 50/1M × $0.02 = $0.000001
2. ベクトル検索 — ベクトル DB 費用（Pinecone、Qdrant 等。LLM 費用ではない）→ プランによるが 約 $0.00005
3. LLM 生成 — 検索チャンク（約 3,000 トークン）+ 回答（約 500 トークン）を GPT-4o で:
   - 入力: 3,000/1M × $2.50 = $0.0075
   - 出力: 500/1M × $10 = $0.005
   - 合計: $0.0125

1クエリ合計: 約 $0.0126、生成ステップが支配的（コスト全体の99%）。

### 実際にコストが漏れる場所

3つのパターンが請求を大きく膨張させます:

- top-k が大きすぎる — k=5 ではなく k=20 で取得すると、入力分が4倍になります。評価を実施してください。多くの場合、無関係なコンテキストで

Question 2

どのような場面で役立ちますか？

Accepted Answer

検索拡張アプリケーションを設計・チューニングする際に使ってください：ナレッジベース付きカスタマーサポートボット、コードドキュメント Q&A、社内ウィキ検索、契約書解析など。

RAG パイプラインのコスト：Embedding + 検索 + 生成

詳細な説明

3ステップのコスト内訳

実際にコストが漏れる場所

システムプロンプトのキャッシュ化

生成モデルの選び方

ユースケース

試してみる — プロンプトトークン費用計算ツール

関連トピック

RAG パイプラインのコスト：Embedding + 検索 + 生成

詳細な説明

3ステップのコスト内訳

実際にコストが漏れる場所

システムプロンプトのキャッシュ化

生成モデルの選び方

ユースケース

試してみる — プロンプト トークン費用計算ツール

関連トピック

試してみる — プロンプトトークン費用計算ツール