Question 1

Claude プロンプトキャッシュ：1設定で請求80%削減

Accepted Answer

## 計算式

Anthropic Claude Opus 4.7 のプロンプトキャッシュ価格:

- 初回書き込み（キャッシュミス）：入力単価の1.25倍 → $18.75/1M
- 以降の読み込み（キャッシュヒット、TTL 5分）：入力単価の0.1倍 → $1.50/1M
- 通常の入力：$15/1M

50,000 トークンのシステムプロンプトで、1セッション100ユーザーメッセージを処理するチャットアシスタントの例:

| 戦略           | セッションあたりコスト                                  | 備考                            |
| -------------- | ------------------------------------------------------- | ------------------------------- |
| キャッシュなし | 100 × 50K × $15/1M = $75.00                         | 毎ターン全額請求

Question 2

どのような場面で役立ちますか？

Accepted Answer

システムプロンプトや検索コンテキストが大きく、複数ターン間で安定している場合に適用してください。カスタマーサポート、技術ドキュメント Q&A、コードエージェント、永続的なペルソナを持つアプリ全般。

Claude プロンプトキャッシュ：1設定で請求80%削減

詳細な説明

計算式

TTL のトレードオフ

キャッシュ書き込みの粒度

実運用でのヒット率

OpenAI との比較

ユースケース

試してみる — プロンプトトークン費用計算ツール

関連トピック

戦略	セッションあたりコスト	備考
キャッシュなし	100 × 50K × $15/1M = $75.00	毎ターン全額請求
キャッシュあり	1 × 50K × $18.75/1M + 99 × 50K × $1.50/1M = $8.36	89%削減

Claude プロンプトキャッシュ：1設定で請求80%削減

詳細な説明

計算式

TTL のトレードオフ

キャッシュ書き込みの粒度

実運用でのヒット率

OpenAI との比較

ユースケース

試してみる — プロンプト トークン費用計算ツール

関連トピック

試してみる — プロンプトトークン費用計算ツール