MAGAZINE

ルーターマガジン

AI/機械学習

AIモニタリングツールの落とし穴:表示される「推定コスト」を鵜呑みにしてはいけない理由

2026.01.23
Pocket

はじめに

Cloudflare AI GatewayをはじめとするAIモニタリングツールは、各種AIアプリケーションのログ管理、キャッシング、レート制限などを一元管理できる非常に強力なツールです。

基本的な使い方や機能については、以下の記事で詳しく解説されています。

AIエンジニア必見:Cloudflare AI GatewayでAPIエラー・トークン・コストの悩みを解決する!

しかし、こうした便利なツールの「コスト可視化機能」を利用する際には、見落としがちな重大な注意点があります。

それは、「表示される推定コストを鵜呑みにしてはいけない」ということです。 本記事では、Cloudflare AI GatewayとGoogle AI Studioを例に挙げ、ツールの表示額と実際の請求額との間に生じている「金額の乖離」の実態を共有します。

Cloudflare AI Gateway:思考トークンがコスト計算に含まれていない

Cloudflare AI Gatewayの魅力の一つにコスト管理の自動化があります。 通常、このツールはAPIレスポンスのログから「入力トークン」、「出力トークン」等のトークン種別ごとにトークン量を自動的に集計し、使用されたモデルの単価表に基づいて利用金額を算出・可視化してくれます。これにより、開発者は複雑な計算をせずとも、ダッシュボードを見るだけで概算コストを把握できる仕組みになっています。

しかし、現時点ではこの機能に死角があります。 それは、モデルが生成した「思考トークン(thoughtsTokenCount)」がコスト計算から無視されてしまっているという点です。

何が起きているのか?

最近のモデル(Gemini 2.5以上など)では、最終的な回答を生成する前に「思考」や「検索」のプロセスを挟むものがあります。 このプロセスで消費される「思考トークン」の扱いに注意が必要です。

以下の画像は、あるリクエストにおけるCloudflare AI Gateway上のログ詳細です。(検証日:2026年1月6日) レスポンスデータ内には思考トークン数を示す thoughtsTokenCount が記録されていますが、AI Gatewayが集計対象とする「出力トークン数」には、この値が含まれていません。

実際に生じている「金額の乖離」

思考トークンは通常、通常の出力トークンと同じレートで課金されるため、ここが漏れるとコスト計算が大きく狂います。

今回のケースで比較してみましょう。AI Gateway上で認識された出力トークンはわずか 433 でしたが、実際には裏側で 3050 もの思考トークンが消費されています。

  • AI Gateway上の料金: $ 0.001299
  • 思考トークンも含めた実際の料金: $ 0.008924

その結果、実際のコストは表示価格の約7倍近くに達しています。 AI Gateway上のログだけを見て予算管理をしていると、月末に「実際の請求額が想定の数倍に膨れ上がっている」という事態になりかねません。


2. Google AI Studio:公式ツールであっても過信は禁物

「サードパーティ製ツールではなく、公式のGoogle AI Studioに記載されたコストを参照すれば正確なのでは?」と思われるかもしれません。 しかし、残念ながらこちらも現状は実態と大きく乖離した数値が表示されるケースが確認されています。

実際に、画像生成モデルであるGemini 3 Pro Image Preview (Nano Banana Pro)で画像を生成した際のコストを見てみましょう。(検証日:2025年12月5日)

Google AI Studioに表示される推定価格では、出力のコストが $ 0.001 と表示されています。

しかし、今回使用した画像生成モデルであるgemini-3-pro-image-previewの価格設定 には、以下のような記載があります。

画像出力の料金は、1,000,000 トークンあたり $120 です。1,024×1,024 ピクセル(1K)から 2,048×2,048 ピクセル(2K)までの出力画像は 1,120 トークンを消費し、画像あたり $0.134 に相当します。

つまり、この画像生成は、実際には $ 0.134 かかるということです。Google AI Studio上に表示されていた $ 0.001とは、約100倍の誤差が出てしまっています。

  • Google AI Studio上の料金: $ 0.001
  • 実際の料金: $ 0.134

Cloudflare AI Gateway 同様、Google AI Studio上の「推定コスト」を鵜呑みにするのは非常に危険であると言わざるを得ません。

運用のための対策

1. ツールの価格推定を過信しない

特に「思考プロセス(CoT)」や「画像生成」など、新しい機能を持つモデルを利用する場合、ツール側の対応が追いついていない可能性が高いです。表示されている金額はあくまで「参考値(または未対応の数値)」であると認識しましょう。

2. コスト計算は「自前」で

正確なコスト管理が必要なフェーズでは、モニタリングツールの自動集計に頼りきらず、以下の手順を踏むのが安全です。

  • レスポンスに含まれる正確なトークン量(思考トークン含む)を自前で取得する
  • 公式のモデル単価表に基づいて計算するロジックを実装する

まとめ

Cloudflare AI Gatewayをはじめとする生成AIのコストモニタリングツールは非常に便利なサービスですが、最新モデル特有の挙動(思考トークンや特殊な課金体系)への対応にはタイムラグがあるようです。 ツールはあくまで支援的なものと捉え、最終的なコスト計算は慎重に行うこと。この点を念頭において、安全なLLM運用を心がけましょう。

Pocket

CONTACT

お問い合わせ・ご依頼はこちらから