AI Token 計費方式有哪些?不是每家平台都一樣
- 3月31日
- 讀畢需時 8 分鐘
已更新:4月21日

很多人剛開始接觸 AI API,都以為計費方式很單純:你送進去多少 token,模型回多少 token,最後就照著乘一乘。
這個理解不能說錯,但只對了一半。因為真正的情況是:不同平台雖然都會談 token,但計費邏輯不一定一樣。
有的平台除了 input 和 output,還會另外算 cached input、prompt caching、context caching、Batch 折扣、長上下文門檻、搜尋工具、Grounding、圖片或音訊等多模態單位,甚至同一個模型換到不同平台,最終價格也可能不同。
OpenAI 的 API Pricing 頁把 input、cached input、output 分開列價,還另外列出 Web search、Containers、Batch API 等費用項目;Anthropic 的官方定價頁則把 prompt caching、Batch processing、long context pricing、tool use pricing 拆成獨立章節;Google Gemini 的定價頁也把 input、output、context caching、storage price、Grounding with Google Search 等項目分開說明。
所以如果你是新手,真正該問的不是「哪家最便宜」,而是:這家平台到底是用哪些方式在向你收費?
如果你前面已經看過 AI Token 的基本概念,這篇會幫你把「價格頁怎麼看」再往前推一步,直接看懂不同平台背後的計價結構。
先講結論:AI API 常見的計費方式,不只一種
現在主流平台常見的計費方式,大致可以分成幾類:
最基本的 input token / output token
cached input 或 prompt caching
Batch 非同步折扣
長上下文或超大 prompt 的特殊定價
搜尋、Grounding、工具調用的額外費用
圖片、音訊、影片等多模態的不同單位計價
區域、方案、第三方雲平台帶來的價格差異
也就是說,就算兩家都叫「AI 模型 API」,最後帳單長得也可能完全不同。這正是 OpenAI、Anthropic、Google 官方定價頁現在共同呈現出的現況。
最基本的一種:Input Token 和 Output Token 分開計價
這是最常見、也是大多數新手最先接觸到的模式。
OpenAI 的 API Pricing 頁很清楚,像 GPT-5.4 mini 與 GPT-5.4 nano 都把價格拆成三欄:Input、Cached input、Output。
GPT-5.4 mini 的 input 是每 1M tokens 0.75 美元,cached input 是每 1M tokens 0.075 美元,output 是每 1M tokens 4.50 美元。
Google Gemini 的官方定價頁也是分開列 input 與 output,而且某些模型還直接標註「Output price including thinking tokens」,表示平台連思考型輸出也明確算在 output 成本裡。
像 Gemini 2.5 Pro 某區段就寫到:prompts 小於等於 200k tokens 時,input 是 0.625 美元,output 是 5 美元;超過 200k tokens 之後,input 與 output 價格都往上跳。
這裡最重要的觀念很簡單:不是只有你送進去多少在花錢,模型回給你多少也在花錢。
第二種:把重複內容拆成快取計價
很多人以為 prompt 只是一次次重新送進去重新算,但現在有些平台會把「重複使用的內容」拆出來單獨計費。
OpenAI 的價格頁直接列出 cached input,而且價格通常遠低於一般 input。以 GPT-5.4 為例,input 是每 1M tokens 2.50 美元,cached input 是每 1M tokens 0.25 美元。
Anthropic 也有類似概念,但它不叫 cached input,而叫 prompt caching。官方文件明確寫到,cache write tokens 是內容第一次被寫入快取時收費,cache read tokens 是後續請求讀取該快取內容時收費,而且 cache hit 的讀取成本約為標準 input 價格的 10%。Anthropic 也特別說明,這些 multipliers 還可以和 Batch API discount、data residency 等其他價格修飾一起疊加。
Google Gemini 則更進一步,不只列出 context caching price,還另外列出 storage price。官方頁面可直接看到 context caching price 之外,還有每百萬 token 每小時的 storage price,例如某些模型列出 1.00 美元 / 1,000,000 tokens per hour 的 storage price。
所以同樣都是「快取」,三家主流平台的呈現方式就已經不一樣:有的是 cached input,有的是 prompt caching,有的是 context caching 加 storage。這就是為什麼你不能只看模型單價,不看平台計價結構。
第三種:Batch 非同步折扣
如果你的工作不是即時互動,而是可以延後完成的批次任務,有些平台會給很明顯的折扣。
OpenAI 官方價格頁直接寫明:Batch API 可節省 50% 的 input 與 output 成本,條件是任務改成非同步,在 24 小時內完成。
Anthropic 官方文件也把 Batch processing 獨立列成定價章節,並且明講 prompt caching 的乘數可以和 Batch API discount 疊加。這代表如果你的工作流設計得好,實際成本可能和即時呼叫差很多。
對企業來說,這一類差異很重要。如果你的任務本來就不是即時客服,而是夜間分類、批次摘要、報表生成,那錯過 Batch,就等於直接錯過一整段成本優化空間。這是根據 OpenAI 和 Anthropic 官方對 Batch pricing 的說明所做的直接實務推論。
第四種:長上下文不一定永遠照原價算
這一點很多新手最容易忽略,但也最容易爆帳單。
Google Gemini 的官方定價頁就直接寫出:某些模型在 prompts 超過 200k tokens 之後,input、output,甚至 context caching 的價格都會往上跳。
像 Gemini 2.5 Pro 的某個價格段落,prompts 小於等於 200k tokens 時 input 是 0.625 美元、output 是 5 美元;超過 200k tokens 後 input 變成 1.25 美元、output 變成 7.50 美元,context caching 也一起變貴。
Anthropic 的作法則是另一種。官方文件寫明,Claude Opus 4.6 和 Sonnet 4.6 的完整 1M token context window 目前是在標準價格下提供,並且 prompt caching 與 batch processing discounts 也能套用在完整 context window 上。換句話說,Anthropic 在這個版本的長上下文策略,和 Google 的門檻跳價邏輯並不一樣。
OpenAI 則在價格頁直接註明:頁面上列出的標準費率,反映的是 context lengths under 270K 的標準處理費率。這表示平台本身也有在價格敘述裡把上下文長度放進去。
所以「模型支援長上下文」這件事,本身不是免費福利。有的平台是到門檻後跳費率,有的平台是完整長上下文仍採標準價,有的平台則先說明標準費率適用在哪個範圍。支援長上下文,不等於長上下文永遠照原價算。
第五種:搜尋、Grounding、工具調用常常是另外一筆
很多使用者一開始只盯著 token 單價,卻忽略了現在很多 AI 平台都支援工具調用,而工具常常不只算 token。
OpenAI 的價格頁就直接列出 Web search 是 10 美元 / 1,000 calls,同時又寫明 search content tokens are free。這代表 OpenAI 的搜尋工具是按 call 收費,而不是只按 token。
Anthropic 的工具定價更細。官方文件寫到,Web search usage is charged in addition to token usage,價格是 10 美元 / 1,000 searches,而且搜尋結果產生的內容還會再算進標準 token 成本。
Google Gemini 也不是只看 token。官方價格頁列出 Grounding with Google Search,不同模型有不同免費額度,之後多數是 35 美元 / 1,000 grounded prompts。頁面同時也明確列出 Grounding with Google Maps 等額外項目。
所以如果你的應用是搜尋型助理、RAG、地圖型助理、會大量調工具的 agent,真正的帳單很可能不是單純的 input / output,而是 token 加 tool fee 的組合。
第六種:不同模態,不一定用同一種單位計價
不是所有 AI 內容都一定只用文字 token 計價。
OpenAI 的官方價格頁很典型。GPT-realtime-1.5 把 Audio、Text、Image 分開列價;GPT-image-1.5 也同時列出 image input / cached input / output,以及 text input / cached input / output;而某些產品例如 Sora 則是直接按其他單位計價,不再只是文字 token。
Google Gemini 的定價頁也同樣是多單位。
它除了文字 token 外,還把 text、image、audio、video 的輸入價格分開列,有些項目甚至另外給出每張圖、每秒音訊、每 frame 影片的換算說法。
所以你在看價格時,不能只問「一百萬 token 多少錢」,還要先問:這個功能到底是按 token、按次數、按時間,還是按每張圖、每秒音訊在算?
第七種:同一個模型,換平台也可能不是同一個價
這一點對企業尤其重要。
Anthropic 官方文件直接列出 Claude 也可以在第三方平台上使用,例如 Amazon Bedrock、Google Cloud Vertex AI。這等於明講:同一個 Claude 模型名稱,不保證在每個平台的最終價格都一樣。
OpenAI 也有類似的端點差異。官方價格頁寫明,對 2026 年 3 月 5 日後發布的模型,如果使用 Data residency and Regional Processing 端點,會額外加收 10%。也就是說,就算是同一個模型,光是部署與處理區域不同,帳單就可能不同。
Google Gemini 則在同一張價格頁上同時列出 Free Tier 與 Paid Tier,而且還顯示 Used to improve our products 在免費與付費方案上的差異。這再次說明:平台不只是模型不同,方案層級本身也會改變你的成本與使用條件。
所以,新手到底該怎麼看 AI API 價格
最簡單的方式,不是只看首頁那個模型單價,而是先把下面幾件事看清楚:
第一,看它是不是只算 input 和 output,還是另外有 cached input、prompt caching 或 context caching。
第二,看它有沒有 Batch 折扣。
第三,看長上下文會不會跳費率。
第四,看搜尋、Grounding、工具調用會不會另外收費。
第五,看圖片、音訊、影片是不是改用別的單位計價。
第六,看是不是不同端點、不同雲平台、不同方案就有不同價格。
如果你只看「這模型 input 一百萬 token 幾塊錢」,很可能只看到帳單的一小部分。
一句話總結
如果你只想先記住一句最重要的話,那就是:
AI Token 計費方式不是每家都一樣。
有的平台重點是 input / output。有的平台會把快取拆出來單獨計價。有的平台鼓勵你走 Batch。有的平台對長上下文、搜尋工具、多模態內容另設價格。還有的平台會因為區域、方案或第三方雲平台而出現不同最終價格。
所以不管你是新手、進階使用者,還是企業評估導入 AI,真正該學會的不是只比較誰最便宜,而是先看懂:這家平台到底用什麼方式向你收費。
常見問題 FAQ
AI Token 計費方式是不是都只有 input 和 output?
不是。除了 input / output,很多平台還會另外列 cached input、prompt caching、context caching、Batch、Grounding、搜尋工具等額外費用。
Batch API 真的比較便宜嗎?
很多情況下是。OpenAI 官方明確寫明 Batch API 可節省 50% 的 input 與 output 成本;Anthropic 也把 Batch discount 當成正式的價格修飾機制。
長上下文一定比較貴嗎?
不一定每家都一樣。Google 某些 Gemini 模型在 prompts 超過 200k tokens 後價格會上升;Anthropic 的 Claude Opus 4.6 與 Sonnet 4.6 則是完整 1M token context window 維持標準價。
搜尋工具費是不是也算在 token 裡?
不一定。OpenAI 和 Anthropic 的官方頁面都把 Web search 寫成另外按 call 或按 search 收費,同時又可能再加上 token 成本;Google 的 Grounding with Google Search 也是獨立項目。
同一個模型在不同平台會同價嗎?
不一定。Anthropic 官方直接指出 Claude 也能在 Bedrock 和 Vertex AI 上使用;OpenAI 也寫明 Regional Processing 端點會加收 10%。
資料來源與可信度聲明
本文根據主流 AI 平台的官方定價頁與官方文件整理撰寫,重點參考以下來源:
本文以「計價結構 × 平台差異 × 成本判讀」三個角度整理,目的不是只幫你背價格,而是幫你建立一套看到任何 AI API 定價頁都能先拆解的判讀方式。你原稿的核心就是這條線,我這版只是把內容收斂成更完整、可直接上站的費用型文章。
看懂不同 AI Token 計費方式 之後,下一步就是把各家模型與平台的費率放到同一基準比較。你可以接著看 AI Token 價格怎麼看。
看完這篇後,想延伸閱讀更多相關主題,可以直接前往 AI Token。
本篇文章屬於《AI Token 費用》分類
此分類主要整理 AI Token 價格、AI Token 費用、AI 模型計價方式、平台計費結構、成本優化邏輯與預算觀念,特別適合剛開始接觸 AI API、模型平台與企業採購評估的讀者閱讀。很多人一開始看價格頁,只會比較表面單價,但真正會影響帳單的,往往是 input、output、快取、Batch、長上下文、工具調用與多模態計價的整體組合。




留言