AI Token 計費方式有哪些？不是每家平台都一樣

3月31日
讀畢需時 8 分鐘

已更新：4月21日

AI Token 多元計費方式與總成本結構解析：圖解除了基礎的 Input 與 Output 計費外，包含快取、批次折扣、長上下文、搜尋工具、多模態及區域方案等 6 大進階變數如何影響 API 最終定價

很多人剛開始接觸 AI API，都以為計費方式很單純：你送進去多少 token，模型回多少 token，最後就照著乘一乘。

這個理解不能說錯，但只對了一半。因為真正的情況是：不同平台雖然都會談 token，但計費邏輯不一定一樣。

有的平台除了 input 和 output，還會另外算 cached input、prompt caching、context caching、Batch 折扣、長上下文門檻、搜尋工具、Grounding、圖片或音訊等多模態單位，甚至同一個模型換到不同平台，最終價格也可能不同。

OpenAI 的 API Pricing 頁把 input、cached input、output 分開列價，還另外列出 Web search、Containers、Batch API 等費用項目；Anthropic 的官方定價頁則把 prompt caching、Batch processing、long context pricing、tool use pricing 拆成獨立章節；Google Gemini 的定價頁也把 input、output、context caching、storage price、Grounding with Google Search 等項目分開說明。

所以如果你是新手，真正該問的不是「哪家最便宜」，而是：這家平台到底是用哪些方式在向你收費？

如果你前面已經看過 AI Token 的基本概念，這篇會幫你把「價格頁怎麼看」再往前推一步，直接看懂不同平台背後的計價結構。

先講結論：AI API 常見的計費方式，不只一種

現在主流平台常見的計費方式，大致可以分成幾類：

最基本的 input token / output token

cached input 或 prompt caching

Batch 非同步折扣

長上下文或超大 prompt 的特殊定價

搜尋、Grounding、工具調用的額外費用

圖片、音訊、影片等多模態的不同單位計價

區域、方案、第三方雲平台帶來的價格差異

也就是說，就算兩家都叫「AI 模型 API」，最後帳單長得也可能完全不同。這正是 OpenAI、Anthropic、Google 官方定價頁現在共同呈現出的現況。

最基本的一種：Input Token 和 Output Token 分開計價

這是最常見、也是大多數新手最先接觸到的模式。

OpenAI 的 API Pricing 頁很清楚，像 GPT-5.4 mini 與 GPT-5.4 nano 都把價格拆成三欄：Input、Cached input、Output。

GPT-5.4 mini 的 input 是每 1M tokens 0.75 美元，cached input 是每 1M tokens 0.075 美元，output 是每 1M tokens 4.50 美元。

Google Gemini 的官方定價頁也是分開列 input 與 output，而且某些模型還直接標註「Output price including thinking tokens」，表示平台連思考型輸出也明確算在 output 成本裡。

像 Gemini 2.5 Pro 某區段就寫到：prompts 小於等於 200k tokens 時，input 是 0.625 美元，output 是 5 美元；超過 200k tokens 之後，input 與 output 價格都往上跳。

這裡最重要的觀念很簡單：不是只有你送進去多少在花錢，模型回給你多少也在花錢。

第二種：把重複內容拆成快取計價

很多人以為 prompt 只是一次次重新送進去重新算，但現在有些平台會把「重複使用的內容」拆出來單獨計費。

OpenAI 的價格頁直接列出 cached input，而且價格通常遠低於一般 input。以 GPT-5.4 為例，input 是每 1M tokens 2.50 美元，cached input 是每 1M tokens 0.25 美元。

Anthropic 也有類似概念，但它不叫 cached input，而叫 prompt caching。官方文件明確寫到，cache write tokens 是內容第一次被寫入快取時收費，cache read tokens 是後續請求讀取該快取內容時收費，而且 cache hit 的讀取成本約為標準 input 價格的 10%。Anthropic 也特別說明，這些 multipliers 還可以和 Batch API discount、data residency 等其他價格修飾一起疊加。

Google Gemini 則更進一步，不只列出 context caching price，還另外列出 storage price。官方頁面可直接看到 context caching price 之外，還有每百萬 token 每小時的 storage price，例如某些模型列出 1.00 美元 / 1,000,000 tokens per hour 的 storage price。

所以同樣都是「快取」，三家主流平台的呈現方式就已經不一樣：有的是 cached input，有的是 prompt caching，有的是 context caching 加 storage。這就是為什麼你不能只看模型單價，不看平台計價結構。

第三種：Batch 非同步折扣

如果你的工作不是即時互動，而是可以延後完成的批次任務，有些平台會給很明顯的折扣。

OpenAI 官方價格頁直接寫明：Batch API 可節省 50% 的 input 與 output 成本，條件是任務改成非同步，在 24 小時內完成。

Anthropic 官方文件也把 Batch processing 獨立列成定價章節，並且明講 prompt caching 的乘數可以和 Batch API discount 疊加。這代表如果你的工作流設計得好，實際成本可能和即時呼叫差很多。

對企業來說，這一類差異很重要。如果你的任務本來就不是即時客服，而是夜間分類、批次摘要、報表生成，那錯過 Batch，就等於直接錯過一整段成本優化空間。這是根據 OpenAI 和 Anthropic 官方對 Batch pricing 的說明所做的直接實務推論。

第四種：長上下文不一定永遠照原價算

這一點很多新手最容易忽略，但也最容易爆帳單。

Google Gemini 的官方定價頁就直接寫出：某些模型在 prompts 超過 200k tokens 之後，input、output，甚至 context caching 的價格都會往上跳。

像 Gemini 2.5 Pro 的某個價格段落，prompts 小於等於 200k tokens 時 input 是 0.625 美元、output 是 5 美元；超過 200k tokens 後 input 變成 1.25 美元、output 變成 7.50 美元，context caching 也一起變貴。

Anthropic 的作法則是另一種。官方文件寫明，Claude Opus 4.6 和 Sonnet 4.6 的完整 1M token context window 目前是在標準價格下提供，並且 prompt caching 與 batch processing discounts 也能套用在完整 context window 上。換句話說，Anthropic 在這個版本的長上下文策略，和 Google 的門檻跳價邏輯並不一樣。

OpenAI 則在價格頁直接註明：頁面上列出的標準費率，反映的是 context lengths under 270K 的標準處理費率。這表示平台本身也有在價格敘述裡把上下文長度放進去。

所以「模型支援長上下文」這件事，本身不是免費福利。有的平台是到門檻後跳費率，有的平台是完整長上下文仍採標準價，有的平台則先說明標準費率適用在哪個範圍。支援長上下文，不等於長上下文永遠照原價算。

第五種：搜尋、Grounding、工具調用常常是另外一筆

很多使用者一開始只盯著 token 單價，卻忽略了現在很多 AI 平台都支援工具調用，而工具常常不只算 token。

OpenAI 的價格頁就直接列出 Web search 是 10 美元 / 1,000 calls，同時又寫明 search content tokens are free。這代表 OpenAI 的搜尋工具是按 call 收費，而不是只按 token。

Anthropic 的工具定價更細。官方文件寫到，Web search usage is charged in addition to token usage，價格是 10 美元 / 1,000 searches，而且搜尋結果產生的內容還會再算進標準 token 成本。

Google Gemini 也不是只看 token。官方價格頁列出 Grounding with Google Search，不同模型有不同免費額度，之後多數是 35 美元 / 1,000 grounded prompts。頁面同時也明確列出 Grounding with Google Maps 等額外項目。

所以如果你的應用是搜尋型助理、RAG、地圖型助理、會大量調工具的 agent，真正的帳單很可能不是單純的 input / output，而是 token 加 tool fee 的組合。

第六種：不同模態，不一定用同一種單位計價

不是所有 AI 內容都一定只用文字 token 計價。

OpenAI 的官方價格頁很典型。GPT-realtime-1.5 把 Audio、Text、Image 分開列價；GPT-image-1.5 也同時列出 image input / cached input / output，以及 text input / cached input / output；而某些產品例如 Sora 則是直接按其他單位計價，不再只是文字 token。

Google Gemini 的定價頁也同樣是多單位。

它除了文字 token 外，還把 text、image、audio、video 的輸入價格分開列，有些項目甚至另外給出每張圖、每秒音訊、每 frame 影片的換算說法。

所以你在看價格時，不能只問「一百萬 token 多少錢」，還要先問：這個功能到底是按 token、按次數、按時間，還是按每張圖、每秒音訊在算？

第七種：同一個模型，換平台也可能不是同一個價

這一點對企業尤其重要。

Anthropic 官方文件直接列出 Claude 也可以在第三方平台上使用，例如 Amazon Bedrock、Google Cloud Vertex AI。這等於明講：同一個 Claude 模型名稱，不保證在每個平台的最終價格都一樣。

OpenAI 也有類似的端點差異。官方價格頁寫明，對 2026 年 3 月 5 日後發布的模型，如果使用 Data residency and Regional Processing 端點，會額外加收 10%。也就是說，就算是同一個模型，光是部署與處理區域不同，帳單就可能不同。

Google Gemini 則在同一張價格頁上同時列出 Free Tier 與 Paid Tier，而且還顯示 Used to improve our products 在免費與付費方案上的差異。這再次說明：平台不只是模型不同，方案層級本身也會改變你的成本與使用條件。

所以，新手到底該怎麼看 AI API 價格

最簡單的方式，不是只看首頁那個模型單價，而是先把下面幾件事看清楚：

第一，看它是不是只算 input 和 output，還是另外有 cached input、prompt caching 或 context caching。

第二，看它有沒有 Batch 折扣。

第三，看長上下文會不會跳費率。

第四，看搜尋、Grounding、工具調用會不會另外收費。

第五，看圖片、音訊、影片是不是改用別的單位計價。

第六，看是不是不同端點、不同雲平台、不同方案就有不同價格。

如果你只看「這模型 input 一百萬 token 幾塊錢」，很可能只看到帳單的一小部分。

一句話總結

如果你只想先記住一句最重要的話，那就是：

AI Token 計費方式不是每家都一樣。

有的平台重點是 input / output。有的平台會把快取拆出來單獨計價。有的平台鼓勵你走 Batch。有的平台對長上下文、搜尋工具、多模態內容另設價格。還有的平台會因為區域、方案或第三方雲平台而出現不同最終價格。

所以不管你是新手、進階使用者，還是企業評估導入 AI，真正該學會的不是只比較誰最便宜，而是先看懂：這家平台到底用什麼方式向你收費。

常見問題 FAQ

AI Token 計費方式是不是都只有 input 和 output？

不是。除了 input / output，很多平台還會另外列 cached input、prompt caching、context caching、Batch、Grounding、搜尋工具等額外費用。

Batch API 真的比較便宜嗎？

很多情況下是。OpenAI 官方明確寫明 Batch API 可節省 50% 的 input 與 output 成本；Anthropic 也把 Batch discount 當成正式的價格修飾機制。

長上下文一定比較貴嗎？

不一定每家都一樣。Google 某些 Gemini 模型在 prompts 超過 200k tokens 後價格會上升；Anthropic 的 Claude Opus 4.6 與 Sonnet 4.6 則是完整 1M token context window 維持標準價。

搜尋工具費是不是也算在 token 裡？

不一定。OpenAI 和 Anthropic 的官方頁面都把 Web search 寫成另外按 call 或按 search 收費，同時又可能再加上 token 成本；Google 的 Grounding with Google Search 也是獨立項目。

同一個模型在不同平台會同價嗎？

不一定。Anthropic 官方直接指出 Claude 也能在 Bedrock 和 Vertex AI 上使用；OpenAI 也寫明 Regional Processing 端點會加收 10%。

資料來源與可信度聲明

本文根據主流 AI 平台的官方定價頁與官方文件整理撰寫，重點參考以下來源：

OpenAI｜API Pricing

Anthropic｜Pricing

Google AI for Developers｜Gemini API pricing

本文以「計價結構 × 平台差異 × 成本判讀」三個角度整理，目的不是只幫你背價格，而是幫你建立一套看到任何 AI API 定價頁都能先拆解的判讀方式。你原稿的核心就是這條線，我這版只是把內容收斂成更完整、可直接上站的費用型文章。

看懂不同 AI Token 計費方式 之後，下一步就是把各家模型與平台的費率放到同一基準比較。你可以接著看 AI Token 價格怎麼看。

看完這篇後，想延伸閱讀更多相關主題，可以直接前往 AI Token。

本篇文章屬於《AI Token 費用》分類

此分類主要整理 AI Token 價格、AI Token 費用、AI 模型計價方式、平台計費結構、成本優化邏輯與預算觀念，特別適合剛開始接觸 AI API、模型平台與企業採購評估的讀者閱讀。很多人一開始看價格頁，只會比較表面單價，但真正會影響帳單的，往往是 input、output、快取、Batch、長上下文、工具調用與多模態計價的整體組合。

延伸閱讀

AI Token 價格怎麼看？新手先搞懂費用是怎麼來的

AI Token 跟點數差在哪？不是每個平台都用同一套算法

AI Token 平台怎麼選？新手先分清楚原廠、聚合、代理