AI Token 比價怎麼做？新手最容易忽略的 5 個成本點

4月10日
讀畢需時 6 分鐘

已更新：4月21日

AI Token 比價與隱藏成本解析：圖解打破只看『表面單價』的迷思，透過天平視覺對比，統整 Output 費、快取費、Batch 折扣、搜尋與工具費等新手最容易忽略的真實 API 總成本陷阱

很多人第一次比較 AI Token 成本時，最常犯的錯就是只看一個數字：每百萬 Token 幾美元。但現在主流平台的價格結構，早就不是只靠這一欄就能看懂。

OpenAI 的官方價格頁同時列出 input、cached input、output、Batch API，以及 web search、containers 等項目；Anthropic 會把標準價格、prompt caching、Batch processing、long context pricing、web search、code execution 分開寫；Google Gemini 也把 input、output、context caching、storage、Grounding with Google Search 等分開列價。

所以，真正實用的比價方式不是問「哪個模型最便宜」，而是問：

我這種用途，最後帳單會由哪些費用組成？

只要這個問題沒有拆開，很多人選到的都只是「看起來便宜」，不是「實際上便宜」。

先講結論：比價要先分成兩層

第一層，是模型本身的 Token 費用，也就是 input、output、cached input 這類成本。第二層，是功能費用，像搜尋、Grounding、工具呼叫、快取儲存、容器執行這些額外項目。

OpenAI、Anthropic、Gemini 的官方定價頁都明顯把這兩層拆開處理。

如果你只看第一層，常常會低估真實帳單；如果你把兩層混在一起，又很容易比較錯模型。對新手來說，最穩的方式就是先把成本拆開，再談便宜不便宜。

成本點 1：只看 input 單價，卻沒看 output 才是真正燒錢的地方

很多平台的 output 單價都明顯高於 input。OpenAI 價格頁可見，GPT-5.4 的標準價格是 input 2.50 美元 / 1M tokens、cached input 0.25、output 15.00；GPT-5.4 mini 是 input 0.75、output 4.50；GPT-5.4 nano 是 input 0.20、output 1.25。

Anthropic 的 Claude Sonnet 4.6、4.5、4 都是 input 3 美元 / MTok、output 15 美元 / MTok；Haiku 4.5 是 input 1、output 5。

這代表如果你的工作是：

長文生成

報告輸出

程式碼產出

客服長回覆

大量展開說明

真正把帳單拉高的，往往不是你送進去多少，而是模型回出來多少。

新手最容易看錯的地方

很多人看到某個模型 input 很便宜，就以為整體會很省。但如果你的任務本來就是 output 很長，那 input 單價再低，也不代表總成本低。

所以比價第一步，不是只看 input，而是要先問：

這個任務最後是 input 重，還是 output 重？

成本點 2：重複內容如果能快取，實際單價可能差非常多

很多人比價時完全忽略 caching，但這其實常常比換模型更有影響。

OpenAI 的價格頁直接列出 cached input，像 GPT-5.4 是 0.25 美元 / 1M，而一般 input 是 2.50，差了 10 倍。

Anthropic 的官方定價頁則寫得更細：5 分鐘快取寫入是 base input 的 1.25 倍，1 小時快取寫入是 2 倍，cache hits / refreshes 則是 0.1 倍。

Gemini 也把 context caching 與 storage price 分開列出，代表你不能只看一般 input / output，就忽略長上下文重用的成本結構。

哪些情況快取特別重要

如果你的流程會反覆帶入同一段內容，例如：

system prompt

品牌規範

產品資料

知識背景

長文件片段

固定角色設定

那真正該比較的，不是裸 input 價格，而是：

這家平台的快取規則對你有沒有利。

同一個模型，在「每次重送整份內容」和「把重複內容快取起來」兩種做法下，最後有效單價可能根本不是同一個等級。

成本點 3：能不能走 Batch，會直接改寫你的比價結果

如果你的任務不是即時聊天，而是：

夜間批量生成

批次分類

離線摘要

報表整理

批量翻譯

資料清理

那 Batch 幾乎一定要算進去。

OpenAI 官方明確寫到：Batch API 可讓 input 和 output 成本各降 50%。Anthropic 官方定價頁也明講：Save 50% with batch processing。

也就是說，很多所謂的「便宜方案」，真正便宜的原因不一定是模型本身，而是你有沒有選對處理模式。

什麼時候只看即時價格會看錯

對高頻、非即時任務來說，只看同步即時價格去比，很可能會錯過真正最省的方案。因為你真正該比較的是：

即時跑的成本

批次跑的成本

哪一種更符合你的工作節奏

成本點 4：搜尋、Grounding、工具費，常常不是算在 Token 單價裡

這是新手最容易漏掉的一段。

OpenAI 的價格頁除了模型本身，還另外列出：

Web search：10 美元 / 1k calls

Containers：獨立計價

而且官方還明寫：Search content tokens are free，代表 search 本身就是一種獨立功能費。

Anthropic 也不是只有 token。官方定價頁明寫：

Web search：10 美元 / 1,000 searches

而且 search content 還會再算進標準 token 成本

Code execution 另外有每月免費額度與超出後的 container hour 計價

Gemini 則把：

Grounding with Google Search

Context caching

Storage price

都獨立列價。

哪些應用最容易忽略這一層

如果你的產品是：

搜尋型助理

RAG 問答

Agent

地圖查詢

多工具流程

那真正拉高帳單的，未必是模型本身，而可能是功能層。只看每百萬 Token 單價，幾乎一定會低估這類應用的真實成本。

成本點 5：長上下文、特殊模式、平台層費用，也都會影響最後價格

有些平台不是所有情況都照標準價算。

OpenAI 官方價格頁明寫，價格反映的是 context lengths under 270K 的標準處理費率，而且 Data residency / Regional Processing 端點會加收 10%。

Anthropic 的定價頁則把 Long context pricing 獨立列成一段，表示長上下文不一定永遠照標準價理解。

Gemini 的定價頁更直接，某些模型對超過 200k tokens 的 prompt 會跳到更高費率，而且 context caching price 與 storage price 也一起變成需要考量的部分。

為什麼這會影響比價

這代表就算模型名稱一樣、官方單價看起來差不多，你的最終成本仍可能因為：

長上下文

區域處理

特殊模式

儲存費

平台層機制

而不同。

所以新手比價時，如果只看首頁一排價格，很容易看錯。

新手最不容易做錯的比價方法

最簡單的做法，是先把自己的任務分成三種。

第一種：高頻標準任務

如果你做的是：

摘要

分類

標題

FAQ

先看：

低價模型

Batch

快取

這種任務通常不需要最強模型，重點是高頻低成本。

第二種：長文與輸出型任務

如果你做的是：

長文

報告

程式碼

長回覆

先看：

output 單價

模型穩定度

是否容易重跑

因為這一類真正燒錢的通常是 output，不是 input。

第三種：搜尋型 / 工具型工作流

如果你做的是：

搜尋型助理

RAG

Agent

Grounding

工具整合

就一定要把：

功能費

長上下文

快取

儲存費

一起算進去。

真正好的比價，不是只抓一個單價排名，而是先問：

我這種任務，最常花錢的是哪一段？

只要這一題先答對，後面就比較不容易選錯。

一句話總結

AI Token 比價不是比誰單價最低，而是比誰在你的任務型態下，總成本最低。

你至少要同時看：

input / output

快取

Batch

功能費

長上下文

特殊模式

必要時還要把平台層費用一起算進去。只看每百萬 Token，通常只看到了表面。

FAQ

AI Token 比價是不是先看每百萬 Token 最低就好？

不夠。現在主流平台的定價結構通常不只 token 單價，還會牽涉到 output、快取、Batch、搜尋、工具與長上下文等費用。

為什麼 output 單價比 input 更值得注意？

因為很多生成型任務真正把帳單拉高的不是你送進去多少，而是模型回出來多少。OpenAI 和 Anthropic 的官方價格頁都能直接看到 output 高於 input。

Prompt caching 真的會影響比價結果嗎？

會。因為重複背景如果能走快取，實際有效單價可能和裸 input 價格差很多。OpenAI 的 cached input 與 Anthropic 的 cache hits 都明確比一般 input 低。

Batch API 什麼時候最有用？

當你的任務不需要即時結果，例如批量摘要、分類、翻譯、資料整理時，Batch 很可能直接改寫你的成本結構。OpenAI 與 Anthropic 都明講 Batch 可省 50%。

搜尋和 grounding 為什麼要另外算？

因為很多平台把它們列為獨立功能費，不是單純的 token 成本。OpenAI 的 web search、Anthropic 的 web search、Gemini 的 grounding 都是這樣。

資料來源與可信度聲明

本文根據主流 AI 平台官方定價頁與官方文件整理撰寫，重點參考以下來源：

OpenAI｜API Pricing

Anthropic｜Pricing

Google AI for Developers｜Gemini API pricing

本文以「模型 token 成本 × 功能層費用 × 實際應用判讀」三個角度整理，目的是幫你建立一套比較 AI Token 價格時不容易看錯的方法。比價真正麻煩的地方，不是找到最低單價，而是看清楚你的任務最後會由哪些費用組成。

比價不只是看誰數字低，而是要先看懂同一單位下的價格結構。想把 AI Token 比價方式 與官方價格頁判讀一次看清楚，可以接著看 AI Token 價格怎麼看。

如果你想繼續往下看其他相關內容，可以直接前往 AI Token。

本篇文章屬於《AI Token 費用》分類。

此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、比價邏輯、平台帳單結構與成本判讀方法，幫助新手、內容創作者、接案者與企業在接觸 AI API 時，不只知道價格表怎麼看，也知道怎麼用更接近真實使用情境的方式比較成本。

延伸閱讀

AI API 價格怎麼看？Token 費用和功能費用要分開

AI Token 價格怎麼看？新手先搞懂費用是怎麼來的

AI Token 計費方式有哪些？不是每家平台都一樣

AI 模型價格比較怎麼看？不是只看每百萬 Token