AI Token 比價怎麼做?新手最容易忽略的 5 個成本點
- 2天前
- 讀畢需時 6 分鐘

很多人第一次比較 AI Token 成本時,最常犯的錯就是只看一個數字:每百萬 Token 幾美元。但現在主流平台的價格結構,早就不是只靠這一欄就能看懂。
OpenAI 的官方價格頁同時列出 input、cached input、output、Batch API,以及 web search、containers 等項目;Anthropic 會把標準價格、prompt caching、Batch processing、long context pricing、web search、code execution 分開寫;Google Gemini 也把 input、output、context caching、storage、Grounding with Google Search 等分開列價。
所以,真正實用的比價方式不是問「哪個模型最便宜」,而是問:
我這種用途,最後帳單會由哪些費用組成?
只要這個問題沒有拆開,很多人選到的都只是「看起來便宜」,不是「實際上便宜」。
先講結論:比價要先分成兩層
第一層,是模型本身的 Token 費用,也就是 input、output、cached input 這類成本。第二層,是功能費用,像搜尋、Grounding、工具呼叫、快取儲存、容器執行這些額外項目。
OpenAI、Anthropic、Gemini 的官方定價頁都明顯把這兩層拆開處理。
如果你只看第一層,常常會低估真實帳單;如果你把兩層混在一起,又很容易比較錯模型。對新手來說,最穩的方式就是先把成本拆開,再談便宜不便宜。
成本點 1:只看 input 單價,卻沒看 output 才是真正燒錢的地方
很多平台的 output 單價都明顯高於 input。OpenAI 價格頁可見,GPT-5.4 的標準價格是 input 2.50 美元 / 1M tokens、cached input 0.25、output 15.00;GPT-5.4 mini 是 input 0.75、output 4.50;GPT-5.4 nano 是 input 0.20、output 1.25。
Anthropic 的 Claude Sonnet 4.6、4.5、4 都是 input 3 美元 / MTok、output 15 美元 / MTok;Haiku 4.5 是 input 1、output 5。
這代表如果你的工作是:
長文生成
報告輸出
程式碼產出
客服長回覆
大量展開說明
真正把帳單拉高的,往往不是你送進去多少,而是模型回出來多少。
新手最容易看錯的地方
很多人看到某個模型 input 很便宜,就以為整體會很省。但如果你的任務本來就是 output 很長,那 input 單價再低,也不代表總成本低。
所以比價第一步,不是只看 input,而是要先問:
這個任務最後是 input 重,還是 output 重?
成本點 2:重複內容如果能快取,實際單價可能差非常多
很多人比價時完全忽略 caching,但這其實常常比換模型更有影響。
OpenAI 的價格頁直接列出 cached input,像 GPT-5.4 是 0.25 美元 / 1M,而一般 input 是 2.50,差了 10 倍。
Anthropic 的官方定價頁則寫得更細:5 分鐘快取寫入是 base input 的 1.25 倍,1 小時快取寫入是 2 倍,cache hits / refreshes 則是 0.1 倍。
Gemini 也把 context caching 與 storage price 分開列出,代表你不能只看一般 input / output,就忽略長上下文重用的成本結構。
哪些情況快取特別重要
如果你的流程會反覆帶入同一段內容,例如:
system prompt
品牌規範
產品資料
知識背景
長文件片段
固定角色設定
那真正該比較的,不是裸 input 價格,而是:
這家平台的快取規則對你有沒有利。
同一個模型,在「每次重送整份內容」和「把重複內容快取起來」兩種做法下,最後有效單價可能根本不是同一個等級。
成本點 3:能不能走 Batch,會直接改寫你的比價結果
如果你的任務不是即時聊天,而是:
夜間批量生成
批次分類
離線摘要
報表整理
批量翻譯
資料清理
那 Batch 幾乎一定要算進去。
OpenAI 官方明確寫到:Batch API 可讓 input 和 output 成本各降 50%。Anthropic 官方定價頁也明講:Save 50% with batch processing。
也就是說,很多所謂的「便宜方案」,真正便宜的原因不一定是模型本身,而是你有沒有選對處理模式。
什麼時候只看即時價格會看錯
對高頻、非即時任務來說,只看同步即時價格去比,很可能會錯過真正最省的方案。因為你真正該比較的是:
即時跑的成本
批次跑的成本
哪一種更符合你的工作節奏
成本點 4:搜尋、Grounding、工具費,常常不是算在 Token 單價裡
這是新手最容易漏掉的一段。
OpenAI 的價格頁除了模型本身,還另外列出:
Web search:10 美元 / 1k calls
Containers:獨立計價
而且官方還明寫:Search content tokens are free,代表 search 本身就是一種獨立功能費。
Anthropic 也不是只有 token。官方定價頁明寫:
Web search:10 美元 / 1,000 searches
而且 search content 還會再算進標準 token 成本
Code execution 另外有每月免費額度與超出後的 container hour 計價
Gemini 則把:
Grounding with Google Search
Context caching
Storage price
都獨立列價。
哪些應用最容易忽略這一層
如果你的產品是:
搜尋型助理
RAG 問答
Agent
地圖查詢
多工具流程
那真正拉高帳單的,未必是模型本身,而可能是功能層。只看每百萬 Token 單價,幾乎一定會低估這類應用的真實成本。
成本點 5:長上下文、特殊模式、平台層費用,也都會影響最後價格
有些平台不是所有情況都照標準價算。
OpenAI 官方價格頁明寫,價格反映的是 context lengths under 270K 的標準處理費率,而且 Data residency / Regional Processing 端點會加收 10%。
Anthropic 的定價頁則把 Long context pricing 獨立列成一段,表示長上下文不一定永遠照標準價理解。
Gemini 的定價頁更直接,某些模型對超過 200k tokens 的 prompt 會跳到更高費率,而且 context caching price 與 storage price 也一起變成需要考量的部分。
為什麼這會影響比價
這代表就算模型名稱一樣、官方單價看起來差不多,你的最終成本仍可能因為:
長上下文
區域處理
特殊模式
儲存費
平台層機制
而不同。
所以新手比價時,如果只看首頁一排價格,很容易看錯。
新手最不容易做錯的比價方法
最簡單的做法,是先把自己的任務分成三種。
第一種:高頻標準任務
如果你做的是:
摘要
分類
標題
FAQ
先看:
低價模型
Batch
快取
這種任務通常不需要最強模型,重點是高頻低成本。
第二種:長文與輸出型任務
如果你做的是:
長文
報告
程式碼
長回覆
先看:
output 單價
模型穩定度
是否容易重跑
因為這一類真正燒錢的通常是 output,不是 input。
第三種:搜尋型 / 工具型工作流
如果你做的是:
搜尋型助理
RAG
Agent
Grounding
工具整合
就一定要把:
功能費
長上下文
快取
儲存費
一起算進去。
真正好的比價,不是只抓一個單價排名,而是先問:
我這種任務,最常花錢的是哪一段?
只要這一題先答對,後面就比較不容易選錯。
一句話總結
AI Token 比價不是比誰單價最低,而是比誰在你的任務型態下,總成本最低。
你至少要同時看:
input / output
快取
Batch
功能費
長上下文
特殊模式
必要時還要把平台層費用一起算進去。只看每百萬 Token,通常只看到了表面。
FAQ
AI Token 比價是不是先看每百萬 Token 最低就好?
不夠。現在主流平台的定價結構通常不只 token 單價,還會牽涉到 output、快取、Batch、搜尋、工具與長上下文等費用。
為什麼 output 單價比 input 更值得注意?
因為很多生成型任務真正把帳單拉高的不是你送進去多少,而是模型回出來多少。OpenAI 和 Anthropic 的官方價格頁都能直接看到 output 高於 input。
Prompt caching 真的會影響比價結果嗎?
會。因為重複背景如果能走快取,實際有效單價可能和裸 input 價格差很多。OpenAI 的 cached input 與 Anthropic 的 cache hits 都明確比一般 input 低。
Batch API 什麼時候最有用?
當你的任務不需要即時結果,例如批量摘要、分類、翻譯、資料整理時,Batch 很可能直接改寫你的成本結構。OpenAI 與 Anthropic 都明講 Batch 可省 50%。
搜尋和 grounding 為什麼要另外算?
因為很多平台把它們列為獨立功能費,不是單純的 token 成本。OpenAI 的 web search、Anthropic 的 web search、Gemini 的 grounding 都是這樣。
資料來源與可信度聲明
本文根據主流 AI 平台官方定價頁與官方文件整理撰寫,重點參考以下來源:
本文以「模型 token 成本 × 功能層費用 × 實際應用判讀」三個角度整理,目的是幫你建立一套比較 AI Token 價格時不容易看錯的方法。比價真正麻煩的地方,不是找到最低單價,而是看清楚你的任務最後會由哪些費用組成。
如果你想繼續往下看其他相關內容,可以直接前往 AI Token。
本篇文章屬於《AI Token 費用》分類。
此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、比價邏輯、平台帳單結構與成本判讀方法,幫助新手、內容創作者、接案者與企業在接觸 AI API 時,不只知道價格表怎麼看,也知道怎麼用更接近真實使用情境的方式比較成本。



留言