top of page

AI Token 比價怎麼做?新手最容易忽略的 5 個成本點

  • 2天前
  • 讀畢需時 6 分鐘
AI Token 比價與隱藏成本解析:圖解打破只看『表面單價』的迷思,透過天平視覺對比,統整 Output 費、快取費、Batch 折扣、搜尋與工具費等新手最容易忽略的真實 API 總成本陷阱

很多人第一次比較 AI Token 成本時,最常犯的錯就是只看一個數字:每百萬 Token 幾美元。但現在主流平台的價格結構,早就不是只靠這一欄就能看懂。


OpenAI 的官方價格頁同時列出 input、cached input、output、Batch API,以及 web search、containers 等項目;Anthropic 會把標準價格、prompt caching、Batch processing、long context pricing、web search、code execution 分開寫;Google Gemini 也把 input、output、context caching、storage、Grounding with Google Search 等分開列價。


所以,真正實用的比價方式不是問「哪個模型最便宜」,而是問:

我這種用途,最後帳單會由哪些費用組成?

只要這個問題沒有拆開,很多人選到的都只是「看起來便宜」,不是「實際上便宜」。


先講結論:比價要先分成兩層

第一層,是模型本身的 Token 費用,也就是 input、output、cached input 這類成本。第二層,是功能費用,像搜尋、Grounding、工具呼叫、快取儲存、容器執行這些額外項目。

OpenAI、Anthropic、Gemini 的官方定價頁都明顯把這兩層拆開處理。


如果你只看第一層,常常會低估真實帳單;如果你把兩層混在一起,又很容易比較錯模型。對新手來說,最穩的方式就是先把成本拆開,再談便宜不便宜。


成本點 1:只看 input 單價,卻沒看 output 才是真正燒錢的地方

很多平台的 output 單價都明顯高於 input。OpenAI 價格頁可見,GPT-5.4 的標準價格是 input 2.50 美元 / 1M tokens、cached input 0.25、output 15.00;GPT-5.4 mini 是 input 0.75、output 4.50;GPT-5.4 nano 是 input 0.20、output 1.25。


Anthropic 的 Claude Sonnet 4.6、4.5、4 都是 input 3 美元 / MTok、output 15 美元 / MTok;Haiku 4.5 是 input 1、output 5。


這代表如果你的工作是:

長文生成

報告輸出

程式碼產出

客服長回覆

大量展開說明


真正把帳單拉高的,往往不是你送進去多少,而是模型回出來多少。


新手最容易看錯的地方

很多人看到某個模型 input 很便宜,就以為整體會很省。但如果你的任務本來就是 output 很長,那 input 單價再低,也不代表總成本低。


所以比價第一步,不是只看 input,而是要先問:

這個任務最後是 input 重,還是 output 重?


成本點 2:重複內容如果能快取,實際單價可能差非常多

很多人比價時完全忽略 caching,但這其實常常比換模型更有影響。

OpenAI 的價格頁直接列出 cached input,像 GPT-5.4 是 0.25 美元 / 1M,而一般 input 是 2.50,差了 10 倍。


Anthropic 的官方定價頁則寫得更細:5 分鐘快取寫入是 base input 的 1.25 倍,1 小時快取寫入是 2 倍,cache hits / refreshes 則是 0.1 倍。

Gemini 也把 context caching 與 storage price 分開列出,代表你不能只看一般 input / output,就忽略長上下文重用的成本結構。


哪些情況快取特別重要

如果你的流程會反覆帶入同一段內容,例如:

system prompt

品牌規範

產品資料

知識背景

長文件片段

固定角色設定


那真正該比較的,不是裸 input 價格,而是:

這家平台的快取規則對你有沒有利。

同一個模型,在「每次重送整份內容」和「把重複內容快取起來」兩種做法下,最後有效單價可能根本不是同一個等級。


成本點 3:能不能走 Batch,會直接改寫你的比價結果

如果你的任務不是即時聊天,而是:

夜間批量生成

批次分類

離線摘要

報表整理

批量翻譯

資料清理


那 Batch 幾乎一定要算進去。

OpenAI 官方明確寫到:Batch API 可讓 input 和 output 成本各降 50%。Anthropic 官方定價頁也明講:Save 50% with batch processing

也就是說,很多所謂的「便宜方案」,真正便宜的原因不一定是模型本身,而是你有沒有選對處理模式。


什麼時候只看即時價格會看錯

對高頻、非即時任務來說,只看同步即時價格去比,很可能會錯過真正最省的方案。因為你真正該比較的是:

即時跑的成本

批次跑的成本

哪一種更符合你的工作節奏


成本點 4:搜尋、Grounding、工具費,常常不是算在 Token 單價裡

這是新手最容易漏掉的一段。

OpenAI 的價格頁除了模型本身,還另外列出:

Web search:10 美元 / 1k calls

Containers:獨立計價


而且官方還明寫:Search content tokens are free,代表 search 本身就是一種獨立功能費。

Anthropic 也不是只有 token。官方定價頁明寫:

Web search:10 美元 / 1,000 searches

而且 search content 還會再算進標準 token 成本

Code execution 另外有每月免費額度與超出後的 container hour 計價


Gemini 則把:

Grounding with Google Search

Context caching

Storage price

都獨立列價。


哪些應用最容易忽略這一層

如果你的產品是:

搜尋型助理

RAG 問答

Agent

地圖查詢

多工具流程


那真正拉高帳單的,未必是模型本身,而可能是功能層。只看每百萬 Token 單價,幾乎一定會低估這類應用的真實成本。


成本點 5:長上下文、特殊模式、平台層費用,也都會影響最後價格

有些平台不是所有情況都照標準價算。

OpenAI 官方價格頁明寫,價格反映的是 context lengths under 270K 的標準處理費率,而且 Data residency / Regional Processing 端點會加收 10%。

Anthropic 的定價頁則把 Long context pricing 獨立列成一段,表示長上下文不一定永遠照標準價理解。


Gemini 的定價頁更直接,某些模型對超過 200k tokens 的 prompt 會跳到更高費率,而且 context caching price 與 storage price 也一起變成需要考量的部分。


為什麼這會影響比價

這代表就算模型名稱一樣、官方單價看起來差不多,你的最終成本仍可能因為:

長上下文

區域處理

特殊模式

儲存費

平台層機制


而不同。

所以新手比價時,如果只看首頁一排價格,很容易看錯。


新手最不容易做錯的比價方法

最簡單的做法,是先把自己的任務分成三種。


第一種:高頻標準任務

如果你做的是:

摘要

分類

標題

FAQ


先看:

低價模型

Batch

快取

這種任務通常不需要最強模型,重點是高頻低成本。


第二種:長文與輸出型任務

如果你做的是:

長文

報告

程式碼

長回覆


先看:

output 單價

模型穩定度

是否容易重跑

因為這一類真正燒錢的通常是 output,不是 input。


第三種:搜尋型 / 工具型工作流

如果你做的是:

搜尋型助理

RAG

Agent

Grounding

工具整合


就一定要把:

功能費

長上下文

快取

儲存費


一起算進去。

真正好的比價,不是只抓一個單價排名,而是先問:

我這種任務,最常花錢的是哪一段?

只要這一題先答對,後面就比較不容易選錯。


一句話總結

AI Token 比價不是比誰單價最低,而是比誰在你的任務型態下,總成本最低。

你至少要同時看:

input / output

快取

Batch

功能費

長上下文

特殊模式


必要時還要把平台層費用一起算進去。只看每百萬 Token,通常只看到了表面。


FAQ

AI Token 比價是不是先看每百萬 Token 最低就好?

不夠。現在主流平台的定價結構通常不只 token 單價,還會牽涉到 output、快取、Batch、搜尋、工具與長上下文等費用。


為什麼 output 單價比 input 更值得注意?

因為很多生成型任務真正把帳單拉高的不是你送進去多少,而是模型回出來多少。OpenAI 和 Anthropic 的官方價格頁都能直接看到 output 高於 input。


Prompt caching 真的會影響比價結果嗎?

會。因為重複背景如果能走快取,實際有效單價可能和裸 input 價格差很多。OpenAI 的 cached input 與 Anthropic 的 cache hits 都明確比一般 input 低。


Batch API 什麼時候最有用?

當你的任務不需要即時結果,例如批量摘要、分類、翻譯、資料整理時,Batch 很可能直接改寫你的成本結構。OpenAI 與 Anthropic 都明講 Batch 可省 50%。


搜尋和 grounding 為什麼要另外算?

因為很多平台把它們列為獨立功能費,不是單純的 token 成本。OpenAI 的 web search、Anthropic 的 web search、Gemini 的 grounding 都是這樣。


資料來源與可信度聲明

本文根據主流 AI 平台官方定價頁與官方文件整理撰寫,重點參考以下來源:

本文以「模型 token 成本 × 功能層費用 × 實際應用判讀」三個角度整理,目的是幫你建立一套比較 AI Token 價格時不容易看錯的方法。比價真正麻煩的地方,不是找到最低單價,而是看清楚你的任務最後會由哪些費用組成。


如果你想繼續往下看其他相關內容,可以直接前往 AI Token


本篇文章屬於《AI Token 費用》分類。

此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、比價邏輯、平台帳單結構與成本判讀方法,幫助新手、內容創作者、接案者與企業在接觸 AI API 時,不只知道價格表怎麼看,也知道怎麼用更接近真實使用情境的方式比較成本。


延伸閱讀

留言


bottom of page