AI API 價格怎麼看?Token 費用和功能費用要分開
- 21小时前
- 讀畢需時 7 分鐘

很多人第一次看 AI API 價格表,最容易只盯著一個數字:每百萬 Token 多少錢。但現在主流
平台的定價早就不只這一層。
OpenAI 除了 input、cached input、output 之外,還另外列出 web search、containers 等工具型費用;Anthropic 也把標準 token 計價、prompt caching、web search、code execution 等拆開;Google Gemini 則同時列出 input、output、context caching、storage、Grounding with Google Search 等不同費用。
所以真正正確的看法不是「哪個模型每百萬 Token 最便宜」,而是先把兩件事拆開:
模型本身的 Token 費用
你額外打開哪些功能後產生的功能費用
這樣看,才不會把一個看起來很便宜的模型,誤判成實際使用也一定最省。你原稿的核心就在這裡,我這版會把它整理得更清楚。
先分清楚:什麼叫 Token 費用?
Token 費用,最簡單就是模型「讀進去多少、吐出來多少」的成本。
像 OpenAI 的價格頁就是把 input、cached input、output 分開列;Anthropic 也把 Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens 分開;Gemini 同樣用每 1M tokens 的方式列出 input、output,連 context caching 也按 token 價格與 storage price 另外列價。
這一層本質上是在算:模型本身處理內容的工作量。
舉例來說,如果你做的是這些任務:
摘要
翻譯
文章生成
客服問答
文案改寫
最基本的帳單通常都會先從這裡開始。
Token 費用最常看到的三個欄位
Input
你送給模型的內容。例如 prompt、system 指令、歷史上下文、附帶文件文字。
Cached input / Cache hits
如果平台支援快取,重複使用的輸入可能會用更便宜的價格計算。OpenAI 的 cached input 明顯低於一般 input;Anthropic 的 cache hits 也明顯低於 base input;Gemini 則把 context caching price 和 storage price 拆開列。
Output
模型回給你的內容。這也是很多新手最容易低估的成本來源。OpenAI 的 GPT-5.4、mini、nano 都是 output 單價高於 input;Anthropic 的 Sonnet 4.5、Haiku 4.5 也一樣;Gemini 多個模型價格表裡,output 也普遍高於 input。
什麼叫功能費用?
功能費用,則是你為了讓模型多做一些事,額外付出的費用。
這類費用不一定按 token 算,常見單位可能是:
每次 call
每次 search
每小時
每 GB / 天
每個 container
每 1,000 grounded prompts
也就是說,功能費用回答的不是「模型讀寫文字花多少」,而是:
你有沒有叫模型去搜尋、抓資料、跑工具、存快取、開容器、做 grounding。
OpenAI 的功能費用怎麼看
OpenAI 的價格頁就很典型。
除了 GPT 模型本身的 input / cached input / output 之外,它還另外列出:
Web search
OpenAI 價格頁列出 $10 / 1k calls,並且寫明 Search content tokens are free。這代表 web search 本身是按呼叫次數收費,不只是 token 費。
Containers
OpenAI 也把 container 費用獨立列出,例如 1 GB container 的價格,以及不同時間點的 session 計價方式。這就不是一般 token 費,而是執行環境費用。
Batch API
這雖然不是工具費,但它是服務層價格機制。OpenAI 官方明寫 Batch API 可讓 input 和 output 各省 50%。這代表同樣是 token 成本,是否走 batch,價格就不一樣。
所以如果你在看 OpenAI 價格,不能只看模型單價,還要看你有沒有開啟 search、container 或 batch 這種額外層。
Anthropic 的功能費用怎麼看
Anthropic 的定價邏輯也很適合拿來當例子,因為它把「token 成本」和「工具成本」分得很清楚。
Prompt caching
Claude API pricing 裡,把 Base Input、Cache Writes、Cache Hits & Refreshes 分開列價。這說明 prompt caching 不是模糊概念,而是正式進入帳單結構的成本項目。
Web search
Anthropic 官方明確寫出:Web search usage is charged in addition to token usage,價格是 $10 per 1,000 searches,而且搜尋結果內容還會再算進標準 token 成本。這句話很關鍵,因為它直接證明:同一次請求可以同時有 token 帳單和工具帳單。
Code execution
Anthropic 官方也把 code execution tool 的費用拆出來寫。
文件說明:
搭配 web search / web fetch 時,沒有額外 code execution charge,超出部分仍會依執行時間計價
每個組織每月有 1,550 free hours
超過後是 $0.05 per hour, per container
這就很典型地告訴你:Claude 的 API 成本不只是 input / output,還可能有工具層的執行費。
Gemini 的功能費用怎麼看
Google Gemini 這邊也一樣,不只是 token。
Context caching 與 storage
Gemini 定價頁把 Context caching price 和 storage price 分開列。例如多個模型都能看到 context caching price 之外,還有 $1.00 / 1,000,000 tokens per hour 之類的 storage price。這就表示:你不只是為「快取內容本身」付費,還可能為「快取保存時間」付費。
Grounding with Google Search
Gemini 定價頁多處列出 Grounding with Google Search,通常是先有免費額度,之後 $35 / 1,000 grounded prompts。這就不是一般 token 定價,而是搜尋 grounding 功能的獨立費用。
Gemini 2.5 Flash-Lite 的例子
Gemini 2.5 Flash-Lite 被官方描述為 smallest and most cost effective model, built for at scale usage,看起來很便宜,但如果你的流程同時用到 context caching、storage、grounding,那最終帳單就不會只由模型 input / output 決定。
為什麼這兩種費用一定要分開看?
因為它們回答的是兩個完全不同的問題。
Token 費用回答的是:
模型本身處理這段內容要多少錢。
功能費用回答的是:
你有沒有讓模型去搜尋、抓資料、跑工具、存快取、開容器。
如果你把這兩層混在一起,很容易得出錯誤結論。
例如某個模型的 input / output 很便宜,但你的流程又大量用 web search、grounding、file search、code execution 或 containers,最後把帳單拉高的主因,可能根本不是模型本身,而是功能層。
反過來說,有些任務明明只需要純文字生成,你卻拿一堆工具型成本一起比較,也會把判斷帶歪。
三個平台,三種很典型的判斷方式
如果你看 OpenAI
最容易忽略的是:模型單價之外,還有 web search、containers、batch 這些項目;但 cached input 又能把 input 成本壓低。所以 OpenAI 的價格比較,不能只看模型 input / output,還要看你有沒有大量用工具,以及有沒有吃到 cache。
如果你看 Anthropic
重點通常在於:哪些東西只是增加 token,哪些東西還會另外收費。
像 web search 是 每 1,000 searches $10 再加 token;code execution 又可能按 container hour 算。這種情況下,如果你只看 Sonnet 或 Haiku 的 input / output,判斷就會不完整。
如果你看 Gemini
最容易被忽略的是:它不只算 token,還會把 context caching、storage、grounding 分開收。這代表 Gemini 的帳單很可能同時包含:
模型 token 成本
cache 成本
cache storage 成本
grounding 成本
新手怎麼比較,才不容易看錯?
最實用的做法是分兩步。
第一步,先算純模型成本
也就是先估這次任務會吃掉多少:
input tokens
output tokens
cached tokens
batch 折扣後的 token 成本
先算出「如果只跑模型,大概多少」。
第二步,再把功能成本一項一項加回去
像是:
有沒有 web search
有沒有 grounding
有沒有 file search / retrieval
有沒有 code execution
有沒有 containers
有沒有 context caching storage
這一步才是很多人真正漏掉的地方。因為一旦應用從單純聊天,變成搜尋型助理、RAG、代理工作流或多模態流程,功能費用往往就不再是小數字。
哪些任務最容易把功能費用看漏?
第一種:搜尋型應用
你以為自己只是在問模型問題,但其實背後每次都在觸發 web search 或 grounding。OpenAI、Anthropic、Gemini 都明確把這類功能獨立計價。
第二種:知識庫 / RAG 流程
這類任務常常會用到 file search、context caching、cache storage 或大量重複 prompt。OpenAI 有工具與 container 層費用,Gemini 有 context caching 與 storage,Anthropic 有 prompt caching。
第三種:工具型 Agent
只要模型開始幫你跑工具、開容器、執行程式、編修檔案,成本結構就會和單純生成完全不同。Anthropic 的 code execution 就是很典型的例子。
一句話總結
AI API 價格不能只看 Token。更準確的看法是:
先看模型本身的 input / output / cache 成本,再看你額外用了哪些搜尋、快取、儲存、工具、容器或 grounding 功能。
真正的帳單,通常是這兩層一起組成的。
所以當你下次再比較模型時,不要只問「每百萬 Token 多少」;更應該問的是:
這個價格是純模型費,還是已經把功能費也算進去了?
這樣看,才不會把一個看起來便宜的模型,誤認成實際使用也一定最省。
FAQ
AI API 價格是不是先看每百萬 Token 就好?
不夠。現在主流平台除了 token 費,還常常有搜尋、快取、儲存、工具、容器或 grounding 的額外費用。
Token 費用和功能費用哪個比較重要?
兩個都重要。純文字生成任務通常 token 費比較核心;但只要你的流程用到搜尋、tool use、grounding、code execution,功能費就可能快速變大。
OpenAI 的 web search 是算 token 還是算功能費?
OpenAI 價格頁直接列為 $10 / 1k calls,而且 search content tokens are free,所以它屬於功能費,不是一般 input / output token 費。
Anthropic 的 web search 呢?
Anthropic 的 web search 是 每 1,000 searches $10,而且搜尋結果內容還會再算入標準 token 成本,所以它同時有功能費和 token 費。
Gemini 的 context caching 為什麼容易看漏?
因為 Gemini 不只算 context caching token price,還有 storage price。你如果只看 input / output,很容易低估整體帳單。
哪些人最容易把功能費看漏?
最常見的是做搜尋型助理、RAG、知識庫、工具型 Agent、多步驟工作流的人。因為這些系統往往不是只有模型生成,還會搭配搜尋、快取、工具執行與外部資料調用。
資料來源與可信度聲明
本文根據主流 AI 平台官方定價頁與官方文件整理撰寫,重點參考以下來源:
本文以「模型 token 成本 × 功能層費用 × 實際應用判讀」三個角度整理,重點不是只讓你背價格,而是幫你建立一套看 AI API 價格表時不容易看錯的方式。你原稿的方向是對的,我這版是把它整理成更完整、可直接上站的版本。
如果你想從入門一路看到更多延伸內容,可以直接前往 AI Token。
本篇文章屬於《AI Token 費用》分類。
此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、平台帳單結構、功能費用差異與成本判讀邏輯,幫助新手、內容創作者、接案者與企業在接觸 AI API 時,不只看表面單價,而是真的看懂帳單到底是由哪些費用組成。



留言