AI API 價格怎麼看？Token 費用和功能費用要分開

4月10日
讀畢需時 7 分鐘

AI API 計費結構與總成本解析：圖解『Token 費用』（包含 Input、Output 與快取）與『附加功能費用』（如網路搜尋、Grounding、程式碼執行等）的核心區別，提醒開發者分開評估以精準掌握專案預算

很多人第一次看 AI API 價格表，最容易只盯著一個數字：每百萬 Token 多少錢。但現在主流

平台的定價早就不只這一層。

OpenAI 除了 input、cached input、output 之外，還另外列出 web search、containers 等工具型費用；Anthropic 也把標準 token 計價、prompt caching、web search、code execution 等拆開；Google Gemini 則同時列出 input、output、context caching、storage、Grounding with Google Search 等不同費用。

所以真正正確的看法不是「哪個模型每百萬 Token 最便宜」，而是先把兩件事拆開：

模型本身的 Token 費用

你額外打開哪些功能後產生的功能費用

這樣看，才不會把一個看起來很便宜的模型，誤判成實際使用也一定最省。你原稿的核心就在這裡，我這版會把它整理得更清楚。

先分清楚：什麼叫 Token 費用？

Token 費用，最簡單就是模型「讀進去多少、吐出來多少」的成本。

像 OpenAI 的價格頁就是把 input、cached input、output 分開列；Anthropic 也把 Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens 分開；Gemini 同樣用每 1M tokens 的方式列出 input、output，連 context caching 也按 token 價格與 storage price 另外列價。

這一層本質上是在算：模型本身處理內容的工作量。

舉例來說，如果你做的是這些任務：

摘要

翻譯

文章生成

客服問答

文案改寫

最基本的帳單通常都會先從這裡開始。

Token 費用最常看到的三個欄位

Input

你送給模型的內容。例如 prompt、system 指令、歷史上下文、附帶文件文字。

Cached input / Cache hits

如果平台支援快取，重複使用的輸入可能會用更便宜的價格計算。OpenAI 的 cached input 明顯低於一般 input；Anthropic 的 cache hits 也明顯低於 base input；Gemini 則把 context caching price 和 storage price 拆開列。

Output

模型回給你的內容。這也是很多新手最容易低估的成本來源。OpenAI 的 GPT-5.4、mini、nano 都是 output 單價高於 input；Anthropic 的 Sonnet 4.5、Haiku 4.5 也一樣；Gemini 多個模型價格表裡，output 也普遍高於 input。

什麼叫功能費用？

功能費用，則是你為了讓模型多做一些事，額外付出的費用。

這類費用不一定按 token 算，常見單位可能是：

每次 call

每次 search

每小時

每 GB / 天

每個 container

每 1,000 grounded prompts

也就是說，功能費用回答的不是「模型讀寫文字花多少」，而是：

你有沒有叫模型去搜尋、抓資料、跑工具、存快取、開容器、做 grounding。

OpenAI 的功能費用怎麼看

OpenAI 的價格頁就很典型。

除了 GPT 模型本身的 input / cached input / output 之外，它還另外列出：

Web search

OpenAI 價格頁列出 $10 / 1k calls，並且寫明 Search content tokens are free。這代表 web search 本身是按呼叫次數收費，不只是 token 費。

Containers

OpenAI 也把 container 費用獨立列出，例如 1 GB container 的價格，以及不同時間點的 session 計價方式。這就不是一般 token 費，而是執行環境費用。

Batch API

這雖然不是工具費，但它是服務層價格機制。OpenAI 官方明寫 Batch API 可讓 input 和 output 各省 50%。這代表同樣是 token 成本，是否走 batch，價格就不一樣。

所以如果你在看 OpenAI 價格，不能只看模型單價，還要看你有沒有開啟 search、container 或 batch 這種額外層。

Anthropic 的功能費用怎麼看

Anthropic 的定價邏輯也很適合拿來當例子，因為它把「token 成本」和「工具成本」分得很清楚。

Prompt caching

Claude API pricing 裡，把 Base Input、Cache Writes、Cache Hits & Refreshes 分開列價。這說明 prompt caching 不是模糊概念，而是正式進入帳單結構的成本項目。

Web search

Anthropic 官方明確寫出：Web search usage is charged in addition to token usage，價格是 $10 per 1,000 searches，而且搜尋結果內容還會再算進標準 token 成本。這句話很關鍵，因為它直接證明：同一次請求可以同時有 token 帳單和工具帳單。

Code execution

Anthropic 官方也把 code execution tool 的費用拆出來寫。

文件說明：

搭配 web search / web fetch 時，沒有額外 code execution charge，超出部分仍會依執行時間計價

每個組織每月有 1,550 free hours

超過後是 $0.05 per hour, per container

這就很典型地告訴你：Claude 的 API 成本不只是 input / output，還可能有工具層的執行費。

Gemini 的功能費用怎麼看

Google Gemini 這邊也一樣，不只是 token。

Context caching 與 storage

Gemini 定價頁把 Context caching price 和 storage price 分開列。例如多個模型都能看到 context caching price 之外，還有 $1.00 / 1,000,000 tokens per hour 之類的 storage price。這就表示：你不只是為「快取內容本身」付費，還可能為「快取保存時間」付費。

Grounding with Google Search

Gemini 定價頁多處列出 Grounding with Google Search，通常是先有免費額度，之後 $35 / 1,000 grounded prompts。這就不是一般 token 定價，而是搜尋 grounding 功能的獨立費用。

Gemini 2.5 Flash-Lite 的例子

Gemini 2.5 Flash-Lite 被官方描述為 smallest and most cost effective model, built for at scale usage，看起來很便宜，但如果你的流程同時用到 context caching、storage、grounding，那最終帳單就不會只由模型 input / output 決定。

為什麼這兩種費用一定要分開看？

因為它們回答的是兩個完全不同的問題。

Token 費用回答的是：

模型本身處理這段內容要多少錢。

功能費用回答的是：

你有沒有讓模型去搜尋、抓資料、跑工具、存快取、開容器。

如果你把這兩層混在一起，很容易得出錯誤結論。

例如某個模型的 input / output 很便宜，但你的流程又大量用 web search、grounding、file search、code execution 或 containers，最後把帳單拉高的主因，可能根本不是模型本身，而是功能層。

反過來說，有些任務明明只需要純文字生成，你卻拿一堆工具型成本一起比較，也會把判斷帶歪。

三個平台，三種很典型的判斷方式

如果你看 OpenAI

最容易忽略的是：模型單價之外，還有 web search、containers、batch 這些項目；但 cached input 又能把 input 成本壓低。所以 OpenAI 的價格比較，不能只看模型 input / output，還要看你有沒有大量用工具，以及有沒有吃到 cache。

如果你看 Anthropic

重點通常在於：哪些東西只是增加 token，哪些東西還會另外收費。

像 web search 是 每 1,000 searches $10 再加 token；code execution 又可能按 container hour 算。這種情況下，如果你只看 Sonnet 或 Haiku 的 input / output，判斷就會不完整。

如果你看 Gemini

最容易被忽略的是：它不只算 token，還會把 context caching、storage、grounding 分開收。這代表 Gemini 的帳單很可能同時包含：

模型 token 成本

cache 成本

cache storage 成本

grounding 成本

新手怎麼比較，才不容易看錯？

最實用的做法是分兩步。

第一步，先算純模型成本

也就是先估這次任務會吃掉多少：

input tokens

output tokens

cached tokens

batch 折扣後的 token 成本

先算出「如果只跑模型，大概多少」。

第二步，再把功能成本一項一項加回去

像是：

有沒有 web search

有沒有 grounding

有沒有 file search / retrieval

有沒有 code execution

有沒有 containers

有沒有 context caching storage

這一步才是很多人真正漏掉的地方。因為一旦應用從單純聊天，變成搜尋型助理、RAG、代理工作流或多模態流程，功能費用往往就不再是小數字。

哪些任務最容易把功能費用看漏？

第一種：搜尋型應用

你以為自己只是在問模型問題，但其實背後每次都在觸發 web search 或 grounding。OpenAI、Anthropic、Gemini 都明確把這類功能獨立計價。

第二種：知識庫 / RAG 流程

這類任務常常會用到 file search、context caching、cache storage 或大量重複 prompt。OpenAI 有工具與 container 層費用，Gemini 有 context caching 與 storage，Anthropic 有 prompt caching。

第三種：工具型 Agent

只要模型開始幫你跑工具、開容器、執行程式、編修檔案，成本結構就會和單純生成完全不同。Anthropic 的 code execution 就是很典型的例子。

一句話總結

AI API 價格不能只看 Token。更準確的看法是：

先看模型本身的 input / output / cache 成本，再看你額外用了哪些搜尋、快取、儲存、工具、容器或 grounding 功能。

真正的帳單，通常是這兩層一起組成的。

所以當你下次再比較模型時，不要只問「每百萬 Token 多少」；更應該問的是：

這個價格是純模型費，還是已經把功能費也算進去了？

這樣看，才不會把一個看起來便宜的模型，誤認成實際使用也一定最省。

FAQ

AI API 價格是不是先看每百萬 Token 就好？

不夠。現在主流平台除了 token 費，還常常有搜尋、快取、儲存、工具、容器或 grounding 的額外費用。

Token 費用和功能費用哪個比較重要？

兩個都重要。純文字生成任務通常 token 費比較核心；但只要你的流程用到搜尋、tool use、grounding、code execution，功能費就可能快速變大。

OpenAI 的 web search 是算 token 還是算功能費？

OpenAI 價格頁直接列為 $10 / 1k calls，而且 search content tokens are free，所以它屬於功能費，不是一般 input / output token 費。

Anthropic 的 web search 呢？

Anthropic 的 web search 是 每 1,000 searches $10，而且搜尋結果內容還會再算入標準 token 成本，所以它同時有功能費和 token 費。

Gemini 的 context caching 為什麼容易看漏？

因為 Gemini 不只算 context caching token price，還有 storage price。你如果只看 input / output，很容易低估整體帳單。

哪些人最容易把功能費看漏？

最常見的是做搜尋型助理、RAG、知識庫、工具型 Agent、多步驟工作流的人。因為這些系統往往不是只有模型生成，還會搭配搜尋、快取、工具執行與外部資料調用。

資料來源與可信度聲明

本文根據主流 AI 平台官方定價頁與官方文件整理撰寫，重點參考以下來源：

OpenAI｜API Pricing

Anthropic｜Pricing

Google AI for Developers｜Gemini API pricing

本文以「模型 token 成本 × 功能層費用 × 實際應用判讀」三個角度整理，重點不是只讓你背價格，而是幫你建立一套看 AI API 價格表時不容易看錯的方式。你原稿的方向是對的，我這版是把它整理成更完整、可直接上站的版本。

如果你想從入門一路看到更多延伸內容，可以直接前往 AI Token。

本篇文章屬於《AI Token 費用》分類。

此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、平台帳單結構、功能費用差異與成本判讀邏輯，幫助新手、內容創作者、接案者與企業在接觸 AI API 時，不只看表面單價，而是真的看懂帳單到底是由哪些費用組成。

延伸閱讀

AI Token 價格怎麼看？新手先搞懂費用是怎麼來的

AI Token 計費方式有哪些？不是每家平台都一樣

AI Token 成本計算怎麼做？從輸入輸出分開看最清楚

Claude Token 計費怎麼看？適合哪些使用情境