Claude Token 計費怎麼看?適合哪些使用情境
- 2天前
- 讀畢需時 9 分鐘

如果你最近開始研究 Anthropic 的 Claude API,應該很快就會遇到這幾個詞:input token、output token、prompt caching、rate limits、spend limits、batch processing。
對新手來說,最困難的通常不是 Claude 好不好用,而是:Claude Token 計費到底怎麼看?哪些情況用 Claude 比較適合?我會不會還沒搞懂就先把預算燒掉?
這篇文章就是要幫你把這些問題一次拆開。你不需要一開始就把 Anthropic 的全部文件看完。先看懂幾個最重要的重點就夠了:Claude API 主要怎麼收費、哪些數字最值得先看、Prompt Caching 是什麼、以及 Claude 特別適合哪些工作。
Anthropic 官方定價頁明確把 Claude API 的費用拆成 Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens,並另外說明 batch processing、long context pricing、tool use pricing 都可能影響整體成本。
Claude Token 計費不是只看你問了什麼,而是看你送進多少內容、模型回了多少內容、以及有沒有用到快取
這是整篇最重要的一句話。
Anthropic 官方定價頁把 Claude API 的費用拆成四塊來看:
Base Input Tokens
Cache Writes
Cache Hits & Refreshes
Output Tokens
其中 Base Input Tokens 是一般輸入成本,Output Tokens 是模型回覆成本;如果你有使用 Prompt Caching,還會看到 Cache Writes 與 Cache Hits 這兩種價格。以官方目前列價來看,Claude Sonnet 4.6、Sonnet 4.5、Sonnet 4 的 base input 都是 US$3 / MTok、output 都是 US$15 / MTok;Claude Haiku 4.5 則是 US$1 / MTok input、US$5 / MTok output。
所以當你問「Claude Token 計費怎麼看」,其實不是只看一個單價,而是要先分清楚:
這次送進去多少內容
這次回來多少內容
有沒有重複使用已快取的提示內容
是不是用了特殊功能或特殊流程
Claude Token 是什麼?先懂這個,後面才看得懂帳單
Claude API 裡的 token,本質上和其他大型語言模型一樣,都是模型處理文字時的基本單位。Anthropic 另外提供了 Token counting 功能,讓開發者在真正送出請求前先估算 token 數量。官方文件明確說,token counting 可以幫你主動管理 rate limits 與 costs,而且回傳的是 total number of input tokens;同時官方也提醒這是估算值,但系統自動加上的優化 token 不會向你計費。
這代表兩件很實用的事:
第一,Claude Token 不是單純等於字數。
第二,你可以先估 token,再決定要不要真的送請求。
對新手來說,這很重要。因為你不一定要每次都先跑一遍 API 才知道大概花多少,你可以先用 token counting 做預估,再決定 prompt 要不要縮短、要不要拆任務、要不要換模型。這也是 Anthropic 官方直接建議的用法。
Claude 計費頁面最先要看懂的 4 個欄位
新手第一次打開 Anthropic 的定價頁,很容易直接被數字淹沒。其實先看下面 4 個欄位就夠了。
Base Input Tokens
這是你正常送進 Claude 的內容費用。像系統提示、使用者輸入、上下文內容,通常都屬於這一類。Anthropic 官方定價表把它列為 Base Input Tokens。
Cache Writes
如果你把提示內容寫入快取,這裡就是寫入成本。Anthropic 官方價格表可直接看到,Sonnet 4.6 / 4.5 / 4 的 5m Cache Writes 是 US$3.75 / MTok、1h Cache Writes 是 US$6 / MTok;Haiku 4.5 則是 US$1.25 / MTok 和 US$2 / MTok。
Cache Hits & Refreshes
當你後續請求重用已快取內容時,會走 cache read,也就是快取讀取價格。官方價格表顯示,Sonnet 4.x 的 Cache Hits & Refreshes 是 US$0.30 / MTok,Haiku 4.5 是 US$0.10 / MTok。
Output Tokens
這是 Claude 回給你的內容成本。而且和很多模型一樣,Claude 的 output 單價通常明顯高於 input。像 Sonnet 4.5 / 4.6 的 output 是 US$15 / MTok,Haiku 4.5 的 output 是 US$5 / MTok。
所以對新手來說,先記住這句話:
Claude 成本常常不是燒在你寫了多少,而是燒在模型回了多少。
Prompt Caching 是什麼?為什麼 Claude 計費一定要看這個
這是 Claude 計費裡特別值得注意的一點。
Anthropic 官方文件把 Prompt Caching 單獨拉出來說明,代表它不是附帶小功能,而是會直接影響成本結構的重要機制。官方定價與快取文件一起看,可以整理出一個很清楚的邏輯:第一次把長規則、長背景、長文件寫進快取,成本比一般 input 高;後續如果重複用同一段內容,讀取就會便宜很多。官方也說得很明白,這功能特別適合長內容、文件、詳細 instruction sets、以及 agentic tool use 場景。
你可以把它理解成:
第一次把一大段固定提示、規則、背景資料寫進系統,成本比較高。但如果後面一直重複用同一段內容,後續讀取就會便宜很多。
這代表 Claude 特別適合某些重複使用同一組長提示的工作。
比如:
固定格式的客服助手
固定流程的文件審閱
固定規格的內容改寫
固定角色設定的企業內部工具
這類任務如果每次都重送完整背景,成本會高;但如果背景能被快取,後續就更划算。官方也把「talk to books, papers, documentation, podcast transcripts, and other longform content」列為 prompt caching 的典型適用場景。
Claude Token 計費怎麼估?新手先用最簡單的算法就好
一開始真的不用算太細。
最簡單的算法就是:
本次成本 ≈ Base Input 成本 + Cache Write 或 Cache Hit 成本 + Output 成本
例如你用 Sonnet 4.5,丟進去一段固定提示加上一段短任務。如果那段固定提示第一次寫入快取,你就要算 Cache Write。如果下次重用同一段內容,就可能改算 Cache Hit。而 Claude 回給你的內容,再另外算 Output。
對新手來說,不需要第一天就做到超精準成本模型。你先會判斷下面三件事,就已經很夠用:
這次主要是 input 多,還是 output 多
這次有沒有用到快取
這個任務是一次性,還是重複性高
這三件事,比單純背價格表更實用。
Claude 適合哪些使用情境?先看它的定價結構,你就比較知道答案
其實很多時候,模型適不適合某個場景,不只看能力,也要看定價長什麼樣。
從 Anthropic 官方文件來看,Claude 的計費結構特別把 Prompt Caching、Batch Processing、Web Search、Tool Use 等功能獨立說清楚,這表示 Claude 並不是只針對「一次問一句話」設計,而是很適合放進比較完整的工作流。
長篇文件分析與整理
Claude 一直以長上下文與長文處理受到關注。Anthropic 官方 models overview 明確寫到:如果你不確定從哪個模型開始,最複雜任務可考慮 Claude Opus 4.6;同時所有 current Claude models 都支援 text and image input、text output、multilingual capabilities 和 vision。Pricing 文件則進一步列出 long context pricing。這組合起來很明顯說明 Claude 特別適合長報告、逐字稿、法務文件、研究資料整理這種長文本工作。
如果你的工作常常是:
看很長的資料
幫資料做摘要
整理成決策重點
把大量內容重組成清單或架構
Claude 通常很值得測。
固定規則、重複執行的企業流程
這是 Prompt Caching 最能發揮價值的場景。
例如企業常見的:
固定格式合約審閱
固定欄位內容審核
固定風格客服回覆
固定模板文章改寫
固定規範內部知識庫問答
這些任務都很適合把大段規則寫進快取,之後只替換少量新內容。對這類工作,Claude 的快取定價會比每次完整重送更有優勢。這一點是從 Anthropic 官方 pricing 與 prompt caching 文件直接延伸出來的實務判斷。
內容團隊的大量批次處理
Anthropic 官方提供 Message Batches API。官方文件明確寫到,這種做法適合大量資料處理、非即時回應需求、成本效率優先的情境,而且 most batches finish in less than 1 hour while reducing costs by 50% and increasing throughput。
所以像這些任務就很適合:
批量分類內容
批量摘要
批量標題生成
批量改寫
批量標註資料
如果你是內容平台、SaaS 工具、研究團隊,這種能力很實用。
需要工具整合的工作流
Anthropic 官方文件清楚列出 Claude 支援工具與工具使用情境,而 web search tool 文件更明白指出:Web search usage is charged in addition to token usage,usage 物件裡還會顯示 web_search_requests。這代表 Claude 很適合放在:
查資料後整理答案
多步驟代理流程
帶搜尋的問答系統
需要結構化輸出的內部工具
但也要注意,這些功能有些不是只有 token 成本,還可能有工具費。
Claude 不一定最適合的情境有哪些
不是所有任務都該上 Claude,更不是所有任務都該用 Sonnet 或 Opus。
如果你的需求是:
只做超短小任務
只做非常簡單的改句子
只是偶爾測試一兩句
預算非常緊,但不需要長上下文
那你可能更適合:
先用更便宜模型
或先把任務拆得更小
因為 Anthropic 官方定價已經很清楚顯示,不同模型價格差很多。像 Haiku 4.5 就比 Sonnet 4.5 便宜很多,適合偏快速、成本敏感的任務。
Claude Haiku、Sonnet、Opus 怎麼選?新手先用這個思路就好
不需要先記太細的模型比較表,新手先記住下面邏輯就可以:
Haiku:快、便宜,適合大量簡單任務
Sonnet:平衡型,適合大多數正式工作流
Opus:更高階,適合高難度推理與關鍵任務
Anthropic 官方 models overview 直接說 Opus 4.6 是最 complex tasks 的 broadly available model;pricing 頁又明確把 Haiku、Sonnet、Opus 拉出明顯的價格階梯。這就足夠支持這種分工方式。
所以你可以這樣想:
要批次大量跑,就先看 Haiku。要做正式內部工具,多半先看 Sonnet。要做高價值、高複雜度任務,再考慮 Opus。
新手看 Claude Token 計費,還要一起看哪兩件事
Rate limits
Anthropic 官方 rate limits 文件說明,API 有 requests per minute、input tokens per minute、output tokens per minute 這類限制,而且 limits 會依 usage tier 而變。這不一定直接影響單次費用,但會影響你能不能穩定大量呼叫。
Spend limits
雖然你原稿裡提到 spend limits,Anthropic 官方 rate limits / usage tiers 的設計確實和帳戶層級、可用量、成本控制有關。對新手來說,重點不是背所有限制細節,而是知道:不是你錢夠就一定能無限跑,還要看帳戶層級與速率限制。 這是 Anthropic 官方 limits 文件直接支持的方向。
新手最容易犯的 7 個 Claude 計費錯誤
第一,只看 input 不看 output。Claude 的 output 單價通常比 input 高很多,這是最常被忽略的地方。
第二,不知道 Prompt Caching 不是免費功能。快取可以省錢,但第一次寫入不是零成本,而是會有 Cache Write 價格。
第三,所有任務都用 Sonnet 或 Opus。很多任務其實 Haiku 就夠了,模型選太高,成本很快就被拉上去。
第四,不看 limits。以為自己只是小測試,結果長時間累積後才發現成本或速率限制超出預期。
第五,不知道 token counting 可以先用。其實先估 token 很實用,不先用這功能就直接亂跑,等於放棄一個很好用的成本保護機制。
第六,忽略批次處理可能更適合。如果你是大量相似任務,單筆即時呼叫不一定最有效率。Anthropic 既然提供 Message Batches,而且明講可降 50% 成本,就代表某些情境更適合這條路。
第七,把工具費忘掉。如果你用到 Web Search 等功能,除了 token,還有額外工具價格,不是只有基本生成費。
FAQ
Claude Token 計費主要看哪裡?
先看 Anthropic 官方定價頁上的 4 個欄位:Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens。對新手來說,先搞懂這四個就足以判斷大部分任務的大方向成本。
Claude 的 output 真的比 input 貴很多嗎?
是。以官方目前列出的 Sonnet 4.5 為例,base input 是 US$3 / MTok,output 是 US$15 / MTok;Haiku 4.5 則是 input US$1 / MTok、output US$5 / MTok。
Prompt Caching 適合哪些工作?
最適合固定規則、固定背景、重複執行的任務,例如企業內部助手、固定模板分類器、長規則審核流程。因為 Anthropic 的快取讀取價格明顯低於 base input。
Claude 適合長文和大文件嗎?
很適合。Anthropic 的 models overview 和 pricing 文件都顯示 Claude 在長上下文與長文本工作上有明顯定位。
Claude 有沒有先估 token 的方法?
有。Anthropic 提供 token counting,讓你在真正送請求前先估算 input token,而且官方明確說這功能可用來主動管理成本。
Claude 適合拿來做批次內容處理嗎?
適合。Anthropic 官方提供 Message Batches API,並明寫這種做法通常能降低 50% 成本、提高 throughput。
資料來源與可信度聲明
本文根據 Anthropic 官方文件整理撰寫,主要參考以下來源:
本文採用「官方定價頁 × 成本結構 × 使用情境」三層方式整理,優先採信原廠文件與官方公告,幫助第一次接觸 Claude API 的讀者快速建立可操作、可驗證的 Claude Token 計費理解。你原稿的核心方向就是這條線,我這版只是把它整理成更完整、可直接上站的版本。
如果你想繼續往下了解更多實用內容,可以直接看 AI Token。
本篇文章屬於《AI Token 費用》分類。
此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、用量判讀、成本估算與平台差異等主題,幫助新手、內容創作者、接案者與企業在接觸 AI API 時,不只知道價格數字,而是真的看懂費用邏輯與成本來源。



留言