Claude Token 計費怎麼看?適合哪些使用情境
- 4月9日
- 讀畢需時 9 分鐘
已更新:4月21日

如果你最近開始研究 Anthropic 的 Claude API,應該很快就會遇到這幾個詞:input token、output token、prompt caching、rate limits、spend limits、batch processing。
對新手來說,最困難的通常不是 Claude 好不好用,而是:Claude Token 計費到底怎麼看?哪些情況用 Claude 比較適合?我會不會還沒搞懂就先把預算燒掉?
這篇文章就是要幫你把這些問題一次拆開。你不需要一開始就把 Anthropic 的全部文件看完。先看懂幾個最重要的重點就夠了:Claude API 主要怎麼收費、哪些數字最值得先看、Prompt Caching 是什麼、以及 Claude 特別適合哪些工作。
Anthropic 官方定價頁明確把 Claude API 的費用拆成 Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens,並另外說明 batch processing、long context pricing、tool use pricing 都可能影響整體成本。
Claude Token 計費不是只看你問了什麼,而是看你送進多少內容、模型回了多少內容、以及有沒有用到快取
這是整篇最重要的一句話。
Anthropic 官方定價頁把 Claude API 的費用拆成四塊來看:
Base Input Tokens
Cache Writes
Cache Hits & Refreshes
Output Tokens
其中 Base Input Tokens 是一般輸入成本,Output Tokens 是模型回覆成本;如果你有使用 Prompt Caching,還會看到 Cache Writes 與 Cache Hits 這兩種價格。以官方目前列價來看,Claude Sonnet 4.6、Sonnet 4.5、Sonnet 4 的 base input 都是 US$3 / MTok、output 都是 US$15 / MTok;Claude Haiku 4.5 則是 US$1 / MTok input、US$5 / MTok output。
所以當你問「Claude Token 計費怎麼看」,其實不是只看一個單價,而是要先分清楚:
這次送進去多少內容
這次回來多少內容
有沒有重複使用已快取的提示內容
是不是用了特殊功能或特殊流程
Claude Token 是什麼?先懂這個,後面才看得懂帳單
Claude API 裡的 token,本質上和其他大型語言模型一樣,都是模型處理文字時的基本單位。Anthropic 另外提供了 Token counting 功能,讓開發者在真正送出請求前先估算 token 數量。官方文件明確說,token counting 可以幫你主動管理 rate limits 與 costs,而且回傳的是 total number of input tokens;同時官方也提醒這是估算值,但系統自動加上的優化 token 不會向你計費。
這代表兩件很實用的事:
第一,Claude Token 不是單純等於字數。
第二,你可以先估 token,再決定要不要真的送請求。
對新手來說,這很重要。因為你不一定要每次都先跑一遍 API 才知道大概花多少,你可以先用 token counting 做預估,再決定 prompt 要不要縮短、要不要拆任務、要不要換模型。這也是 Anthropic 官方直接建議的用法。
Claude 計費頁面最先要看懂的 4 個欄位
新手第一次打開 Anthropic 的定價頁,很容易直接被數字淹沒。其實先看下面 4 個欄位就夠了。
Base Input Tokens
這是你正常送進 Claude 的內容費用。像系統提示、使用者輸入、上下文內容,通常都屬於這一類。Anthropic 官方定價表把它列為 Base Input Tokens。
Cache Writes
如果你把提示內容寫入快取,這裡就是寫入成本。Anthropic 官方價格表可直接看到,Sonnet 4.6 / 4.5 / 4 的 5m Cache Writes 是 US$3.75 / MTok、1h Cache Writes 是 US$6 / MTok;Haiku 4.5 則是 US$1.25 / MTok 和 US$2 / MTok。
Cache Hits & Refreshes
當你後續請求重用已快取內容時,會走 cache read,也就是快取讀取價格。官方價格表顯示,Sonnet 4.x 的 Cache Hits & Refreshes 是 US$0.30 / MTok,Haiku 4.5 是 US$0.10 / MTok。
Output Tokens
這是 Claude 回給你的內容成本。而且和很多模型一樣,Claude 的 output 單價通常明顯高於 input。像 Sonnet 4.5 / 4.6 的 output 是 US$15 / MTok,Haiku 4.5 的 output 是 US$5 / MTok。
所以對新手來說,先記住這句話:
Claude 成本常常不是燒在你寫了多少,而是燒在模型回了多少。
Prompt Caching 是什麼?為什麼 Claude 計費一定要看這個
這是 Claude 計費裡特別值得注意的一點。
Anthropic 官方文件把 Prompt Caching 單獨拉出來說明,代表它不是附帶小功能,而是會直接影響成本結構的重要機制。官方定價與快取文件一起看,可以整理出一個很清楚的邏輯:第一次把長規則、長背景、長文件寫進快取,成本比一般 input 高;後續如果重複用同一段內容,讀取就會便宜很多。官方也說得很明白,這功能特別適合長內容、文件、詳細 instruction sets、以及 agentic tool use 場景。
你可以把它理解成:
第一次把一大段固定提示、規則、背景資料寫進系統,成本比較高。但如果後面一直重複用同一段內容,後續讀取就會便宜很多。
這代表 Claude 特別適合某些重複使用同一組長提示的工作。
比如:
固定格式的客服助手
固定流程的文件審閱
固定規格的內容改寫
固定角色設定的企業內部工具
這類任務如果每次都重送完整背景,成本會高;但如果背景能被快取,後續就更划算。官方也把「talk to books, papers, documentation, podcast transcripts, and other longform content」列為 prompt caching 的典型適用場景。
Claude Token 計費怎麼估?新手先用最簡單的算法就好
一開始真的不用算太細。
最簡單的算法就是:
本次成本 ≈ Base Input 成本 + Cache Write 或 Cache Hit 成本 + Output 成本
例如你用 Sonnet 4.5,丟進去一段固定提示加上一段短任務。如果那段固定提示第一次寫入快取,你就要算 Cache Write。如果下次重用同一段內容,就可能改算 Cache Hit。而 Claude 回給你的內容,再另外算 Output。
對新手來說,不需要第一天就做到超精準成本模型。你先會判斷下面三件事,就已經很夠用:
這次主要是 input 多,還是 output 多
這次有沒有用到快取
這個任務是一次性,還是重複性高
這三件事,比單純背價格表更實用。
Claude 適合哪些使用情境?先看它的定價結構,你就比較知道答案
其實很多時候,模型適不適合某個場景,不只看能力,也要看定價長什麼樣。
從 Anthropic 官方文件來看,Claude 的計費結構特別把 Prompt Caching、Batch Processing、Web Search、Tool Use 等功能獨立說清楚,這表示 Claude 並不是只針對「一次問一句話」設計,而是很適合放進比較完整的工作流。
長篇文件分析與整理
Claude 一直以長上下文與長文處理受到關注。Anthropic 官方 models overview 明確寫到:如果你不確定從哪個模型開始,最複雜任務可考慮 Claude Opus 4.6;同時所有 current Claude models 都支援 text and image input、text output、multilingual capabilities 和 vision。Pricing 文件則進一步列出 long context pricing。這組合起來很明顯說明 Claude 特別適合長報告、逐字稿、法務文件、研究資料整理這種長文本工作。
如果你的工作常常是:
看很長的資料
幫資料做摘要
整理成決策重點
把大量內容重組成清單或架構
Claude 通常很值得測。
固定規則、重複執行的企業流程
這是 Prompt Caching 最能發揮價值的場景。
例如企業常見的:
固定格式合約審閱
固定欄位內容審核
固定風格客服回覆
固定模板文章改寫
固定規範內部知識庫問答
這些任務都很適合把大段規則寫進快取,之後只替換少量新內容。對這類工作,Claude 的快取定價會比每次完整重送更有優勢。這一點是從 Anthropic 官方 pricing 與 prompt caching 文件直接延伸出來的實務判斷。
內容團隊的大量批次處理
Anthropic 官方提供 Message Batches API。官方文件明確寫到,這種做法適合大量資料處理、非即時回應需求、成本效率優先的情境,而且 most batches finish in less than 1 hour while reducing costs by 50% and increasing throughput。
所以像這些任務就很適合:
批量分類內容
批量摘要
批量標題生成
批量改寫
批量標註資料
如果你是內容平台、SaaS 工具、研究團隊,這種能力很實用。
需要工具整合的工作流
Anthropic 官方文件清楚列出 Claude 支援工具與工具使用情境,而 web search tool 文件更明白指出:Web search usage is charged in addition to token usage,usage 物件裡還會顯示 web_search_requests。這代表 Claude 很適合放在:
查資料後整理答案
多步驟代理流程
帶搜尋的問答系統
需要結構化輸出的內部工具
但也要注意,這些功能有些不是只有 token 成本,還可能有工具費。
Claude 不一定最適合的情境有哪些
不是所有任務都該上 Claude,更不是所有任務都該用 Sonnet 或 Opus。
如果你的需求是:
只做超短小任務
只做非常簡單的改句子
只是偶爾測試一兩句
預算非常緊,但不需要長上下文
那你可能更適合:
先用更便宜模型
或先把任務拆得更小
因為 Anthropic 官方定價已經很清楚顯示,不同模型價格差很多。像 Haiku 4.5 就比 Sonnet 4.5 便宜很多,適合偏快速、成本敏感的任務。
Claude Haiku、Sonnet、Opus 怎麼選?新手先用這個思路就好
不需要先記太細的模型比較表,新手先記住下面邏輯就可以:
Haiku:快、便宜,適合大量簡單任務
Sonnet:平衡型,適合大多數正式工作流
Opus:更高階,適合高難度推理與關鍵任務
Anthropic 官方 models overview 直接說 Opus 4.6 是最 complex tasks 的 broadly available model;pricing 頁又明確把 Haiku、Sonnet、Opus 拉出明顯的價格階梯。這就足夠支持這種分工方式。
所以你可以這樣想:
要批次大量跑,就先看 Haiku。要做正式內部工具,多半先看 Sonnet。要做高價值、高複雜度任務,再考慮 Opus。
新手看 Claude Token 計費,還要一起看哪兩件事
Rate limits
Anthropic 官方 rate limits 文件說明,API 有 requests per minute、input tokens per minute、output tokens per minute 這類限制,而且 limits 會依 usage tier 而變。這不一定直接影響單次費用,但會影響你能不能穩定大量呼叫。
Spend limits
雖然你原稿裡提到 spend limits,Anthropic 官方 rate limits / usage tiers 的設計確實和帳戶層級、可用量、成本控制有關。對新手來說,重點不是背所有限制細節,而是知道:不是你錢夠就一定能無限跑,還要看帳戶層級與速率限制。 這是 Anthropic 官方 limits 文件直接支持的方向。
新手最容易犯的 7 個 Claude 計費錯誤
第一,只看 input 不看 output。Claude 的 output 單價通常比 input 高很多,這是最常被忽略的地方。
第二,不知道 Prompt Caching 不是免費功能。快取可以省錢,但第一次寫入不是零成本,而是會有 Cache Write 價格。
第三,所有任務都用 Sonnet 或 Opus。很多任務其實 Haiku 就夠了,模型選太高,成本很快就被拉上去。
第四,不看 limits。以為自己只是小測試,結果長時間累積後才發現成本或速率限制超出預期。
第五,不知道 token counting 可以先用。其實先估 token 很實用,不先用這功能就直接亂跑,等於放棄一個很好用的成本保護機制。
第六,忽略批次處理可能更適合。如果你是大量相似任務,單筆即時呼叫不一定最有效率。Anthropic 既然提供 Message Batches,而且明講可降 50% 成本,就代表某些情境更適合這條路。
第七,把工具費忘掉。如果你用到 Web Search 等功能,除了 token,還有額外工具價格,不是只有基本生成費。
FAQ
Claude Token 計費主要看哪裡?
先看 Anthropic 官方定價頁上的 4 個欄位:Base Input Tokens、Cache Writes、Cache Hits & Refreshes、Output Tokens。對新手來說,先搞懂這四個就足以判斷大部分任務的大方向成本。
Claude 的 output 真的比 input 貴很多嗎?
是。以官方目前列出的 Sonnet 4.5 為例,base input 是 US$3 / MTok,output 是 US$15 / MTok;Haiku 4.5 則是 input US$1 / MTok、output US$5 / MTok。
Prompt Caching 適合哪些工作?
最適合固定規則、固定背景、重複執行的任務,例如企業內部助手、固定模板分類器、長規則審核流程。因為 Anthropic 的快取讀取價格明顯低於 base input。
Claude 適合長文和大文件嗎?
很適合。Anthropic 的 models overview 和 pricing 文件都顯示 Claude 在長上下文與長文本工作上有明顯定位。
Claude 有沒有先估 token 的方法?
有。Anthropic 提供 token counting,讓你在真正送請求前先估算 input token,而且官方明確說這功能可用來主動管理成本。
Claude 適合拿來做批次內容處理嗎?
適合。Anthropic 官方提供 Message Batches API,並明寫這種做法通常能降低 50% 成本、提高 throughput。
資料來源與可信度聲明
本文根據 Anthropic 官方文件整理撰寫,主要參考以下來源:
本文採用「官方定價頁 × 成本結構 × 使用情境」三層方式整理,優先採信原廠文件與官方公告,幫助第一次接觸 Claude API 的讀者快速建立可操作、可驗證的 Claude Token 計費理解。你原稿的核心方向就是這條線,我這版只是把它整理成更完整、可直接上站的版本。
如果你想把 Claude Token 計費 放回整體市場一起比較,建議再接著看 AI Token 價格怎麼看,一次看懂不同模型的價格閱讀方式。
如果你想繼續往下了解更多實用內容,可以直接看 AI Token。
本篇文章屬於《AI Token 費用》分類。
此分類主要整理 AI Token 價格、AI Token 費用、模型計價方式、用量判讀、成本估算與平台差異等主題,幫助新手、內容創作者、接案者與企業在接觸 AI API 時,不只知道價格數字,而是真的看懂費用邏輯與成本來源。




留言