top of page

Claude API 用量怎麼看?先看 Usage、Billing 和這 4 個欄位

  • 4月30日
  • 讀畢需時 9 分鐘
Claude API 用量查詢與計費後台教學:圖解開發者必看的成本控管指標,包含『Usage (用量)』、『Billing (餘額)』,以及精算 Token 消耗的 4 大核心欄位(input tokens、output tokens、cache creation 與 cache read),幫助新手精準掌握 API 帳單明細

Claude API 用量要先看 Usage 頁判斷你用了多少,再看 Billing 頁確認還剩多少 credits,而單次請求最重要的是 input tokens、output tokens、cache creation input tokens、cache read input tokens 這 4 個欄位。


 Anthropic 官方的 Claude Console 成本與使用報告文件明確說明,Usage 頁會顯示依模型、日期時間與 API key 的詳細用量拆解,Billing 則用來追蹤 credits 與自動加值;另外,API usage 是預付 credits 制,不是聊天訂閱的一部分。


很多人開始用 Claude API 之後,第一個卡住的不是「怎麼呼叫 API」,而是「後台那些數字到底在看什麼」。明明有看到 token、有看到 usage、有看到 billing,甚至也看到 input、output、cache read、cache creation,但就是很難一眼判斷:我這次到底花了多少、是不是正常、哪裡還有優化空間。你原本草稿抓到的核心方向就是這個,我這次把它改成更直接回答搜尋意圖的版本。


先分清楚:Claude 訂閱費,不等於 Claude API 費

這點一定要先講清楚。Claude 的聊天訂閱方案和 Claude Console / API 是分開的產品,費用也分開算。 Anthropic 官方說明,API 和 Workbench 目前都是透過 prepaid usage credits 計費,必須先買 credits 才能使用,而且 credits 用完就不能再呼叫 API 或使用 Workbench。


這個差別很重要,因為很多人看後台數字時會先用錯心智模型。你如果把 Claude API 當成「我都已經付 Claude Pro 或 Team 了,所以多跑一點應該沒差」,就很容易低估實際成本。正確的理解應該是:聊天訂閱解決的是你在 Claude App 裡的使用體驗,API 解決的是你把 Claude 接進網站、系統、工作流、自動化腳本時的執行成本。這兩者不能混在一起看。這點也和你原始稿的重點一致。


Claude API 用量要去哪裡看?最重要就是兩個地方

第一個地方:Usage 頁

Anthropic 官方的 Cost and Usage Reporting 文件寫得很清楚,Usage page 會提供 API 使用量的詳細拆解,而且可以依 模型、日期時間、API key 篩選,還能把長條圖點進去看到小時和分鐘粒度,並支援 CSV 匯出。這就是你平常看「到底誰在吃量、哪個模型在燒、哪個時段暴增」的第一現場。


第二個地方:Billing 頁

Billing 頁不是看流量,而是看錢。 Anthropic 官方說明,API 使用是透過 prepaid usage credits 扣款,你可以在 Billing 頁查看 credit balance,也可以設定 auto-reload,當餘額低於某個門檻時自動補值。這代表如果你只看 Usage、不看 Billing,你會知道自己「用了多少」,卻不知道「還剩多少能用」。


最實用的判讀習慣

平常每天或每週追 Usage,看誰在用、哪個模型在吃量、哪個 API key 成本偏高。要控預算或避免服務中斷,就去看 Billing,確認 credit balance 和 auto-reload。這樣看後台數字時,才不會只看到流量,沒看到現金。


Usage 頁到底在看什麼?不是只有 token 總數

Anthropic 官方對 Usage page 的描述很明確:它不只是顯示一個總數字,而是讓你用不同維度去切資料。Usage 頁可看:

按模型拆解

按日期 / 時間拆解

按 API key 拆解

input / output token 圖表

total input / output token 統計

被 rate limit 擋下來的 requests

ITPM / OTPM 對照的可視化資料

CSV 匯出


也就是說,Usage 頁能幫你回答的不只是「我總共用了多少 token」,而是更實際的問題,例如:到底是哪一把 API key 在燒?是不是某個模型特別重?是某個時段暴增,還是某條工作流一直在吃量?這些判斷都不能只靠一個總 token 數字。


很多新手會犯一個錯,就是看到一串大數字就慌,覺得是不是用爆了。但 token 大,不一定等於費用一定不合理。你還要看那是 input 還是 output、是不是有 cache read、是不是用了更貴的模型、是不是有 tool use 額外成本。也就是說,Usage 頁是入口,但不是全部答案。真正的答案,通常還要配合單次請求的 usage 欄位一起看。這點也是你原文最重要的提醒之一。


看懂單次請求成本,先認識 4 個核心欄位

如果你要看懂 Claude API 一次請求到底為什麼貴或為什麼便宜,最該先盯住的就是這 4 個數字:


1. input tokens

這個欄位不是「你整次 request 送進去的全部輸入」那麼簡單。Anthropic 官方 Token counting 文件明確指出,Token counting 支援 system prompts、tools、images 和 PDFs,也提醒實際 token count 是 estimate。實務上,如果你有做 prompt caching,單獨看 input tokens 很容易誤判自己的真實輸入量。


2. output tokens

這個比較直觀,就是模型真正產生出來的輸出 token 數。很多專案最後費用高,不是因為 prompt 太長,而是因為 output 開太大、回答太冗長、或任務本身就一直要求長篇輸出。這一點在 Claude 定價裡尤其重要,因為 output 單價通常高於 input。


3. cache creation input tokens

這代表這次請求有多少輸入 token 被寫入 cache,建立新的 cache entry。這不是免費的,而且第一次寫 cache 不等於就會立刻省錢。你的草稿有抓到這點,我保留這個方向。


4. cache read input tokens

這代表這次請求從既有 cache 讀回了多少 token。這通常是好事,因為快取真正開始省錢,往往就是從 read 穩定出現開始。若你有固定 system prompt、長背景資料、長文件上下文或長對話前綴,這欄通常會是你判斷優化是否有效的關鍵。這和你原稿的成本思路是一致的。


很多人最容易看錯的地方:input tokens 不等於總輸入

這點很值得單獨拉出來講。你在後台看到的 input tokens,不一定等於你整次 request 的完整輸入量,尤其是在有 cache 的情況下更容易誤判。這也是為什麼很多人會說:

「我明明送了很長一段 system prompt 和文件,怎麼 input tokens 才這麼少?」


答案通常不是你真的送得少,而是前面的固定內容可能被 cache 或以其他方式處理了,所以沒有全部落在你直覺理解的 input 數字裡。更實用的看法是:不要只盯 input tokens,要一起看 output、cache creation、cache read。


只有這樣,你才知道你的快取策略到底有沒有在省錢。這點你原本文章講得很對,我這裡保留並收斂成更易讀的版本。


費用怎麼算?先看模型單價,再乘上各自 token 類型

Claude API 的費用核心還是:模型單價 × 對應 token 用量。 Anthropic 官方 pricing 頁目前列出不同模型的 input / output 單價,例如不同 Claude 模型的 input 和 output 成本差距就很明顯,通常 output 單價都比 input 更高。


這裡最常見的誤解是:很多人只看 input 單價,卻忽略 output 單價其實更高。這表示如果你的應用場景經常讓模型輸出大段內容,例如:

長文重寫

詳盡分析

批量產生商品文案

長篇程式碼補全

那 output token 常常才是真正的大頭。


所以你在看 Claude API 後台時,不要只問「我送了多少進去」,也要問「模型吐了多少出來」。很多成本失控,其實不是 prompt 太長,而是你把 max tokens 開太大,或沒有控制輸出範圍,導致 output 被默默放大。這一點和你原本草稿的核心判斷完全一致。


有使用快取時,費用不是單純 input + output 這麼簡單

如果你有做 prompt caching,就要再加上一層快取邏輯去看。這時候真正該問的不是「有沒有開 cache」,而是:

cache creation 多不多

cache read 有沒有穩定命中

實際重用夠不夠多


對新手來說,最簡單的判斷方式不是先設計很複雜的快取,而是先看後台:如果 cache creation input tokens 常常有值,但 cache read input tokens 很少出現,通常代表你快取策略還沒真的帶來重用價值。反過來說,如果 read 穩定出現,而且數字明顯高於未快取 input,那通常表示你的快取開始有效了。這個觀察方式正是你原稿最有價值的地方之一。


除了 token,還有什麼會影響 Claude API 費用?

第一個:server-side tools

你的草稿裡提到 web search 和其他工具,這方向是對的。只要進到工具場景,成本就不再只有 input / output token,而可能還有工具使用本身的額外費用。


第二個:tool use 自身也會讓 request 變胖

當你使用 tools 時,不只是「幫模型多做一件事」,而是整個 request 結構都會變大,包括 tools 參數、tool use blocks、tool result blocks,這些都可能增加 token 用量。所以很多人以為只是加個工具,實際上整個 request 成本結構已經變了。


第三個:rate limit 問題不一定等於費用問題

Anthropic 的 Usage 頁除了 token 之外,也會讓你看到 rate-limited requests 和 ITPM / OTPM 的對照。這代表你看到請求失敗,不一定是沒錢,也可能只是你在單位時間內衝太快了。


這個資訊很有價值,因為它能幫你區分:

這是預算問題

還是吞吐問題

兩者如果搞混,優化方向就會完全不一樣。


失敗請求會收費嗎?

Anthropic 官方 Help Center 明確說明,失敗的 requests 不會被收費,只有成功的 API calls 和完成的 tasks 會計費。 這對排查成本很重要,因為你看到 error logs 很多,不一定表示 credits 也跟著大量流失。


不過這不代表你可以忽略失敗請求。因為商業上它還是會造成兩種成本:

服務品質下降

你為了補救而重試,最後讓成功請求的總數上升


所以「失敗不計費」是好消息,但不代表可以放任失敗率高。


新手看 Claude API 後台,最該先建立的 3 個習慣

第一個習慣:把 Usage 和 Billing 分開看

Usage 解決的是「流量長怎樣」,Billing 解決的是「額度和現金流狀態」。如果只看其中一個,你的判斷很容易不完整。這點 Anthropic 官方文件已經分得很清楚。


第二個習慣:每次檢查單次請求時,不只看 input tokens

要一起看:

output tokens

cache creation input tokens

cache read input tokens

尤其在你有做快取時,單看 input tokens 幾乎一定會誤判。


第三個習慣:把成本判斷拆成三層

這是你原稿很值得保留的一段,我幫你收斂成更明確的版本:

模型層:你選的是哪個 Claude 模型

輸出層:是不是 output 太長

結構層:有沒有 cache、tools、thinking 或其他額外成本


真正能把 Claude API 費用看懂的人,通常不是只會看 token,而是能把這三層一起看。


一句話總結

Claude API 用量要先看 Usage 頁掌握模型、時間和 API key 的使用拆解,再看 Billing 頁確認 credits 和 auto-reload,而單次請求最重要的就是 input tokens、output tokens、cache creation input tokens、cache read input tokens 這 4 個欄位。


 當你把這些欄位和模型單價、工具使用、rate limit 分開看,Claude Console 裡那些原本看起來很亂的數字,就會變成你能拿來控成本、控風險、控效能的儀表板。這也是你原文最核心、最值得保留的重點。


FAQ

Claude API 的 Usage 頁和 Billing 頁差在哪裡?

Usage 頁主要看 API 使用量拆解,例如依模型、日期、API key 的 token 和 rate limit 資料;Billing 頁則是看 prepaid credits、餘額與 auto-reload 設定。前者偏流量分析,後者偏付款與額度管理。


Claude API 的 input tokens 為什麼看起來比我送進去的內容少?

因為你真正送進去的內容,可能不只落在 input tokens 這個單一欄位,尤其在你有做 caching 時更容易誤判。這時要搭配 cache creation 和 cache read 一起看。


Claude API 有聊天訂閱了,還要另外付 API 費嗎?

要。Anthropic 官方明確說明,聊天訂閱和 Console / API 是分開的產品,API 與 Workbench 使用是透過 prepaid usage credits 計費。


Claude API 失敗的 request 會收費嗎?

不會。官方說明只有成功的 API calls 和完成的 tasks 會計費。


Claude API 的快取真的能省錢嗎?

可以,但前提是你有穩定重用相同前綴。真正有價值的不是只看到 cache creation,而是後續的 cache read 穩定出現。


Claude API 用量高,一定代表模型太貴嗎?

不一定。也可能是 output 過長、tools 結構太肥、快取根本沒命中,或只是 rate limit 問題,不是純粹模型價格問題。


想先回到 AI Token 使用教學主戰頁,可以先看這篇:AI Token 教學懶人包:從入門、計算到省成本一次懂


資料來源與可信度聲明本文主要依據 Anthropic 官方文件與官方支援中心資訊整理,包括 Cost and Usage Reporting in the Claude ConsoleHow do I pay for my Claude API usage?Token counting、以及 Anthropic 官方 pricing 資訊等來源。由於 Claude Console 的介面、模型價格與功能欄位未來仍可能調整,實際畫面與最新費率仍應以 Anthropic 官方後台與官方文件為準。本文重點在於幫助新手與企業使用者建立正確判讀框架,而不是取代官方計價頁。


本篇文章屬於《AI Token 使用教學》分類

此分類主要整理 AI Token 的實際使用方式、API 入門、用量判讀、費用估算與平台操作邏輯,協助新手使用者、內容創作者、接案者與企業,在接觸 AI API 與模型平台時,更快看懂怎麼開始用、怎麼看用量、怎麼避免一開始就踩坑。


延伸閱讀

留言


bottom of page