AI Token 跟額度差別是什麼?看懂平台常見三種說法
- 2天前
- 讀畢需時 7 分鐘

你在看 AI Token 相關平台時,常常會同時看到三種很像、但其實不是同一層的說法:Token、額度/配額、Credits/餘額。很多新手會把它們混成一件事,結果一看到價格頁、Billing 頁或後台 limits 頁就越看越亂。這種混淆很正常,因為 OpenAI、Google Gemini、Anthropic 都有用到這三類概念,但它們各自代表的意思並不一樣。你原本這篇抓到的問題點是對的。
先講最重要的結論:AI Token 不是額度,額度也不是 Credits。Token 比較像「模型實際處理了多少內容」;額度/配額比較像「你在某段時間內最多能用到什麼程度」;Credits/儲值餘額比較像「你帳上還有多少可拿來支付服務的預付金額」。這三者會互相影響,但不是同義詞。只要這個骨架先分清楚,後面看價格表、看用量、看平台限制,就會簡單很多。
先把三種常見說法一次分清楚
第一種:AI Token,是模型處理內容的單位
OpenAI 官方說得很直接,Token 是模型處理文字時的基本組成單位,可能短到一個字元,也可能長到完整單字,空格、標點和部分單字都會影響 Token 數量;非英文文本通常還會有比較高的 token 對字元比例。這代表 Token 本質上是在描述模型實際處理了多少內容,而不是在描述你帳上還有多少錢,或你今天還能發幾次請求。
這也是為什麼你在 API 價格頁上會看到 Input tokens、Output tokens、Cached tokens 這些欄位。它們都在回答同一件事:模型這次到底處理了多少資料。OpenAI 的說明把 input、output、cached tokens 視為 billing 與 usage tracking 的核心類別,Google Gemini 的 billing 文件也把 input token count、output token count、cached token count、cached token storage duration 列為計費基礎。
第二種:額度/配額,是平台限制你「最多能用多少」的規則
「額度」這個詞最容易有兩種意思。一種是技術額度/配額,例如每分鐘可以打多少請求、每分鐘多少 tokens、batch 最多排入多少 tokens。另一種是支出額度,例如每月最多能花多少。Gemini 官方 rate limits 頁直接列出不同 tier 的 RPM、TPM、RPD、Batch Enqueued Tokens;Claude 的官方文件則更清楚,把 limits 分成兩類:Spend limits 是每月最高 API 成本,Rate limits 是一定時間內最多可以發多少請求與 tokens。
換句話說,Token 比較像你今天實際開了多少公里;額度比較像高速公路規定你今天最多能跑多遠、每小時最多能開多快。兩者有關,但不是同一件事。你今天用了很多 Token,不代表你一定超過額度;你今天 Token 成本不高,也不代表你不會先撞到 RPM、TPM 或每月 spend limit。
第三種:Credits/儲值餘額,是你帳上可支付的預付金額
這個概念最容易被誤解成 Token。OpenAI 的 Service Credit Terms 寫得非常清楚:Service Credits 是可兌換 OpenAI 服務的 credits;Prepaid Service Credits 代表你為相應服務預先支付的金額;而且這些 credits 不是法定貨幣、不可退款、不可轉讓,且通常自購買或發放日起一年到期。更白話一點說,Credits 不是模型處理量,而是預先放在帳上的「可拿來扣款的金額」。
所以當有些平台或第三方服務商用「點數」「credits」「儲值額度」這些字眼時,很多時候講的並不是 Token,而是比較接近預付餘額或包套計價單位。這也是為什麼你會覺得它們都很像在講「額度」,但實際上層次不同:Token 是技術計量單位,額度是限制規則,Credits 是支付餘額。
為什麼平台上常常把這三種說法混在一起?
因為在實際使用時,它們會接成一條完整流程。
你發一個請求,模型會消耗 Token;這些 Token 會換算成費用;這個費用可能從你的 Credits/預付餘額裡扣掉,或記到你的 billing account;同時,你的請求也可能受到 RPM、TPM、batch 上限、每月 spend limit 之類的額度限制。Gemini 的 billing 與 rate limits 文件就是把 billing tier、billing account cap、tier upgrade 條件、rate limits 放在同一套邏輯裡講;Claude 也把 spend limits 與 rate limits 明確拆開。
對使用者來說,這些東西同時出現在後台,所以自然很容易混。但你在理解時最好把它們拆開。因為一旦混成一團,就會出現很典型的誤解,例如:
你還有 credits,為什麼不能用?答案可能是你撞到 rate limit。
你今天只發了幾次請求,為什麼費用還是很高?答案可能是單次請求 Token 很肥。
看懂平台常見三種說法:最實用的判斷方式
看到「Token」時,你該想到的是處理量
當平台寫 Input Tokens、Output Tokens、Cached Tokens、Token Count、Token Usage,你第一時間就應該想到:這在講模型實際處理了多少內容。這通常和 prompt 長度、上下文、輸出長度、檔案、工具、多模態內容有關,而不是在講你今天還剩多少次可用。OpenAI 與 Gemini 的官方說明都支持這種理解。
看到「額度/配額/Limits/Quota」時,你該想到的是邊界
如果你在頁面上看到 rate limits、spend limits、tier cap、quota、batch enqueued tokens,這通常是在講系統允許你最多使用到哪裡。Gemini 的 Rate limits 頁很典型,直接列出不同 tier 的 batch enqueued tokens;Claude 的 Rate limits 文件則把 spend 與 request 限制分開。這些都比較像使用邊界,而不是付款餘額。
看到「Credits/點數/儲值餘額」時,你該想到的是支付方式
如果平台說你有 available credit balance、prepaid credits、promo credits,通常是在講你帳上還能抵扣多少服務費,而不是在講模型已經處理了多少文字。OpenAI 的 Service Credit Terms 就是很清楚的官方例子。
最容易搞混的地方:額度不只一種
很多新手聽到「額度」,以為就是一種東西。其實不是。Gemini 就同時有 billing account cap、模型 rate limits、batch enqueued tokens;Claude 則同時有 spend limits、rate limits。也就是說,「額度」這個詞很常只是總稱,底下可能還分成:
請求額度Token 額度支出額度工作區額度批次排隊額度
如果你只看見「額度」這兩個字就以為自己懂了,很容易後面還是看不懂後台。更穩的方式是每次都先問一句:這裡講的額度,是限制我的次數、限制我的 Token,還是限制我的錢?
新手最常犯的 5 個誤解
第一個誤解:Token 就是額度
不是。Token 是模型處理量;額度是平台給你的邊界。你可能今天還有額度,但每次請求都很肥,所以 Token 成本很高;也可能你 Token 用量不算大,卻先撞到 RPM 或 tier 上限。
第二個誤解:Credits 就是 Token
不是。Credits 比較接近預付餘額。OpenAI 官方明確說 Service Credits 是可兌換服務的 credits,不是貨幣,也不是模型處理量。
第三個誤解:我帳上有 credits,就不會被限
不一定。你可能仍會碰到 rate limits、usage tier 或 spend limits。Gemini 和 Claude 官方都把這些限制獨立出來。
第四個誤解:額度就是每月可花多少錢
有時是,但不一定。額度也可能是每分鐘幾次、每分鐘多少 input tokens、batch 可排多少 tokens。
第五個誤解:不同平台的這三種說法都差不多,所以可以互相套
概念可以參考,但細節不能直接套。OpenAI、Gemini、Claude 的後台結構和名詞對應都不完全相同。
如果你現在要開始看價格或後台,先用這個順序就夠了
先看 Token:知道這次模型處理量大不大。再看 額度/Limits:知道你會不會先撞到平台邊界。最後看 Credits/餘額:知道你帳上還有沒有可支付的預付金額。
這個順序的好處是,你不會一開始就把所有數字混成一團。很多人後來覺得 AI API 很難,其實不是因為技術太深,而是因為一開始就把不同層的數字當成同一種東西在看。這個整理方式也和你原稿的主軸一致。
一句話總結
AI Token 跟額度差別是什麼?最簡單的答案就是:Token 是處理量,額度是限制,Credits 是可拿來支付的預付餘額。這三者會互相影響,但不是同義詞。只要先把這三層分開,你後面在看平台後台、API 成本、limits、配額和儲值頁時,就會比大多數新手更快進入狀況。
FAQ:新手最常問的 6 個問題
AI Token 和額度是不是同一件事?
不是。Token 比較像模型實際處理了多少內容;額度比較像平台規定你最多能用到哪裡。
Credits 和額度是一樣的嗎?
也不一樣。Credits 比較像你帳上的預付餘額;額度則是平台對請求、Token 或支出的限制。
我明明還有 Credits,為什麼還是不能用?
因為你可能先撞到 rate limits、usage tier 或 spend limits。帳上有餘額,不代表平台會無限制放行。
Gemini 裡的 tier 和額度是什麼關係?
Gemini 的 billing tier 會影響你能用到的模型、rate limits 和 billing account cap;不同 tier 對 batch enqueued tokens 也有不同上限。
Claude 的 spend limits 和 rate limits 差在哪?
Spend limits 是每月最多能花多少 API 成本;rate limits 是一定時間內最多能發多少請求與 tokens。
OpenAI 的 Service Credits 可以當現金嗎?
不行。OpenAI 官方明確說 Service Credits 不是法定貨幣、不可退款、不可轉讓,且通常一年後到期。
資料來源與可信度聲明
本文根據官方 Token、Billing、Rate limits 與 Service Credit 文件撰寫,重點參考 OpenAI:What are tokens and how to count them?、OpenAI Service Credit Terms、Gemini API Billing、Gemini API Rate limits、Claude API Rate limits 等官方來源。內容以「官方定義 × 平台後台常見名詞 × 實際使用情境」三層方式整理,目的是幫讀者先把最容易混淆的三層概念拆開,而不是只背名詞。你提供的原始草稿方向也已納入這次重寫。
如果你想從入門一路看到更多延伸內容,可以直接前往 AI Token。
本篇文章屬於《AI Token 入門》分類
此分類主要整理 AI Token、模型差異、平台選型、API 計費與新手常見觀念,幫助讀者從看懂名詞,進一步走到看懂價格、用量、限制與平台規則差異。



留言