top of page

一個中文字會用多少 Token?ChatGPT、Claude、Gemini 差異比較

  • 4月14日
  • 讀畢需時 6 分鐘
中文 Token 消耗換算與平台比較:圖解『一個中文字等於多少 Token』的跨平台差異,具體標示出 Gemini (約 0.5 Token)、ChatGPT (約 0.8 Token) 與 Claude (約 1.0 Token) 的計量轉換率,協助開發者精算中文情境下的 API 成本

很多人在開始算 AI Token 成本時,最常冒出的問題不是整篇文章幾 token,而是更直覺的一句話:一個中文字到底會用多少 token?


先直接講結論:沒有三家平台都通用、固定不變的「每個中文字 = 幾個 token」公式。因為 ChatGPT、Claude、Gemini 各自有不同的 tokenization 規則,而且官方也都比較傾向提供 token counting 工具或 API,而不是直接承諾「中文每字一定是多少 token」。


OpenAI 明講非英文常常會有更高的 token-to-character ratio;Gemini 則給出「約 1 token = 4 個字元」的官方粗估;Claude 官方重點則是提供先算 token 的 Count Tokens API,並提醒結果應視為 estimate


先看表格:一個中文字大概會用多少 Token?

下面這張表我分成兩欄看:一欄是 官方明講到什麼程度,另一欄是 拿來做成本預估時可用的保守區間。其中「保守區間」是根據官方文件的方向去做的實務估算,不是官方保證值。

平台

官方能確認的說法

拿來估中文時可抓的區間

怎麼看比較實用

ChatGPT / OpenAI

英文約 1 token ≈ 4 characters非英文通常會有更高的 token-to-character ratio;有官方 Tokenizer 與 token counting 可測。

約 0.8~2.0 token / 1 個中文字

中文不要套英文 4 字元 = 1 token 的算法,OpenAI 官方已明講非英文常常更高。做預算時抓 1 字 ≈ 1 token 左右 會比較保守。

Claude / Anthropic

官方沒有直接給「每個中文字幾 token」的固定公式;提供 Count Tokens API,且結果是 estimate。支援 system、tools、images、PDF。

約 0.8~2.0 token / 1 個中文字

Claude 最穩的做法不是背公式,而是直接先跑官方 count tokens。做粗估時,可先用和 OpenAI 類似的保守區間。

Gemini / Google

官方寫得最明確:For Gemini models, a token is equivalent to about 4 characters。另有 Count Tokens API。

約 0.25~1.0 token / 1 個中文字

如果完全照官方粗估去理解,會接近 4 字元 ≈ 1 token;但正式計價仍建議用 Count Tokens API,不要只靠字數。

為什麼我給的是區間,不是單一數字?

因為這個主題最容易出錯的地方,就是把 token 當成字數

OpenAI 官方說得很清楚,token 可以短到一個字元,也可以長到一整個單字;而且非英文常常會有比較高的 token-to-character ratio。這就代表,同樣是中文句子,遇到不同平台、不同模型、不同格式時,結果本來就可能不一樣。


Claude 這邊則是另一種提醒方式:它沒有直接給你「中文每字幾 token」這種固定公式,而是直接提供 Count Tokens API,並且明講結果應視為 estimate。這其實就已經在告訴你,官方自己也不把這件事當成死公式


Gemini 官方相對比較大方,直接給出 1 token 約等於 4 個字元的說法,但它同時也提供 count_tokens 和 usage_metadata,表示在真正要看成本時,官方標準仍然是「實際計數」,不是只靠心算。


如果你只是想快速抓成本,怎麼估最實用?

ChatGPT:先抓 1 個中文字約 1 token,上下浮動

如果你現在只是做 SEO 文章、客服稿、摘要內容的預估,ChatGPT / OpenAI 我會建議先抓:

寬鬆估法:1 字 ≈ 0.8 token

保守估法:1 字 ≈ 1~1.5 token

極保守抓法:1 字 ≈ 2 tokens


這樣抓的原因,是 OpenAI 官方明講非英文通常更高,所以中文不適合照英文公式算。


Claude:沒有固定每字公式,最穩就是先 count

Claude 這邊我不建議你硬背「每個中文字幾 token」。如果只是前期抓預算,可以先用和 ChatGPT 類似的保守區間:

約 0.8~2.0 token / 字


但只要你進入正式上線、正式成本控管,最穩的做法還是直接用 Claude 官方 token counting。因為官方自己就講了,那個結果是 estimate,而且支援 system、tools、圖片、PDF,代表很多額外結構也會一起影響結果。


Gemini:可以先用「4 個字元約 1 token」去反推

Gemini 是這三家裡最適合先做粗估的,因為 Google 官方直接寫:

1 token ≈ 4 characters


如果你先把「1 個中文字 = 1 個字元」當成最粗的理解,那會變成:

1 個中文字 ≈ 0.25 token


但實務上我不會建議你真的只抓到這麼低,因為 prompt 還有格式、system、上下文、API 包裝等因素。所以在規劃上,你可以這樣抓:

理想粗估:0.25~0.5 token / 字

較安全估法:0.5~1 token / 字

這樣會比死背「四個中文字一個 token」更安全。


真正影響「每個中文字多少 Token」的,不只是文字本身

這篇最重要的地方,其實不是表格,而是下面這件事:

你最後真正付費的 token,通常不是只有正文那幾個中文字。


System prompt 也會算

OpenAI 的 token counting API 和 Claude 的 count tokens 都是用接近正式 request 的結構去算,這代表 system prompt 本來就會影響 token。


歷史對話也會算

Gemini 官方的 usage_metadata、OpenAI 的 conversation token counting,都表示上下文不是免費附送的。你對話越長,累積的 token 通常越高。


Tools、圖片、PDF 也會算

Claude 官方直接寫明 token counting 支援 tools、images、PDF;Gemini 也寫了所有 input / output,包括非文字內容,都會被 tokenized。

所以你如果只是問「一個中文字多少 token」,那個答案最多只能幫你做 非常粗的文字預算。一旦你進入 API 真實使用,真正該看的還是整份 request。


如果你是做 AI Token 成本控管,最建議怎麼抓?

最實用的做法不是追求一個神奇公式,而是把估法分兩層。


第一層:前期規劃用區間

你可以先這樣抓:

平台

前期規劃建議值

ChatGPT / OpenAI

1 個中文字先抓 1 token

Claude

1 個中文字先抓 1 token

Gemini

1 個中文字先抓 0.5 token

這組數字不是在追求絕對精準,而是在做 預算上限規劃時比較不容易失手。這是根據三家官方文件能確認的方向做的保守化估算。


第二層:正式上線前用官方 count tokens

真正要準,還是應該:

OpenAI 用官方 tokenizer / token counting。

Claude 用 Count Tokens API。

Gemini 用 count_tokens。

這樣比你用字數換算可靠太多。


結論:這篇最值得記住的 3 句話

第一,一個中文字沒有跨平台固定 token 數

ChatGPT、Claude、Gemini 不會共用同一套「每字幾 token」標準。


第二,OpenAI 和 Claude 比較不適合硬背每字公式

OpenAI 只明講英文粗估與非英文較高比率;Claude 則更直接走 count tokens 路線。


第三,Gemini 最適合先做字元粗估,但正式還是要 count

Google 官方確實給了 1 token ≈ 4 characters,但正式成本仍建議看 Count Tokens API。


FAQ

一個中文字一定等於 1 token 嗎?

不一定。不同平台、不同模型、不同 request 結構都可能讓結果不同。OpenAI 官方明講非英文通常有更高的 token-to-character ratio;Claude 與 Gemini 也都提供官方 token counting 機制,而不是保證固定每字數值。


哪一家最適合用「每字估 token」?

Gemini 最適合先做粗估,因為 Google 官方直接寫了 1 token 約等於 4 個字元。但正式計算還是要用 count_tokens。


ChatGPT 的中文 token 為什麼常常比想像中高?

因為 OpenAI 官方已明講,非英文文本通常會有較高的 token-to-character ratio,所以中文常常不能套英文的 4 characters = 1 token。


Claude 為什麼不直接給每個中文字多少 token?

因為 Anthropic 官方做法是直接提供 Count Tokens API,而且明講結果應視為 estimate。這代表官方本身就不鼓勵你把 token 當成固定字數公式來背。


資料來源與可信度聲明

本文主要參考 OpenAI 官方 Token 說明Claude 官方 Token Counting 文件 與 Gemini 官方 Token 說明,作為整理 「一個中文字大概會用多少 Token」 這個主題的主要資料來源。因為三家平台對 token 的切分方式本來就不同,官方也沒有提供一個可跨平台通用、固定不變的「每個中文字一定等於幾個 token」公式,所以這篇文章會把 官方明講的部分 和 實務上可拿來做預估的區間 分開寫,避免把估算值誤當成固定規則。



想更快看懂 模型、平台與成本差異,也可以先回到 AI Token 看完整整理。


本篇文章屬於 《AI Token 計算》 分類。

此分類主要整理 AI Token 怎麼算、輸入與輸出差異、不同模型或平台的 token 消耗邏輯、字數與 token 的換算誤區、後台用量判讀與成本控制觀念,幫助剛接觸 AI API 的使用者,不只知道 token 會影響價格,也能進一步理解 為什麼同樣是中文內容,在不同平台可能會算出不同 token。


延伸閱讀

留言


bottom of page