一個中文字會用多少 Token?ChatGPT、Claude、Gemini 差異比較
- 4月14日
- 讀畢需時 6 分鐘

很多人在開始算 AI Token 成本時,最常冒出的問題不是整篇文章幾 token,而是更直覺的一句話:一個中文字到底會用多少 token?
先直接講結論:沒有三家平台都通用、固定不變的「每個中文字 = 幾個 token」公式。因為 ChatGPT、Claude、Gemini 各自有不同的 tokenization 規則,而且官方也都比較傾向提供 token counting 工具或 API,而不是直接承諾「中文每字一定是多少 token」。
OpenAI 明講非英文常常會有更高的 token-to-character ratio;Gemini 則給出「約 1 token = 4 個字元」的官方粗估;Claude 官方重點則是提供先算 token 的 Count Tokens API,並提醒結果應視為 estimate。
先看表格:一個中文字大概會用多少 Token?
下面這張表我分成兩欄看:一欄是 官方明講到什麼程度,另一欄是 拿來做成本預估時可用的保守區間。其中「保守區間」是根據官方文件的方向去做的實務估算,不是官方保證值。
平台 | 官方能確認的說法 | 拿來估中文時可抓的區間 | 怎麼看比較實用 |
ChatGPT / OpenAI | 英文約 1 token ≈ 4 characters;非英文通常會有更高的 token-to-character ratio;有官方 Tokenizer 與 token counting 可測。 | 約 0.8~2.0 token / 1 個中文字 | 中文不要套英文 4 字元 = 1 token 的算法,OpenAI 官方已明講非英文常常更高。做預算時抓 1 字 ≈ 1 token 左右 會比較保守。 |
Claude / Anthropic | 官方沒有直接給「每個中文字幾 token」的固定公式;提供 Count Tokens API,且結果是 estimate。支援 system、tools、images、PDF。 | 約 0.8~2.0 token / 1 個中文字 | Claude 最穩的做法不是背公式,而是直接先跑官方 count tokens。做粗估時,可先用和 OpenAI 類似的保守區間。 |
Gemini / Google | 官方寫得最明確:For Gemini models, a token is equivalent to about 4 characters。另有 Count Tokens API。 | 約 0.25~1.0 token / 1 個中文字 | 如果完全照官方粗估去理解,會接近 4 字元 ≈ 1 token;但正式計價仍建議用 Count Tokens API,不要只靠字數。 |
為什麼我給的是區間,不是單一數字?
因為這個主題最容易出錯的地方,就是把 token 當成字數。
OpenAI 官方說得很清楚,token 可以短到一個字元,也可以長到一整個單字;而且非英文常常會有比較高的 token-to-character ratio。這就代表,同樣是中文句子,遇到不同平台、不同模型、不同格式時,結果本來就可能不一樣。
Claude 這邊則是另一種提醒方式:它沒有直接給你「中文每字幾 token」這種固定公式,而是直接提供 Count Tokens API,並且明講結果應視為 estimate。這其實就已經在告訴你,官方自己也不把這件事當成死公式。
Gemini 官方相對比較大方,直接給出 1 token 約等於 4 個字元的說法,但它同時也提供 count_tokens 和 usage_metadata,表示在真正要看成本時,官方標準仍然是「實際計數」,不是只靠心算。
如果你只是想快速抓成本,怎麼估最實用?
ChatGPT:先抓 1 個中文字約 1 token,上下浮動
如果你現在只是做 SEO 文章、客服稿、摘要內容的預估,ChatGPT / OpenAI 我會建議先抓:
寬鬆估法:1 字 ≈ 0.8 token
保守估法:1 字 ≈ 1~1.5 token
極保守抓法:1 字 ≈ 2 tokens
這樣抓的原因,是 OpenAI 官方明講非英文通常更高,所以中文不適合照英文公式算。
Claude:沒有固定每字公式,最穩就是先 count
Claude 這邊我不建議你硬背「每個中文字幾 token」。如果只是前期抓預算,可以先用和 ChatGPT 類似的保守區間:
約 0.8~2.0 token / 字
但只要你進入正式上線、正式成本控管,最穩的做法還是直接用 Claude 官方 token counting。因為官方自己就講了,那個結果是 estimate,而且支援 system、tools、圖片、PDF,代表很多額外結構也會一起影響結果。
Gemini:可以先用「4 個字元約 1 token」去反推
Gemini 是這三家裡最適合先做粗估的,因為 Google 官方直接寫:
1 token ≈ 4 characters
如果你先把「1 個中文字 = 1 個字元」當成最粗的理解,那會變成:
1 個中文字 ≈ 0.25 token
但實務上我不會建議你真的只抓到這麼低,因為 prompt 還有格式、system、上下文、API 包裝等因素。所以在規劃上,你可以這樣抓:
理想粗估:0.25~0.5 token / 字
較安全估法:0.5~1 token / 字
這樣會比死背「四個中文字一個 token」更安全。
真正影響「每個中文字多少 Token」的,不只是文字本身
這篇最重要的地方,其實不是表格,而是下面這件事:
你最後真正付費的 token,通常不是只有正文那幾個中文字。
System prompt 也會算
OpenAI 的 token counting API 和 Claude 的 count tokens 都是用接近正式 request 的結構去算,這代表 system prompt 本來就會影響 token。
歷史對話也會算
Gemini 官方的 usage_metadata、OpenAI 的 conversation token counting,都表示上下文不是免費附送的。你對話越長,累積的 token 通常越高。
Tools、圖片、PDF 也會算
Claude 官方直接寫明 token counting 支援 tools、images、PDF;Gemini 也寫了所有 input / output,包括非文字內容,都會被 tokenized。
所以你如果只是問「一個中文字多少 token」,那個答案最多只能幫你做 非常粗的文字預算。一旦你進入 API 真實使用,真正該看的還是整份 request。
如果你是做 AI Token 成本控管,最建議怎麼抓?
最實用的做法不是追求一個神奇公式,而是把估法分兩層。
第一層:前期規劃用區間
你可以先這樣抓:
平台 | 前期規劃建議值 |
ChatGPT / OpenAI | 1 個中文字先抓 1 token |
Claude | 1 個中文字先抓 1 token |
Gemini | 1 個中文字先抓 0.5 token |
這組數字不是在追求絕對精準,而是在做 預算上限規劃時比較不容易失手。這是根據三家官方文件能確認的方向做的保守化估算。
第二層:正式上線前用官方 count tokens
真正要準,還是應該:
OpenAI 用官方 tokenizer / token counting。
Claude 用 Count Tokens API。
Gemini 用 count_tokens。
這樣比你用字數換算可靠太多。
結論:這篇最值得記住的 3 句話
第一,一個中文字沒有跨平台固定 token 數
ChatGPT、Claude、Gemini 不會共用同一套「每字幾 token」標準。
第二,OpenAI 和 Claude 比較不適合硬背每字公式
OpenAI 只明講英文粗估與非英文較高比率;Claude 則更直接走 count tokens 路線。
第三,Gemini 最適合先做字元粗估,但正式還是要 count
Google 官方確實給了 1 token ≈ 4 characters,但正式成本仍建議看 Count Tokens API。
FAQ
一個中文字一定等於 1 token 嗎?
不一定。不同平台、不同模型、不同 request 結構都可能讓結果不同。OpenAI 官方明講非英文通常有更高的 token-to-character ratio;Claude 與 Gemini 也都提供官方 token counting 機制,而不是保證固定每字數值。
哪一家最適合用「每字估 token」?
Gemini 最適合先做粗估,因為 Google 官方直接寫了 1 token 約等於 4 個字元。但正式計算還是要用 count_tokens。
ChatGPT 的中文 token 為什麼常常比想像中高?
因為 OpenAI 官方已明講,非英文文本通常會有較高的 token-to-character ratio,所以中文常常不能套英文的 4 characters = 1 token。
Claude 為什麼不直接給每個中文字多少 token?
因為 Anthropic 官方做法是直接提供 Count Tokens API,而且明講結果應視為 estimate。這代表官方本身就不鼓勵你把 token 當成固定字數公式來背。
資料來源與可信度聲明
本文主要參考 OpenAI 官方 Token 說明、Claude 官方 Token Counting 文件 與 Gemini 官方 Token 說明,作為整理 「一個中文字大概會用多少 Token」 這個主題的主要資料來源。因為三家平台對 token 的切分方式本來就不同,官方也沒有提供一個可跨平台通用、固定不變的「每個中文字一定等於幾個 token」公式,所以這篇文章會把 官方明講的部分 和 實務上可拿來做預估的區間 分開寫,避免把估算值誤當成固定規則。
想更快看懂 模型、平台與成本差異,也可以先回到 AI Token 看完整整理。
本篇文章屬於 《AI Token 計算》 分類。
此分類主要整理 AI Token 怎麼算、輸入與輸出差異、不同模型或平台的 token 消耗邏輯、字數與 token 的換算誤區、後台用量判讀與成本控制觀念,幫助剛接觸 AI API 的使用者,不只知道 token 會影響價格,也能進一步理解 為什麼同樣是中文內容,在不同平台可能會算出不同 token。




留言