top of page

GPT Token 計費怎麼看?新手先看懂重點就夠了

  • 4月8日
  • 讀畢需時 9 分鐘
GPT Token 計費方式與成本結構解析:圖解 API 總費用的計算流程,統整輸入 (Input)、輸出 (Output) 以及能有效降低成本的『快取命中』機制如何影響最終花費

如果你最近開始研究 OpenAI API,應該很快就會看到這些詞:GPT Token、Input、Output、Cached Input、每百萬 Token、Usage、Billing、Rate Limit。


很多新手一看到就先頭痛,因為表面上每個字都像中文,合在一起卻很像天書。更麻煩的是,只要一搞不清楚 GPT Token 計費怎麼看,就很容易發生兩種事:不是高估成本不敢用,就是低估成本,結果月底才發現帳單怪怪的。你提供的原始草稿,核心問題抓得很準。


這篇文章就是為了幫你把這件事一次講清楚。你不需要一開始就變成 API 成本專家,也不需要先把所有官方定價頁背起來。

對新手來說,真正重要的是先看懂幾個最核心的觀念:GPT Token 是怎麼算、OpenAI API 到底在收什麼、哪些數字最需要先看、以及如何用最簡單的方法估一筆請求大概多少錢。


OpenAI 官方定價頁明確把 GPT-5.4 系列的費用拆成 input、cached input 與 output 三類,並以每 1M tokens 列價;OpenAI 的 token 說明也明確指出,token 是模型處理文字的基本單位,不是單純等於字數。


如果你想先從站內主題入口開始,也可以先看AI Token


GPT Token 計費不是看你問幾次,而是看你總共丟了多少內容、模型回了多少內容

很多新手直覺會以為,GPT API 的收費邏輯像一般軟體一樣,是按次數、按月費,或按某種固定方案收費。但 OpenAI API 定價不是這樣。


OpenAI 官方 API Pricing 頁面顯示,GPT 模型主要是依照 token 用量來計費,而且通常拆成三個部分:Input、Cached input、Output。以 OpenAI 目前官方列出的 GPT-5.4 為例,價格是 input 2.50 美元/100 萬 token、cached input 0.25 美元/100 萬 token、output 15.00 美元/100 萬 token;GPT-5.4 mini 與 GPT-5.4 nano 則更便宜。


也就是說,你不是在為「發了一次請求」付錢,而是在為下面這幾件事付錢:

你送進去多少內容模型實際讀了多少內容模型回給你多少內容

所以當你問「GPT Token 計費怎麼看」,真正要學的不是死記價格表,而是先學會分辨:哪一段是 input,哪一段是 output,哪一段可能是 cached input。


為什麼新手最容易看錯

因為很多人只盯著模型名稱,看到 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano,就把注意力放在「哪個比較強」。但實際上,對成本最有感的,常常不是模型名字,而是 input、output 和 cached input 這三欄怎麼收。


先搞懂邏輯,比背價格更重要

只要你先理解 API 是按內容量計費,而不是按提問次數或聊天回合計費,後面很多數字就會變得比較容易讀。


GPT Token 是什麼?先搞懂這個,後面才看得懂計費

OpenAI 官方幫助文件對 token 的定義很清楚:token 是模型處理文字時的基本單位,可以短到一個字元,也可以長到一整個單字,會依語言和上下文而不同。官方還提供一個粗略估算:1 token 大約等於 4 個字元,或大約 0.75 個英文單字;100 tokens 大約是 75 個英文單字。


這代表兩件很重要的事:第一,token 不是字數。第二,不同語言的成本感會不一樣。也因此,如果你看到官方價格是「每 1M tokens」,不要直接把它理解成「每 100 萬字」。這是很多新手第一個會踩的坑。


Token 不是單純的字數換算

你不能簡單用「我只寫了幾百字」去估成本,因為模型在底層看的不是字數感,而是 token 切分結果。英文、中文、標點、格式,甚至結構化輸出都可能影響 token 數。


這也是為什麼 GPT Token 計費看起來比較抽象

因為它不是照人類直覺的字數收費,而是照模型真正處理內容的單位收費。


GPT Token 計費最先要看懂的 3 個欄位

對新手來說,先看懂下面 3 個就夠了:

輸入 Token快取輸入 Token輸出 Token


輸入 Token 是什麼

這是你送給模型的內容。包含你的 prompt、system 指令、對話上下文、附帶文字內容等。OpenAI 官方定價頁直接用 Input 來列價。GPT-5.4 系列都明確把 input 單價列出來。


快取輸入 Token 是什麼

這是 OpenAI 定價頁中特別列出的一種價格類型。當相同內容被快取後,某些情況下重新使用這些輸入時,價格會比一般 input 更低。GPT-5.4、GPT-5.4 mini、GPT-5.4 nano 的 cached input 價格,目前都明顯低於一般 input。


輸出 Token 是什麼

這是模型回給你的內容,也是很多新手最容易低估的成本來源。因為 OpenAI 官方定價頁上,GPT-5.4 系列的 output 單價都高於 input 單價。以 GPT-5.4 為例,output 是 15.00 美元/100 萬 token,而 input 是 2.50 美元/100 萬 token。


OpenAI GPT 計費頁面怎麼看?新手先看這 4 個重點

很多人第一次打開定價頁就眼神渙散,其實你不用一次全部看懂。新手先抓這 4 個重點就夠了。


第一,看模型名稱

OpenAI 官方定價頁會列出不同模型,例如 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano,還有即時語音、多模態與工具型模型。不同模型能力不同,價格也差很多。


第二,看 input 單價

這代表你送資料給模型大概要花多少。對文件摘要、RAG、長對話這類場景來說,這一欄很重要。


第三,看 output 單價

這通常是最值得注意的欄位,因為很多任務的成本大頭就在這裡。GPT-5.4、GPT-5.4 mini、GPT-5.4 nano 都是 output 高於 input。


第四,看是不是按 1M tokens 計價

OpenAI 官方現在的 API 定價頁是以每 100 萬 tokens 為單位列價。這不代表你一定要用到 100 萬 token 才會收費,而是按比例換算。


新手最常搞混的地方:每 1M tokens 不代表你要先買到 100 萬 token

OpenAI 官方定價頁寫的是「US$X / 1M tokens」,這只是方便閱讀的大單位,不代表你一定要先湊到 100 萬 token 才開始計費。它真正的意思比較像是:如果你今天用了 10 萬 token,就大約是 1M 價格的十分之一;如果你今天用了 1 萬 token,就大約是 1M 價格的百分之一。這是定價格式本身就能直接推導出的比例邏輯。


為什麼這件事很重要

因為很多新手看到「每百萬」就先嚇到,以為自己離那個單位很遠,所以現在不用管。但實際上,只要你在跑 API,每一次請求都在累積。


你真正該學會的是比例感

不用先背很細的數學,只要知道這是比例型費率,你之後估成本就會順很多。


GPT Token 計費怎麼估?新手先學最簡單的算法就好

你不用一開始就做超精準估算,新手先會這種粗抓法就很夠用了。

本次費用大約等於:輸入 token × input 單價加上輸出 token × output 單價如果有快取命中,再把 cached input 另外算進去。


用最簡單的例子理解

假設某個模型 input 是 2.50 美元/1M,output 是 15.00 美元/1M,而你一次請求用了 2,000 input tokens、1,000 output tokens。那你就把 2,000 和 1,000 分別除以 1,000,000,再乘上對應單價。這種算法雖然簡單,但已經足夠幫你判斷一個任務大概是便宜、中等,還是輸出偏貴。


新手先學粗估,不用先追超精準

因為你現在最需要的不是財務報表等級的準確度,而是建立對 cost structure 的感覺。只要你先會分 input、output,後面自然會越抓越準。


新手先記住:GPT 計費不是只看 prompt,還要看上下文和回答長度

這一點真的很重要。很多人估價時只看自己輸入的 prompt,覺得「我這句很短,應該花不了多少吧?」但 OpenAI 官方文件也提到,輸出長度可以用 token 設定控制,而 token 概念本身代表模型會以 token 為單位去讀寫文字。


所以 GPT Token 計費至少要看 3 件事:

你這次送進去的 prompt 長不長你有沒有把前面很多輪對話一起帶進去你有沒有讓模型回太多字


多數新手真正低估的是上下文累積

不是 prompt 本身,而是上下文慢慢堆上去之後,input 就會跟著變肥。


Output 爆長也常常是主因

尤其是你要求詳細說明、完整分析、一步一步解釋時,output 常常才是真正把費用拉高的地方。


Cached Input 是什麼?新手先知道它通常比較便宜就好

OpenAI 官方定價頁把 Cached input 單獨列出,代表它不是一般 input,而是命中快取後的輸入價格。對新手來說,不用第一天就深究快取架構,但你至少要先知道:如果你未來做的是重複性高、上下文常重用的應用,cached input 可能會影響成本。GPT-5.4 系列目前的 cached input 都比一般 input 低很多。


新手現在最該先記住的版本

先記住一句就夠了:同樣的輸入,如果走快取,有些情況下會更便宜。


什麼場景之後會用到這個觀念

像長 system prompt、重複帶入規則、固定模板、反覆使用同一大段背景,這些場景後面都可能和 cached input 有關。


GPT Token 計費頁除了價格,還要注意什麼

除了價格,新手還應該一起看這兩個東西:模型限制,以及 rate limits。


模型限制

OpenAI 模型頁會列出上下文長度、最大輸出 token、知識截止時間等資訊。這些限制會直接影響你的任務怎麼設計。你不是只看價格就夠了,還要看模型撐不撐得住你的場景。


Rate limits

OpenAI 也有獨立的 rate limits 文件,說明 API 對請求頻率和存取有一定限制。這不一定直接影響單次費用,但會影響你能不能穩定大量呼叫。對做產品或自動化的人來說,這同樣重要。


新手最常犯的 7 個 GPT Token 計費錯誤

很多新手一開始不是不認真,而是很容易在相同地方搞錯。


第一,只看 input 不看 output

但 OpenAI 官方目前的 GPT-5.4 系列價格結構很明顯,output 單價高於 input。


第二,以為 token 等於字數

OpenAI 官方說得很清楚,token 不是直接等於字數。


第三,以為每 1M tokens 是最低消費門檻

不是,那只是價格單位。


第四,不知道上下文也要算錢

前面對話如果一起送進 API,也是在消耗 input tokens。這是很多人會忽略的地方。


第五,不控制輸出長度

OpenAI 官方文件本來就把控制輸出長度當成重要設定之一,因為這會直接影響成本。


第六,一開始就用最貴模型

OpenAI 同時列出 GPT-5.4、mini、nano,本來就代表不同任務不一定都需要最高階。


第七,只看模型名字,不看價格結構

模型強不強很重要,但你能不能長期用得下去,很多時候其實是價格結構決定的。


如果你是新手,GPT Token 計費最先該學會的其實不是算數,而是判斷題

與其一開始就拿計算機硬算每次幾美元,新手更該先學會判斷:

這次任務是不是 output 會很長這次是不是把太多上下文帶進去了這件事值不值得用高價模型我是不是可以先用 mini 或 nano 試這個任務能不能拆小一點


會判斷,比會背價格表更有用

因為你真正的成本感,不是來自背數字,而是來自你能不能看出哪些任務正在讓費用變高。


新手先學會這種成本直覺就夠了

只要你會判斷 output 會不會太長、上下文有沒有太肥,你的 GPT Token 計費理解就已經很有實戰價值了。


結論:GPT Token 計費先看懂 input、output、價格單位,就已經贏一半

很多新手會把 GPT Token 計費想得很可怕,好像要先會財務、會工程、會所有模型差異,才能真正看懂。其實不用。


對剛入門的人來說,你只要先看懂這幾件事:

token 是模型處理內容的單位價格通常拆成 input、cached input、outputoutput 常常比 input 更值得注意定價頁是按每 1M tokens 標價,但實際是比例換算


只要這些先弄懂,你之後不管是估成本、選模型、看用量、做平台比較,都會順很多。因為 GPT Token 計費最難的,從來不是數學本身,而是你要先知道自己到底該看哪個數字。這也和你原始草稿的收斂方向一致。


常見問題

GPT Token 計費到底看哪裡?

最直接就是看 OpenAI 官方 API 定價頁。新手先看模型名稱、input 價格、cached input 價格、output 價格這 4 個欄位就夠了。官方目前是以每 1M tokens 標價。


GPT 的 input 和 output 哪個比較貴?

不一定每個模型都一樣,但 OpenAI 官方目前列出的 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano 都是 output 單價高於 input。


1 token 等於多少字?

OpenAI 官方說明指出,token 依語言和上下文而不同。以英文粗略估算,1 token 約等於 4 個字元或 0.75 個英文單字,但這只是近似值,不是固定換算。


每 1M tokens 是不是代表我至少要用到 100 萬 token 才會收費?

不是。這只是定價單位,實際費用是按比例換算。你用了 1 萬、10 萬、50 萬 token,都會照比例計費。


Cached input 是什麼意思?

這是 OpenAI 官方定價頁列出的另一種輸入價格類型。對新手來說,先知道它通常比一般 input 便宜就夠了,常見於重複使用快取內容的場景。


新手要先用最強 GPT 模型嗎?

通常不用。OpenAI 官方同時提供旗艦模型與 mini、nano,代表不同任務有不同成本層級。新手先用較低成本模型理解流程,通常更實際。


資料來源與可信度聲明

本文根據 OpenAI 官方定價與開發者文件整理撰寫,主要參考 OpenAI API 定價頁OpenAI API Pricing DocsWhat are tokens and how do I count them?Text generation guideRate limits 等官方資料。本文以「官方定價頁 × Token 基本概念 × 新手成本判讀」三層方式整理,優先採信原廠公開資訊,協助讀者快速建立可操作、可驗證的 GPT Token 計費理解。你提供的原始草稿重點也已納入這次重寫。



本篇文章屬於《AI 模型比較》分類

此分類專門整理不同 AI 模型之間的能力、價格、用途與接法差異,內容包含模型比較、定價結構、平台差異與新手最常遇到的選型問題,幫助讀者在不同模型文章之間快速看懂每一篇真正比較的是什麼。


延伸閱讀

bottom of page