Input Token 跟 Output Token 差別是什麼？新手先看懂 AI 成本怎麼算

3月27日
讀畢需時 9 分鐘

已更新：4月20日

Input Token 與 Output Token 差異解析：圖解 AI 成本計費結構，對比輸入端（使用者提問、上下文與 System Prompt）與輸出端（AI 回答、生成程式碼）的資料傳遞與計算重點

很多人剛開始接觸 AI 模型 API 時，最常看到的兩個詞就是 Input Token 和 Output Token。這兩個名詞看起來很像技術用語，但其實概念不難，而且只要你開始用 AI API、接觸模型計費、想搞懂為什麼帳單比想像中高，你就一定要先弄懂它們。

先講最簡單的結論。Input Token，是你送進模型裡的內容；Output Token，是模型回傳給你的內容。也就是說，AI 成本通常不是只算你問了什麼，還會一起算模型回了多少。這也是很多新手第一次看計費頁時最容易忽略的地方：你不是只在為提問付錢，也在為回答付錢。

這篇文章的重點，不是教你換算字數，也不是講哪個模型比較便宜，而是幫你先把 Input Token 跟 Output Token 的差別看懂。因為只要這個基本概念沒有分清楚，後面不管你是在看 AI Token 計費、AI Token 成本、AI Token 怎麼算，還是企業導入時的 Token 管理，幾乎都會卡住。

如果你是第一次接觸這個主題，也可以先把這篇當成一篇基礎的 AI Token 概念文章來看。先看懂 Input 和 Output，後面再談成本、平台和模型差異，會比較容易串起來。

先用最白話的方式理解

你可以把 AI 模型想成一位收費顧問。你先把資料交給他看，像是你的問題、你的指令、你的文章內容、你的會議紀錄、你的程式碼、你的系統規則。這整段送進去給模型處理的內容，就是 Input。

接著模型看完之後，開始回答你，輸出一段結果。這段結果可能是回答內容、摘要、改寫後文案、分析報告、程式碼建議，或是 JSON 格式資料。這整段模型吐回來的內容，就是 Output。

一句話記住差別

Input Token 是你提供給 AI 的內容成本。Output Token 是 AI 回傳給你的內容成本。

為什麼這個差別很重要

因為很多人以為自己只是問了一句短短的問題，應該不會花多少錢，但實際上模型在處理時，看到的不一定只有那一句。背後可能還有系統規則、上下文、檢索內容、工具結果，而這些都會一起進到 Input 裡。後面模型再回一大段詳細答案，Output 也會一起計費。成本自然就可能比你想像中高很多。

Token 到底是什麼？不是字，也不是單字

在理解 Input 跟 Output 之前，先補一個很重要的觀念：Token 不完全等於字數，也不完全等於單字。它比較像是模型在處理文字時切分出來的最小計價單位。中文、英文、數字、符號、空格、標點，甚至特殊格式，都可能被切成不同數量的 Token。

所以你不能簡單理解成「我只打了 100 個字，所以一定就是 100 Token」。實際上的 Token 數量，還會受到語言、格式、標點、JSON 結構、程式碼內容和重複規則影響。

為什麼有些內容看起來不長，卻還是很燒 Token

因為模型看的不是你肉眼感覺到的字數，而是它實際切分後的 Token 數量。像是程式碼、表格、JSON、長規則、反覆出現的系統提示，常常都比你想像中更吃 Token。這也是很多人明明覺得自己問題不長，帳單卻還是偏高的原因。

這篇和「一個 AI Token 等於多少字」不一樣

這篇不是在回答一個 Token 大約等於多少中文字或英文單字，而是在回答計費結構裡的兩個角色差別。前者偏換算觀念，後者偏成本結構。兩篇可以互補，但主題不一樣。

Input Token 是什麼？

Input Token，就是你傳給模型的所有內容。很多新手以為 Input 只包含「使用者輸入的那一句話」，但實際上常常不只。只要是送進模型的東西，幾乎都算在 Input 裡。

在 API 或 AI 應用場景中，Input 可能包含使用者問題、System Prompt、Developer Prompt、前面幾輪對話、知識庫檢索結果、文件內容、工具回傳結果、輸出格式範例，以及指定回答規則。

真正送進模型的內容，常常比你看到的多

你表面上只打了一句「幫我整理這篇文章重點」，看起來很短。但如果背後還一起附上三千字文章、品牌語氣、輸出格式、範例段落和前面五輪對話，那這些全部都會算進 Input Token。

很多場景裡，最容易失控的反而是 Input

因為系統很容易把背景加越來越多。對話越來越長、知識庫塞越來越多、規則越貼越細、文件一次丟整份。這些都會讓 Input Token 不知不覺變大。所以很多企業在導入 AI 時，真正先該管的不是模型會不會回答太長，而是送進去的內容是不是已經過量。

Output Token 是什麼？

Output Token，就是模型回覆給你的內容。只要模型有產出文字，那些文字都會被算進 Output Token。你要求模型回得越長、越細、越完整，Output 成本通常就越高。

哪些情況會拉高 Output Token

像是要求模型詳細說明、列出所有可能性、完整分析、寫一篇長文、一步一步解釋，或輸出大量表格、清單、JSON，都很容易讓 Output Token 明顯增加。

不是每次都需要長答案

如果你的任務其實只需要一個方向判斷、一段短摘要，卻每次都讓模型產出很長的解說，那 Output 就很容易成為主要支出。這也是為什麼很多人後來會發現，指定回答長度其實是很實用的省成本方法。

Input 跟 Output，哪個比較貴？

這是很多新手第一次接觸 AI API 計費時最容易忽略的地方：很多模型的 Output Token 單價，會比 Input Token 更高。也就是說，同樣都是一千個 Token，模型回給你的那一千個 Token，可能比你送進去的一千個 Token 還貴。這種差異在 OpenAI、Anthropic 等供應商的官方定價頁都可以看到。

為什麼很多模型的 Output 會比較貴

因為生成內容本身，通常比單純讀取內容更耗資源。模型不是只在看資料，而是要一路預測、生成、組織完整回答，所以計價上常常把 Output 設得更高。

但這不代表 Input 就不重要

在很多真實工作流裡，使用者會不斷重複貼長文件、長對話、長規則，導致 Input 非常高。真正要看的，不是哪一邊絕對比較貴，而是你的應用場景偏向讀很多，還是寫很多。很多企業級情境兩邊都高，所以帳單才會升得這麼快。

新手最常搞錯的 3 件事

很多人第一次接觸 Input 和 Output 時，常常會在幾個地方搞混，而這些誤解剛好都會直接影響你對成本的判斷。

第一個誤解：以為只有提問那一句才算 Input

這是錯的。只要是送進模型的內容，幾乎都算 Input。背景說明、系統規則、歷史對話、知識庫內容，全部都有可能算進去。這也是為什麼你明明問得很短，成本卻不一定低。

第二個誤解：以為 AI 回答長一點沒差

這也是錯的。Output Token 一樣要算錢，而且很多模型的 Output 單價還比 Input 更高。如果你的任務不需要那麼長的輸出，卻每次都讓模型展開很多段內容，費用自然會被拉高。

第三個誤解：以為問題短就一定便宜

也不一定。因為如果你的應用背後還綁了一堆上下文、範例、文件、工具結果，即使表面問題很短，Input 還是可能非常大。

用一個簡單例子看懂

假設你今天想做一個 AI 客服助手。使用者只問一句：「請問你們有企業方案嗎？」這句話本身不長，但系統實際送進模型的內容可能包括客服角色設定、企業方案介紹文件、產品價格表、公司 FAQ、對話歷史紀錄和指定回答格式。

這一整包送進去的內容，都是 Input

也就是說，使用者眼裡只看到一句問題，但模型實際收到的內容可能遠比那一句多得多。這也是 API 帳單常常比前台感覺更高的原因。

模型回的那整段答案，就是 Output

如果模型回了一段完整回答，例如介紹企業方案差異、說明權限管理、API 整合和顧問支援方向，那這整段就是 Output。即使使用者只問一句，背後也可能同時發生 Input 很大、Output 也不小的情況，單次呼叫成本自然就不會太低。

為什麼企業更需要搞懂這件事？

對個人來說，Input 和 Output 的差別，可能只是影響每月花多少錢。但對企業來說，這其實是 AI 成本治理的核心。因為企業最常遇到的狀況，就是員工把整份文件直接丟進去、系統每次都附上完整歷史對話、檢索一次塞太多段落、模型被要求輸出超長報告，或每個流程都用最高規格回答。

企業最怕的不是單次高，而是規模化之後失控

單次看起來也許只是差一點點，但當同樣流程一天跑很多次、很多人一起用、很多部門一起導入時，Input 跟 Output 的設計差異就會被放大，最後變成總成本問題。

真正要管理的是流程，而不是只看模型單價

所以企業在導入 AI 時，不能只問哪個模型便宜，還要問：我們的 Input 是不是太長？我們的 Output 是不是過度生成？哪些流程可以縮短上下文？哪些任務根本不需要那麼長的回答？這才是更成熟的 AI Token 管理思維。

想省成本，Input 跟 Output 要怎麼優化？

懂了差別之後，下一步就是優化。Input 跟 Output 的省法不太一樣，但核心都一樣：不要讓模型處理超出任務所需的內容。

Input 的省法：不要丟多餘的東西進去

像是不要每次都附完整背景、不要重複貼相同規則、不要把整份文件都丟進去只為了問一個小問題、不要讓歷史對話無限累積，也不要一次塞太多檢索內容。只要把送進去的內容變精簡，Input 成本通常就會先下降。

Output 的省法：不要讓模型回超出需求的內容

像是指定回答長度、先要結論再決定要不要展開、先要摘要再針對部分深入、只要表格就不要額外解說、只要 JSON 就不要再附自然語言廢話。很多人以為省 Token 就是少用 AI，實際上更有效的方法通常是讓 AI 回得剛剛好。

一句話判斷：你的成本主要燒在哪邊？

如果你常做的是丟長文件摘要、資料分析、知識庫問答、多輪對話應用、內部文件搜尋，那你的壓力通常更偏向 Input。因為你送進模型看的東西很多。

偏 Input 壓力大的場景

長文件、檢索、知識庫、對話歷史、工具結果，這些都會把 Input 拉高。表面提問很短，背後卻可能很重。

偏 Output 壓力大的場景

如果你常做的是長文生成、程式碼產出、詳細報告、大量文案生成、顧問式長回答，那你的壓力通常更偏向 Output。因為模型吐回來的東西很多。很多企業場景則是兩邊都高，所以才會覺得 API 帳單上升得很快。

結語

如果你剛開始接觸 AI 模型 API，那麼 Input Token 跟 Output Token，絕對是最先該搞懂的基本觀念之一。

再講一次最簡單的版本：Input Token，是你送進去給模型看的內容；Output Token，是模型回傳給你的內容。懂了這個差別，你才會開始理解為什麼有些問題特別花錢、為什麼上下文越長越貴、為什麼要求 AI 回太多也會讓成本上升，以及為什麼企業在導入 AI 時，一定要做 Token 管理。

真正影響成本的，不只是你有沒有用 AI，而是你怎麼把內容送進去，又讓模型怎麼回出來。

常見問題

Input Token 跟 Output Token 最簡單的差別是什麼？

最簡單的理解方式就是，Input Token 是你送進模型的內容，Output Token 是模型回給你的內容。前者偏讀取成本，後者偏生成成本。

為什麼很多模型的 Output Token 比較貴？

因為生成內容通常比單純讀取內容更耗資源，所以很多供應商會把 Output Token 單價設定得比 Input Token 更高。

為什麼我明明問題很短，還是覺得很花錢？

因為實際進模型的不一定只有那一句。背後可能還包含系統規則、上下文、知識庫內容、歷史對話或工具結果，這些全部都會算進 Input。

長文件摘要比較容易燒 Input 還是 Output？

通常先偏向 Input，因為你要先把很多內容送進去給模型看。但如果你又要求它輸出很長、很細的分析，Output 也會一起變高。

想省成本，先省 Input 還是先省 Output？

要看你的任務類型。如果你常貼長資料、長規則、長對話，就先優化 Input；如果你常讓模型輸出超長內容，就先優化 Output。很多時候兩邊都值得一起調整。

這篇和 AI Token 怎麼算有什麼不同？

這篇重點在計費結構裡的 Input 與 Output 差別，屬於基本概念釐清；而 AI Token 怎麼算，通常更偏向整體換算邏輯和估算方式，兩篇定位不同。

資料來源與可信度聲明

本文依據主流模型供應商公開的 API 計費與說明文件整理撰寫，重點參考 OpenAI API 定價、OpenAI Token 概念文件、Anthropic Claude 定價與 Google Gemini API 定價說明。內容聚焦在新手最容易混淆的 Input Token 與 Output Token 差別，協助讀者從成本結構、實際使用情境與流程設計角度理解 AI API 為什麼會花錢，以及該怎麼更合理地使用 Token。

如果你已經分清楚 Input Token 和 Output Token 的差別，建議再接著看 AI Token 怎麼算，把整體 Token 用量怎麼累積、怎麼估算 一次串起來。

想繼續了解更多相關內容，可以直接前往 AI Token。

本篇文章屬於《AI Token 計算》分類

此分類聚焦在 AI Token 的基本計算觀念與成本理解，內容包含 Token 怎麼算、字數與 Token 的差異、輸入輸出成本結構、用量判讀與新手最容易搞混的觀念，幫助讀者先把計費邏輯看懂，再進一步理解模型成本與使用策略。

延伸閱讀

AI Token 怎麼算？新手看懂最基本的計算方式

一個 AI Token 等於多少字？中文和英文其實差很多

AI Token 用量怎麼看？新手看懂後台數字不再霧煞煞