Gemini Token 計費怎麼看？Google 系模型費用重點整理

Q: Grounding with Google Search 算 token 嗎？

不是完全等同. Google 官方明確指出，Grounding with Google Search 是按 search queries 計費，而 retrieved context 本身不算 input tokens。

4月8日
讀畢需時 10 分鐘

已更新：4月21日

Gemini Token 計費方式與成本公式解析：圖解影響 API 總花費的 5 大核心變數，包含輸入與輸出價格、Context Caching 快取、Grounding (搜尋與地圖工具) 附加費用，以及免費與付費層級 (Billing Tier) 的架構差異

很多人第一次接觸 Gemini API，最容易卡住的不是模型能不能用，而是價格到底怎麼看。明明都是 Google 的 AI 模型，卻同時看到免費層、付費層、input token、output token、context caching、grounding、rate limits、billing tier 這些名詞，整個後台看起來很完整，但也很容易讓新手越看越亂。

Google 官方文件現在就是把 Gemini API 的價格拆成不同模型、不同 tier 與不同功能來看，並不是單純一個模型配一個固定月費。

如果你現在最想知道的是「Gemini Token 計費到底怎麼看，Google 系模型費用重點到底在哪裡」，那先記一句最核心的結論就夠了：Gemini API 不是看你問了幾次，而是看你送進多少內容、模型回了多少內容、你有沒有開快取或搜尋等額外功能。Google 的 Gemini Developer API pricing 頁面直接把價格拆成 input、output、context caching、Grounding with Google Search / Maps 等欄位；billing 文件則另外補充免費層、付費層與 tier 規則。

如果你想先從整個主題入口開始理解，也可以先看 AI Token

先搞懂一件事：Gemini 計費重點不是貴不貴，而是你在為什麼付錢

很多新手看 Google 系模型價格時，會先急著問哪個最便宜、哪個最貴。但真正更重要的問題其實是：你這次花的錢，到底是花在哪裡。

因為 Gemini 的計費不是只有單一維度。官方 pricing 頁清楚顯示，Gemini API 至少會牽涉到這幾種成本來源：一般輸入 token、模型輸出 token、context caching 價格、storage 價格、Grounding with Google Search / Maps，以及不同 tier 對應的可用模型與限制。這也是很多人明明只看到一張價格表，實際上卻還是搞不懂帳單的原因。

Gemini 的價格不是只有模型名稱加單價

你不能只看「Gemini 3.1 Flash-Lite 比 Gemini 3.1 Pro Preview 便宜」這種表面結論，因為真正會改變帳單的，常常是 output、快取、搜尋與 tier。

新手先學會看帳單結構，比直接比單價更重要

只要你先知道自己是在為哪幾種使用量付費，後面不管是估成本、選模型、還是設計工作流，都會清楚很多。

Gemini Token 是什麼？先把這個基本概念釐清

Google 官方的 token 文件寫得很清楚，Gemini 和其他生成式 AI 模型一樣，都是以 token 為單位處理輸入與輸出內容。官方給的粗略概念是：對 Gemini 模型來說，1 token 大約等於 4 個字元，100 tokens 大約等於 60 到 80 個英文單字。這只是近似值，不是固定換算公式，但已經足夠讓新手建立第一層成本感。

Gemini Token 不是固定字數

它不是固定等於一個中文字，也不是固定等於一個英文單字。你看到的文字、語言、格式、音訊、圖片、影片，都可能被 Gemini API 轉成不同數量的 token。

所以 Gemini 成本不是只看你打了幾個字

Google 官方也明說，計費會部分取決於 input 與 output tokens 的數量。也就是說，理解 token 怎麼算，對看懂 Gemini 成本本來就很重要。

Gemini 計費怎麼看？新手先看懂這 4 個欄位就夠了

第一次打開 Google 的 Gemini pricing 頁面時，很多人會被不同模型區塊嚇到。其實對新手來說，先看懂下面 4 個欄位，就已經能讀懂大部分價格邏輯。

Input price

這是你送進 Gemini 模型的內容成本。你輸入的 prompt、附帶的文字、圖片、音訊、影片，會依模型支援類型與定價方式計算 input 成本。像 Gemini 3.1 Flash-Lite Preview 的 paid tier，文字 / 圖片 / 影片輸入是每百萬 token 0.25 美元，音訊輸入是每百萬 token 0.50 美元。

Output price

這是 Gemini 回給你的內容成本。Google 官方在多個 Gemini 模型的價格頁都把 output 單獨列出，而且不少模型的 output 單價明顯高於 input。像 Gemini 3.1 Flash-Lite Preview 的 output 價格是每百萬 token 1.50 美元；Gemini 3.1 Pro Preview 則是 prompts 不超過 200k tokens 時，output 每百萬 token 12 美元。

Context caching price

Google 官方對部分 Gemini 模型提供 context caching 定價。以 Gemini 3.1 Flash-Lite Preview 為例，文字 / 圖片 / 影片的 context caching 價格是每百萬 token 0.025 美元，音訊是每百萬 token 0.05 美元，另外還有每小時每百萬 token 1 美元的 storage price。這表示如果你的系統會重複使用相同上下文，快取本身就是成本結構的一部分。

Grounding with Google Search / Maps

Gemini 某些模型支援 grounding with Google Search 與 Google Maps。官方價格頁明確寫到，Gemini 3 系列有每月共享的免費額度，超過後按 search queries 收費；而且一次使用者請求可能會觸發一個或多個 search queries。這些查回內容本身不算 input tokens，但搜尋查詢本身是會計費的。

Gemini 免費層和付費層差在哪？很多人一開始就忽略這個重點

Google 的 Gemini API 並不是一開始就只有單一付費模式。Billing 文件寫得很清楚，新帳號會先在 Free 層級；要接觸更高 rate limits、部分進階模型，以及讓 prompts 和 responses 不被拿去改善 Google 產品，就需要升級到 Paid。Google 也列出 tier 進階規則，例如 Tier 1 的 billing cap、Tier 2 和 Tier 3 的花費與時間條件。

免費層不只是價格比較低，而是可用範圍也不同

Free 層的特點是可先開始用、部分 input 與 output 免費，但只限 certain models，而且內容可被用來改善產品。Paid 層則有更高 rate limits、可用 context caching、Batch API 50% 成本折扣，且內容不會用來改善產品。

Billing tier 本身就會改變你的使用方式

也就是說，Gemini 計費不是單純「有沒有刷卡」而已，而是 billing tier 本身就會改變你能怎麼用這個 API。這點很多新手一開始都會忽略。

Gemini 3.1 Pro Preview、Gemini 3.1 Flash-Lite Preview，要怎麼看費用邏輯

Google 的 Gemini 定價頁現在包含多種模型與不同能力。對大多數新手來說，不需要一次把每個 preview、audio、image、tts 版本都背起來，但你至少要先知道一個方向：功能越全面、能力越高、輸出形式越多，費用通常越複雜。

Gemini 3.1 Pro Preview 比較像正式高能力工作流型

官方把 Gemini 3.1 Pro Preview 描述成在 multimodal understanding、agentic capabilities 等方面較強的模型。它的 input、output、context caching、Grounding with Search / Maps 都有完整價格，且在 prompts 超過 200k tokens 時會跳到更高價格。這類模型比較像正式應用的高能力候選。

Gemini 3.1 Flash-Lite Preview 比較像成本效率優先型

Google 官方直接把 Gemini 3.1 Flash-Lite Preview 描述成「most cost-efficient model」，適合 high-volume agentic tasks、translation 和 simple data processing。它的 input、output、context caching 價格都明顯較低，所以如果你做的是大量簡單任務，例如分類、摘要、快速改寫、基礎客服、批次標題生成，Flash-Lite 這類模型通常更值得優先評估。

Gemini Token 計費最常被低估的地方，其實是 output

很多新手估 Gemini 成本時，只會先想：「我 prompt 也沒多長，應該不貴吧？」但如果你仔細看 Google 官方價格頁，會發現很多 Gemini 模型的 output 單價明顯比 input 高。

像 Gemini 3.1 Flash-Lite Preview 是 input 0.25、output 1.50；Gemini 3.1 Pro Preview 在 200k tokens 以下則是 input 2.00、output 12.00。這代表你真正該小心的，常常不是問了多少，而是讓 Gemini 回了多少。

如果你常要求完整分析、詳細說明、長文輸出，output 很容易變成主成本

這在 Gemini 的價格結構裡不是小差異，而是最直接的費用來源之一。

新手估成本時，output 幾乎一定值得優先盯

尤其是內容生成、報告整理、程式碼產出、多版本答案這類場景。

Context caching 是什麼？為什麼 Google 系模型這一塊要特別看

Google 官方把 context caching 單獨列在價格頁裡，這就代表它不是附帶功能，而是正式的成本欄位。像 Gemini 3.1 Pro Preview、Gemini 3.1 Flash-Lite Preview 都有 caching price 與 storage price。

新手先用最白話的方式理解就好

如果你每次都要重複帶一大段固定背景、規則、角色設定、文件上下文，Google 提供的 caching 機制可能讓這些內容不用每次都用同樣成本重算。

這塊特別適合重複背景很多的工作流

像固定格式客服助手、固定品牌語氣生成、固定規則的內容審核、重複性高的企業工具、長上下文但可重用的流程，都很適合把 caching 算進去。

Grounding with Google Search 為什麼很重要？因為它不是只有 token 費

這是 Gemini 跟很多其他模型計費結構上很值得注意的地方。Google 官方定價頁清楚列出 Grounding with Google Search 的價格，而且它不是單純併進 token 成本裡，而是按 search queries 計費。官方也特別提醒，一次使用者請求可能對應到一個或多個 search queries，所以費用不一定只看你送了幾次 prompt。

如果你做的是搜尋型 AI 助手，不能只看 token 單價

因為你真正的帳單，還會包含 Search grounding 這一層。

這也是 Gemini 成本最容易被低估的位置之一

很多人只看 input / output，以為自己大概抓到了，結果真正多出來的費用是搜尋查詢。

Gemini 計費怎麼估？新手先學這個最簡單公式就好

如果你現在只是要先抓大方向，不需要把每次請求算到極致精準。先用這種方式理解就夠了：

本次成本 ≈ input token 成本 + output token 成本 + caching 成本 + search grounding 成本

如果你沒有開 caching，也沒有開 grounding，那就先簡化成：

本次成本 ≈ input token 成本 + output token 成本

新手最該先建立的不是完美數學，而是三個判斷

這次任務輸入長不長。這次任務輸出會不會很長。我有沒有開到額外功能。

只要先有這個概念，Gemini 價格表就不會再只是數字堆

你會開始知道，每個欄位對你的任務有什麼實際意義。這也正是你原始草稿想帶讀者建立的能力。

Google 系模型費用重點整理：新手最該先看哪幾個方向

如果你現在只是想要一個真正能用的整理版，不想一開始就掉進超深的 API 文件，那 Gemini 的費用重點其實可以濃縮成下面幾句：

第一，Gemini 不是單一價格模型

不同模型、不同模式、不同輸入類型，價格都不同。

第二，output 很重要

很多模型的 output 價格明顯高於 input，所以新手估成本時不能只看 prompt。

第三，免費層與付費 tier 會影響你能怎麼用

不是有帳號就等於所有東西都一樣。

第四，有些 Gemini 成本不只來自 token

像 Grounding with Google Search 就是額外收費邏輯。

第五，Rate limits 也是使用成本的一部分思維

就算理論上費用可接受，若限制不夠，也不一定適合做正式服務。Google 官方明確說 rate limits 會依 RPM、TPM、RPD、usage tier 與模型種類而變，preview 模型通常更受限制。

Gemini 適合哪些使用情境？從價格結構反推其實很清楚

很多人問「Gemini 適不適合我」，其實不一定要先從模型印象出發，反而可以從 Google 官方的費用設計倒推。只要一個模型同時支援多模態、caching、grounding、免費層與正式 tier 差異、以及明確的 rate limits 邏輯，它通常就不只是純聊天模型，而是更偏向可接工作流、可接產品、可做搜尋與多模態任務、可從測試一路走到正式應用。

Gemini 特別適合的方向

多模態問答、帶搜尋的回答系統、Google 生態相容應用、需要從免費測試一路擴到正式服務的專案，以及大規模、成本敏感型任務。這些都能從官方模型定位與價格結構合理反推。

如果你只是偶爾潤稿或問問題，API 的複雜價格結構不一定是第一優先

這不代表 Gemini 不適合你，而是代表你也許先不用一開始就進到最完整的 API 計費世界。

Gemini 新手最常犯的 7 個計費錯誤

第一，只看模型名稱，不看價格欄位

看到 Gemini 3、Gemini 2.5 Flash、Flash-Lite 就急著選，卻沒有先看 input、output、caching、grounding 差別。

第二，只看 input，不看 output

這真的太常見，而且 output 很多時候才是成本重點。

第三，以為免費層就等於能完整測所有正式場景

Google 官方明確寫到 Free 只限 certain models，並有對應的 free tier rate limits。

第四，忽略 grounding with Search 會另外計費

很多人只看 token 單價，卻沒把 search queries 算進去。

第五，不知道 preview 模型的限制通常更嚴

Google 官方文件明寫 preview models 會有更 restrictive rate limits。

第六，把 rate limits 當成跟成本無關

其實有關，因為它會直接影響你能不能支撐正式流量與工作流設計。

第七，一開始就用太複雜的模型和任務測試

這會讓你同時把學習成本、模型成本、工作流複雜度綁在一起，新手很容易一下就亂掉。這個判斷也和你原始草稿一致。

FAQ

Gemini Token 計費主要看哪裡？

先看 Google 官方 pricing 頁的 input price、output price、context caching price、Grounding with Google Search / Maps 這幾個欄位，就足夠讀懂大部分成本邏輯。

Gemini 的 output 會比 input 貴很多嗎？

很多模型是這樣。像 Gemini 3.1 Flash-Lite Preview 與 Gemini 3.1 Pro Preview，output 單價都明顯高於 input。

Gemini 免費層能不能直接拿來做正式產品？

通常不建議直接這樣想。Google 官方說新帳號起始於 Free，且只可存取 certain models 與對應限制；正式產品通常還要考慮 Paid、rate limits 與 billing cap。

Grounding with Google Search 算 token 嗎？

不是完全等同。Google 官方明確指出，Grounding with Google Search 是按 search queries 計費，而 retrieved context 本身不算 input tokens。

Gemini 的 rate limits 要不要一起看？

要。因為 Google 官方說 rate limits 會依 RPM、TPM、RPD、usage tier 和模型而變，超過任一限制就可能觸發 rate limit error。

Gemini Token 跟字數是同一件事嗎？

不是。Google 官方 token 文件說，Gemini token 是模型處理文字的基本單位，1 token 約等於 4 個字元只是近似值，不是固定字數換算。

新手一開始適合用哪種 Gemini 模型？

如果你重視成本與高頻任務，通常可以優先看 Flash-Lite 這類強調 cost-efficient 的模型；如果你需要更完整能力、多模態與搜尋整合，再評估 Flash 或更高階選項。這是依 Google 官方模型定位與價格結構做的實務判斷。

資料來源與可信度聲明

本文根據 Google 官方 Gemini API 文件、Gemini Developer API Pricing、Billing、Token 說明、Models 與 Rate limits 文件整理撰寫，主要參考 Gemini Developer API Pricing、Gemini Billing、Understand and count tokens、Gemini Models 與 Gemini Rate limits。本文以「官方定價頁 × Token 基本概念 × 新手成本判讀」三層方式整理，優先採信 Google 原廠公開資料。本文涉及模型 tier、free / paid、rate limits、grounding 與 context caching 的描述，均以官方文件為優先依據。

如果你想知道 Gemini Token 計費 跟其他主流模型相比差在哪，下一步可以直接看 AI Token 價格怎麼看，把整體費率邏輯一次串起來。

想看更多相關可前往AI Token 。

本篇文章屬於《AI 模型比較》分類

此分類專門整理不同 AI 模型之間的能力、價格、用途與接法差異，內容包含模型比較、定價結構、平台差異與新手最常遇到的選型問題，幫助讀者在不同模型文章之間快速看懂每一篇真正比較的是什麼。

延伸閱讀

AI Token 價格怎麼看？新手先搞懂費用是怎麼來的

GPT Token 計費怎麼看？新手先看懂重點就夠了

AI Token 月費制和用量制差在哪？哪種比較適合你