top of page


AI Token 成本高低,和提示詞寫法也有關嗎?
有,而且很多時候比你想像中更有關。 同一個任務,就算模型沒換、價格表沒變,只要提示詞寫法不同,最後花掉的 token 和總成本就可能差很多。原因很簡單:提示詞本身就是 input 的一部分,還會影響模型回多長、會不會答歪、要不要重跑、固定背景能不能快取,甚至會不會把 reasoning 類模型的思考開銷一起拉高。真正會讓成本失控的,很多時候不是模型太貴,而是 prompt 寫法太鬆、太肥、太重複、太容易讓模型誤解。 很多人一開始看 AI 成本,會先把重點放在模型單價,覺得只要換便宜模型就能省錢。但實際上,提示詞怎麼寫,真的會直接影響你每次送進模型的內容量,也會改變模型回出來的內容量。更麻煩的是,如果提示詞本身不夠清楚,模型回歪了,你還得補問、重寫、重跑,最後花掉的不是一個 request,而是一連串 request。 提示詞寫法會影響成本,但不是越短就一定越省 提示詞寫法會影響 AI Token 成本,但真正省錢的關鍵,不是盲目把 prompt 寫短,而是讓 prompt 更精準、更少廢話、更少重複、更少重跑。 因為成本不是只看提示詞長短,還要一
5月18日讀畢需時 9 分鐘


長對話為什麼 AI Token 會越扣越快?關鍵在上下文累積
如果你最近在用 AI 做 長對話 、 多輪對話 ,很可能已經遇過這種情況: 前面聊幾輪都還好,後面明明每次只多打一小句, AI Token 卻開始越扣越快 。很多人第一次遇到這種狀況時,直覺都會以為是不是平台算錯、模型突然變貴,或是自己不小心開了什麼額外功能。 但大多數時候,真正的原因其實比較單純: 不是你最新那一句特別貴,而是模型每一輪都在重新讀越來越長的上下文。 這篇文章的重點不是廣義地講「AI Token 為什麼會扣很快」,也不是教你怎麼看後台數字,而是專門回答一個很明確的問題: 為什麼長對話會讓 AI Token 越聊越貴? 先講最核心的答案: 長對話越到後面越花錢,通常不是因為你後面那一句比較長,而是因為每一輪都把更多前面的對話、規則、工具內容和背景資料一起送回模型。 長對話為什麼會讓 Token 越扣越快? 最簡單的理解方式就是: 你看到的是新增一句,模型看到的是整段對話。 在多輪對話裡,模型如果要理解你現在這一句話,通常不會只看你剛剛新增的那幾個字,而是要連同前面幾輪內容一起看。OpenAI 的 conversation state
4月10日讀畢需時 9 分鐘


AI Token 計算會把系統提示詞也算進去嗎?
很多人在開始用 AI API 之後,都會冒出同一個問題: 我自己寫的 system prompt、system instructions,會不會也被算進 token? 答案先講在前面: 通常會。 只要那段內容是你在 request 裡一起送進模型的,不管它叫 system prompt、system instructions、developer instructions,原則上都屬於輸入端的一部分,會影響 input token、上下文長度,通常也會影響費用 。這正是你原稿裡最核心的重點。 如果你現在會搜尋這題,通常不是想知道抽象定義,而是想搞清楚三件事: 系統提示詞會不會吃 input token 系統提示詞會不會影響成本 系統提示詞太長會不會讓上下文很快爆掉 這篇就是直接回答這三個問題,而且會盡量用最白話的方式講清楚。 先講最白話的版本 你可以把一個 API request 想成一包送進模型的資料。 只要是這一包裡的內容,通常都會被模型讀到,也就通常會被算進 input side。 這包含: 你寫的 system prompt / syste
4月10日讀畢需時 7 分鐘


一篇 1000 字文章大概會用多少 AI Token?
如果你現在正在查「 1000 字文章大概會用多少 AI Token 」,通常你真正想知道的不是抽象定義,而是很實際的事:我要寫一篇文章、叫 AI 產一篇文章,或估一篇文章的 API 成本時,到底該抓多少 Token 才合理。 先講最直接的答案: 如果你說的是 1000 個中文字符的文章,實務上通常可以先抓大約 800 到 1,200 Tokens。如果你說的是 1000 個英文單字,通常可以先抓大約 1,300 到 1,400 Tokens。 但這不是固定公式,而是 實務估算區間 。因為 OpenAI 官方明確說明,Token 不是直接等於字數,而且 非英文文本通常會有更高的 token-to-character ratio ;Gemini 官方也說,Gemini 模型以 Token 作為處理粒度,1 Token 約等於 4 個字元這件事,本質上只是粗略近似,不是每種語言都能直接套用。 所以這篇不是要把你帶去背死公式,而是直接幫你回答搜尋意圖最前面的問題: 1000 字文章,大概要抓多少 Token 才不會估太離譜? 先講最重要的差別:你說的 1
4月10日讀畢需時 7 分鐘


AI Token 便宜方案怎麼找?別只看單價就下決定
很多人在找便宜的 AI Token 方案時,第一眼只看「每百萬 Token 幾美元」。這樣看很快,但也最容易看錯。因為現在主流平台的價格,不只分 input 和 output,還常常另外有 cached input、Batch、搜尋、Grounding、快取儲存、工具呼叫,甚至區域或模式加價。 OpenAI 官方價格頁就把 input、cached input、output、Web search、Batch API、Regional Processing 等項目分開列出;Gemini 的官方 pricing 頁也把 input、output、context caching、storage、Grounding with Google Search / Maps、Batch API 分開列價。 所以,真正比較實用的結論是: 便宜方案不是先看誰最便宜,而是先看你的用途,再看該平台怎麼計價。 如果你做的是高頻、簡單、可批次的任務,低價模型加上 Batch 或快取,通常才是真正省;如果你做的是長上下文、搜尋型助理、工具型 Agent,那最後把帳單拉高的,
4月10日讀畢需時 8 分鐘
AI Token 文章專區
整理 AI Token 入門、計算方式、費用理解、模型比較與平台採購等文章,幫助你更快找到適合自己的學習入口。
bottom of page
