INSIDE》成本直接暴降 600%！Google Gemini 2.5 Flash 如何成為「AI 性價比之王」？

Photo Credit:Google

Chris 2025/04/18

Gemini 2.5 Flash 新增的「思考預算」功能可以讓開發者透過設定預算範圍 (0 – 24576 Token)，來精細地控制模型在思考階段的推理深度與預算！

Google 昨天正式在 Google AI Studio、Vertex AI 平台推出 Gemini 2.5 Flash 預覽版了！作為 2.0 Flash 全面升級版，與被 Google 定位為第一款「真正」混合推理模型的 Gemini 2.5 Flash，其核心亮點在於引入了可自訂的「思考預算」，讓開發者能夠根據不同的應用情境，自由地開啟或關閉 Gemini 2.5 的思考模式。

Gemini 2.5 Flash 新增的「思考預算」功能可以讓開發者透過設定預算範圍 (0 – 24576 Token)，來精細地控制模型在思考階段的推理深度。較低的預算 (甚至設定為 0) 適用於簡單的查詢，能夠保持 2.0 Flash 超低的延遲和成本，同時還能提供更強的性能；而較高的預算則能讓模型進行更深入的推理，進而生成更準確、更全面的答案。

值得強調的是，思考預算僅設定了 2.5 Flash 的思考上限；如果使用者提供的提示詞並不複雜，模型並不會耗盡所有的預算. 更智慧的是，模型會根據提示詞的複雜程度，自動判斷所需的推理量和思考時間，避免不必要的資源浪費。

下方繼續閱讀

jAD Ads 聯播廣告

曝光5,462/日成本100/月

下文請點廣告解鎖

投放Google多媒體聯播網廣告(點此)arrow_downward，包含轉換代碼安裝

※ 如果看到投資類型廣告，請再三評估風險！

繼續閱讀keyboard_double_arrow_down

但更重要的是，當關閉思考模式時，模型的輸出成本竟能大幅降低高達 600%！且效能表現依舊能與 Gemini 2.0 Flash 相匹敵。具體而言，Gemini 2.5 Flash 在關閉思考模式下的輸出價格為每百萬 tokens 0.6 美元，而開啟思考模式則為每百萬 tokens 3.5 美元。

Photo Credit:Google

在多項關鍵的基準測試中，Gemini 2.5 Flash 也刷新了多項 SOTA (State-of-the-Art) 紀錄。在全球大型語言模型排行榜上，Flash 的預覽版本以的 1392 ELO 高分位居第二，與 OpenAI 的 GPT-4.5-preview 以及 Grok 3 並駕齊驅。另外在數學 (如 AIME 2025/2024)、多模態推理 (MMMU) 以及知識問答 (GPQA) 等多個重要領域，Gemini 2.5 Flash 的表現全面超越了 Anthropic 的 Claude 3.7 Sonnet，甚至足以媲美最新發布的 o4-mini 模型。

從模型每百萬 tokens 的輸入與輸出價格來看，Gemini 2.5 Flash 展現出極高的性價比。Google 強調，Gemini 2.5 系列是名符其實的「思考模型」，它不會立即輸出結果，而是會先執行「思考」流程，以便更深入地理解使用者提出的提示詞，進而更有效地拆解複雜任務並規劃出更完善的回答。

根據國外使用者的實際測試回饋，Gemini 2.5 Flash 在物理模擬方面的能力也相當驚人，能夠精確地模擬小球隨著多邊形變化的運動。此外，它還能根據使用者提供的精靈圖，快速創建出客製化的遊戲場景。目前，Gemini 2.5 Flash 的預覽版本已經在 Gemini 應用程式中推出，同時也透過 API 向開發者開放。開發者可以透過 Google AI Studio 和 Vertex AI 平台使用。

核稿編輯：Sherlock

#GOOGLE

資訊來源

聯播網：吉傳媒, 傑愛得資訊, 吉拉X, 劉俊宏,

INSIDE》 成本直接暴降 600%！Google Gemini 2.5 Flash 如何成為「AI 性價比之王」？

INSIDE》成本直接暴降 600%！Google Gemini 2.5 Flash 如何成為「AI 性價比之王」？