您好,我是劉俊宏,
目前是
創辦人兼總經理
menu

INSIDE》 成本直接暴降 600%!Google Gemini 2.5 Flash 如何成為「AI 性價比之王」?


成本直接暴降 600%!Google Gemini 2.5 Flash 如何成為「AI 性價比之王」?


Photo Credit:Google

Chris 2025/04/18

Gemini 2.5 Flash 新增的「思考預算」功能可以讓開發者透過設定預算範圍 (0 – 24576 Token),來精細地控制模型在思考階段的推理深度與預算!

Google 昨天正式在 Google AI Studio、Vertex AI 平台推出 Gemini 2.5 Flash 預覽版了!作為 2.0 Flash 全面升級版,與被 Google 定位為第一款「真正」混合推理模型的 Gemini 2.5 Flash,其核心亮點在於引入了可自訂的「思考預算」,讓開發者能夠根據不同的應用情境,自由地開啟或關閉 Gemini 2.5 的思考模式。

Gemini 2.5 Flash 新增的「思考預算」功能可以讓開發者透過設定預算範圍 (0 – 24576 Token),來精細地控制模型在思考階段的推理深度。較低的預算 (甚至設定為 0) 適用於簡單的查詢,能夠保持 2.0 Flash 超低的延遲和成本,同時還能提供更強的性能;而較高的預算則能讓模型進行更深入的推理,進而生成更準確、更全面的答案。

值得強調的是,思考預算僅設定了 2.5 Flash 的思考上限;如果使用者提供的提示詞並不複雜,模型並不會耗盡所有的預算. 更智慧的是,模型會根據提示詞的複雜程度,自動判斷所需的推理量和思考時間,避免不必要的資源浪費。

下方繼續閱讀
曝光5,356/日 成本100/月
下文請點廣告解鎖
下文請點廣告解鎖
投放Google多媒體聯播網廣告(點此)arrow_downward,包含轉換代碼安裝

※ 如果看到投資類型廣告,請再三評估風險!

繼續閱讀keyboard_double_arrow_down
但更重要的是,當關閉思考模式時,模型的輸出成本竟能大幅降低高達 600%!且效能表現依舊能與 Gemini 2.0 Flash 相匹敵。具體而言,Gemini 2.5 Flash 在關閉思考模式下的輸出價格為每百萬 tokens 0.6 美元,而開啟思考模式則為每百萬 tokens 3.5 美元。


成本直接暴降 600%!Google Gemini 2.5 Flash 如何成為「AI 性價比之王」?


Photo Credit:Google

在多項關鍵的基準測試中,Gemini 2.5 Flash 也刷新了多項 SOTA (State-of-the-Art) 紀錄。在全球大型語言模型排行榜上,Flash 的預覽版本以的 1392 ELO 高分位居第二,與 OpenAI 的 GPT-4.5-preview 以及 Grok 3 並駕齊驅。另外在數學 (如 AIME 2025/2024)、多模態推理 (MMMU) 以及知識問答 (GPQA) 等多個重要領域,Gemini 2.5 Flash 的表現全面超越了 Anthropic 的 Claude 3.7 Sonnet,甚至足以媲美最新發布的 o4-mini 模型。

從模型每百萬 tokens 的輸入與輸出價格來看,Gemini 2.5 Flash 展現出極高的性價比。Google 強調,Gemini 2.5 系列是名符其實的「思考模型」,它不會立即輸出結果,而是會先執行「思考」流程,以便更深入地理解使用者提出的提示詞,進而更有效地拆解複雜任務並規劃出更完善的回答。

根據國外使用者的實際測試回饋,Gemini 2.5 Flash 在物理模擬方面的能力也相當驚人,能夠精確地模擬小球隨著多邊形變化的運動。此外,它還能根據使用者提供的精靈圖,快速創建出客製化的遊戲場景。目前,Gemini 2.5 Flash 的預覽版本已經在 Gemini 應用程式中推出,同時也透過 API 向開發者開放。開發者可以透過 Google AI Studio 和 Vertex AI 平台使用。

核稿編輯:Sherlock

資訊來源

 
聯播網: 吉傳媒, 傑愛得資訊, 吉拉X, 劉俊宏,