Gemini 3 Deep Think 大升級!主打科學研究與工程推理新突破

Photo of author

By admin

發布:

聚焦科研與工程難題求解

Gemini 3 Deep Think 於 2026 年 2 月 12 日迎來大升級!Google 官方正式將其定位為「專門解決科學、研究與工程領域現代難題」的推理模式。本次更新不僅強化了模型處理複雜資料的能力,更宣布即日起於 Gemini App 向 Google AI Ultra 訂閱者開放,並首度透過 Gemini API 提供研究人員、工程師與企業申請早期存取,將強大的推理能力帶入實際工作流。

相關新聞 : ChatGPT 免費版有廣告了!OpenAI 測試 ChatGPT 廣告,不影響回答、18 歲以下不顯示

更貼近科研與工程現場

官方強調這次更新是與科學家及研究人員緊密合作的成果,鎖定那些缺乏明確規則、未必只有單一正解、資料可能雜亂或不完整的研究型難題。目標是將深度科學知識與日常工程實用性結合,推動 AI 從理論走向可落地的應用。

早期測試者的實際應用案例:

數學論文檢視:羅格斯大學 (Rutgers University) 數學家 Lisa Carbone 利用 Deep Think 審閱高度專業的數學論文,模型成功指出了一個在先前人類同儕審查中未被察覺的細微漏洞。

晶體成長與半導體材料探索:杜克大學 Wang Lab 利用該模型優化複雜的晶體成長製程。Deep Think 設計出的薄膜成長配方,能得到大於 100 μm 的薄膜尺寸,達到了先前傳統方法較難精準命中的目標。

加速實體元件設計:Google 平台與裝置部門研發主管 Anupam Pathak (亦為 Liftware 前執行長) 利用新版 Deep Think 加速實體元件的設計流程。

ARC-AGI-2 84.6% 引關注

在「數學與演算法推理」方面,官方回顧了去年 Deep Think 專門版本在數學與程式設計世界級競賽中達到的金牌標準。此次更新後,官方列出了多項令人矚目的學術型基準表現:

Humanity’s Last Exam:取得 48.4% (不使用工具),官方稱此為測試前沿模型能力極限的終極基準。

ARC-AGI-2:取得 84.6%,展現強大的抽象推理能力。

Codeforces:Elo 評分達 3455 (由競程題目構成的基準)。

International Math Olympiad 2025:達到金牌等級表現。

延伸到化學與物理

除了數學與程式競賽,官方表示 Gemini 3 Deep Think 也擅長更廣泛的科學領域。在 2025 International Physics OlympiadChemistry Olympiad 的筆試部分,均達到金牌等級結果。在進階理論物理方面,於 CMT-Benchmark 取得了 50.5% 的成績。

從草圖到 3D 列印

官方將新版 Deep Think 的定位延伸到了實作層面,它可以協助研究者解讀複雜資料,也能讓工程師透過程式碼建立物理系統模型。使用者可將設計草圖轉為可 3D 列印的成果。Deep Think 能分析圖稿、建立複雜形狀的 3D 模型,並產生用於列印實體物件的檔案。

如何取得新版 Deep Think?

  1. Gemini App:Google AI Ultra 訂閱者「即日起」即可在 App 中使用更新後的 Deep Think。

  2. Gemini API:研究人員、工程師與企業可表達意願,申請 Gemini API 早期存取計畫,以測試 Deep Think 的強大能力。

如果喜歡這篇文章,並想持續收到更多限時免費科技新聞Apple 資訊,以及 AIWordPress 教學資源分享,歡迎透過以下方式支持我,讓我更有動力創作:

👍 按讚與追蹤:鎖定我的 Facebook專頁InstagramThreadsX,就不會錯過最新內容。

☕ 請我喝杯咖啡:如果內容對你有幫助,歡迎到 Ko-fi 小額支持,為我注入創作能量。

你的一個 Like追蹤或是一杯咖啡的鼓勵,都能激勵我持續分享更多實用文章。由衷感謝大家。😉

Leave a Comment