OpenAI推出了o3-mini,旨在為技術領域提供更高效且價格合理的AI推理模型。它在多個測試中表現出色,特別適合編程、數學和科學問題。
OpenAI於周五發佈了其最新的「推理」模型——o3-mini,成為公司o系列推理模型的最新成員。此舉發佈之際正值OpenAI面臨巨大挑戰和機遇的關鍵時刻,尤其是在與中國公司DeepSeek競爭中,OpenAI正努力維繫與華盛頓的關係,並為全球最大的一輪融資做準備。

o3-mini定位為一款「強大」且「實惠」的推理模型,它不同於大多數大型語言模型,能夠在提供答案之前進行詳細的事實核查,從而避免一些常見的錯誤。雖然推理過程稍顯緩慢,但它提供的答案通常更為可靠,尤其在物理等領域,盡避並不完美。
o3-mini主要針對STEM(科學、技術、工程和數學)領域,特別是編程、數學和科學問題。OpenAI表示,o3-mini的能力與o1系列(如o1和o1-mini)相當,但運行速度更快且成本更低。外部測試人員反饋稱,o3-mini在超過一半的時間裏提供的答案比o1-mini更具優勢,並且在面對「複雜實際問題」時,出錯率比o1-mini少了39%。此外,o3-mini給出的答案更清晰,速度也快了約24%。
從今天開始,o3-mini將通過ChatGPT向所有用戶開放,付費用戶可以享受每天150次查詢的更高配額。ChatGPT Pro用戶則可以享受無限制使用,而ChatGPT Enterprise和Edu用戶將在一周內獲得該功能(ChatGPT Gov尚無消息)。免費用戶也可以通過點擊聊天欄中的「推理」按鈕使用o3-mini。

對於開發者,o3-mini也將在API中提供,但目前不支持圖像分析。開發者可以根據自己的需求選擇推理力度(低、中或高),以優化響應速度。
在定價方面,o3-mini每百萬個輸入token收費0.55美元,每百萬個輸出token收費4.40美元,遠低於o1-mini的定價,且與DeepSeek的R1推理模型定價競爭。值得注意的是,o3-mini在「中等推理力度」下,提供了「速度和準確性之間的平衡」。付費用戶還可以選擇「o3-mini-high」來獲得更高的智能,但響應速度較慢。
盡避o3-mini並非OpenAI最強大的模型,也未在所有基準測試中超過DeepSeek的R1,但它在許多查詢中提供了更具競爭力的低成本和低延遲答案。OpenAI強調,o3-mini在「安全性」方面與o1系列持平,甚至在一些挑戰性安全和破解測試中超越了GPT-4。
總的來說,o3-mini的發佈標誌着OpenAI在推動成本效益智能領域的又一重要進步,尤其是在為技術領域提供高效、實用的推理解決方案方面。
















