在科技界的矚目之下,OpenAI于近日凌晨的直播活動(dòng)中震撼發(fā)布了其最新的o3與o4-mini模型,標(biāo)志著人工智能領(lǐng)域又邁出了重要一步。
據(jù)OpenAI官方介紹,這兩款新模型是o系列中的最新力作,它們在回答問題前能夠進(jìn)行更為深入的思考。OpenAI自豪地宣稱,o3與o4-mini是其迄今為止發(fā)布的最智能的模型,這一突破將為從好奇用戶到高級研究人員的廣泛群體帶來顯著益處,標(biāo)志著ChatGPT能力的一次巨大飛躍。
尤為引人注目的是,新的推理模型能夠智能地運(yùn)用和結(jié)合ChatGPT中的各項(xiàng)工具,包括網(wǎng)絡(luò)搜索、Python數(shù)據(jù)分析、視覺輸入深度推理,甚至圖像生成。這些模型經(jīng)過專門訓(xùn)練,能夠判斷何時(shí)以及如何使用這些工具來生成詳盡且經(jīng)過深思熟慮的答案,通常只需不到一分鐘,便能解決更為復(fù)雜的問題。這一能力使得它們在處理多方面問題時(shí)更加高效,向更加智能、能夠獨(dú)立執(zhí)行任務(wù)的ChatGPT邁進(jìn)了一大步。
在性能表現(xiàn)方面,o3被譽(yù)為OpenAI最強(qiáng)大的推理模型,在編碼、數(shù)學(xué)、科學(xué)、視覺感知等領(lǐng)域均處于領(lǐng)先地位,并在多個(gè)基準(zhǔn)測試中創(chuàng)造了新的SOTA記錄。OpenAI指出,o3特別適合處理需要多方面分析和答案可能不明顯的高級查詢,尤其在分析圖像、圖表和圖形等視覺任務(wù)上表現(xiàn)出色。在外部專家的評估中,o3在復(fù)雜現(xiàn)實(shí)任務(wù)上的表現(xiàn)優(yōu)于OpenAI o1,減少了20%的重大錯(cuò)誤,特別是在編程、商業(yè)咨詢和創(chuàng)意構(gòu)思等領(lǐng)域。
與此同時(shí),o4-mini則是一個(gè)專為快速、成本效益高的推理而優(yōu)化的較小模型。它在數(shù)學(xué)、編碼和視覺任務(wù)上取得了令人矚目的性能,尤其是在提供Python解釋器的情況下,在AIME 2025競賽中得分高達(dá)99.5%。在專家評估中,o4-mini在非STEM任務(wù)以及數(shù)據(jù)科學(xué)等領(lǐng)域相比其前身o3-mini也展現(xiàn)出了更出色的表現(xiàn)。得益于其高效率,o4-mini支持更高的使用限制,成為處理推理問題的強(qiáng)大高容量、高吞吐量選項(xiàng)。
與OpenAI的前幾代推理模型相比,o3和o4-mini在對話自然度方面也有了顯著提升,特別是在參考記憶和過去對話來使響應(yīng)更加個(gè)性化和相關(guān)時(shí)。這兩個(gè)模型能夠更自然地融入對話,為用戶提供更加流暢和智能的體驗(yàn)。
這些新模型還具備直接整合圖像到思維鏈中的能力。它們不僅僅是查看圖像,而是能夠用圖像進(jìn)行思考,這解鎖了一種新的問題解決類別,融合了視覺和文本推理。用戶可以上傳白板照片、教科書圖表或手繪草圖,即使圖像質(zhì)量不佳,模型也能解讀并進(jìn)行分析。通過使用工具,模型甚至可以實(shí)時(shí)操作圖像,如旋轉(zhuǎn)、縮放或變換,以作為推理過程的一部分。
在成本方面,OpenAI聲稱o3和o4-mini不僅是最智能的模型,而且通常也比o1和o3-mini更高效。例如,在2025 AIME數(shù)學(xué)競賽中,o3的性價(jià)比優(yōu)于o1;同樣,o4-mini也表現(xiàn)出比o3-mini更高的效率。
在安全性方面,OpenAI對o3和o4-mini進(jìn)行了全面升級,重建了安全訓(xùn)練數(shù)據(jù),并在生物威脅、惡意軟件生成和越獄等領(lǐng)域添加了新的拒絕提示。這些更新使得o3和o4-mini在內(nèi)部拒絕基準(zhǔn)測試中取得了優(yōu)異成績。OpenAI還開發(fā)了系統(tǒng)級緩解措施,以標(biāo)記前沿風(fēng)險(xiǎn)領(lǐng)域的危險(xiǎn)提示,進(jìn)一步增強(qiáng)了模型的安全性。
對于用戶而言,ChatGPT Plus、Pro和Team用戶將能夠立即在模型選擇器中看到o3、o4-mini和o4-mini-high,取代之前的o1、o3-mini和o3-mini-high。ChatGPT Enterprise和Edu用戶將在一周后獲得訪問權(quán)限。免費(fèi)用戶則可以在提交查詢前選擇“思考”來嘗試o4-mini。所有計(jì)劃中的速率限制保持不變。
此次更新不僅展示了OpenAI模型在推理能力上的顯著提升,也反映了其將o系列的專業(yè)推理能力與GPT系列的自然對話能力和工具使用能力相結(jié)合的發(fā)展方向。這無疑為人工智能領(lǐng)域注入了新的活力,也讓我們對未來的智能應(yīng)用充滿了期待。