滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 智能手機(jī) > 正文內(nèi)容

微軟Phi-4推理模型發(fā)布，小型AI能否撼動(dòng)大型模型地位？

時(shí)間：2025-05-01 16:01 作者：蘇婉清

微軟近期在人工智能領(lǐng)域邁出了重要一步，于4月30日正式發(fā)布了Phi-4-reasoning系列推理模型。這一系列模型專(zhuān)為應(yīng)對(duì)復(fù)雜推理任務(wù)而設(shè)計(jì)，通過(guò)監(jiān)督微調(diào)Phi-4，并利用o3-mini生成的高質(zhì)量“可教導(dǎo)”提示數(shù)據(jù)集進(jìn)行訓(xùn)練，實(shí)現(xiàn)了推理能力的顯著提升。

本次發(fā)布的Phi-4-reasoning系列包含三款模型：Phi-4-reasoning、Phi-4-reasoning-plus以及Phi-4-mini-reasoning。據(jù)微軟官方介紹，這些模型不僅繼承了小型模型的高效特性，還在推理能力上取得了重大突破。它們通過(guò)推理時(shí)間擴(kuò)展技術(shù)，能夠處理需要多步驟分解和內(nèi)部反思的復(fù)雜任務(wù)，尤其在數(shù)學(xué)推理和代理型應(yīng)用中表現(xiàn)卓越。

Phi-4-reasoning模型是一款擁有140億參數(shù)的開(kāi)源推理模型。它結(jié)合了OpenAI o3-mini的高質(zhì)量推理演示數(shù)據(jù)，通過(guò)監(jiān)督微調(diào)Phi-4，并利用額外計(jì)算資源，生成了詳細(xì)的推理鏈條。這一特性使得Phi-4-reasoning在處理復(fù)雜推理任務(wù)時(shí)，能夠展現(xiàn)出強(qiáng)大的解析和推理能力。

而Phi-4-reasoning-plus增強(qiáng)版則進(jìn)一步通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)提升了性能。與標(biāo)準(zhǔn)版相比，它的tokens用量增加了1.5倍，從而支持更高精度的推理任務(wù)。兩款模型在數(shù)學(xué)推理和博士級(jí)科學(xué)問(wèn)題測(cè)試中，均超越了OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B等模型，甚至在AIME 2025（美國(guó)數(shù)學(xué)奧林匹克資格賽）中擊敗了擁有6710億參數(shù)的DeepSeek-R1滿(mǎn)血模型。

針對(duì)計(jì)算資源有限的環(huán)境，微軟還推出了Phi-4-mini-reasoning模型。這是一款基于Transformer的緊湊型語(yǔ)言模型，專(zhuān)門(mén)優(yōu)化用于數(shù)學(xué)推理。它通過(guò)DeepSeek-R1生成的合成數(shù)據(jù)進(jìn)行了微調(diào)，能夠在低延遲場(chǎng)景下提供高質(zhì)量的逐步問(wèn)題解決方案。這款模型覆蓋了從中學(xué)到博士級(jí)的百萬(wàn)級(jí)多樣化數(shù)學(xué)問(wèn)題，非常適合教育應(yīng)用、嵌入式輔導(dǎo)以及邊緣設(shè)備部署。

在多項(xiàng)數(shù)學(xué)基準(zhǔn)測(cè)試中，Phi-4-mini-reasoning模型憑借其3.8億參數(shù)的表現(xiàn)，超越了OpenThinker-7B和Llama-3.2-3B-instruct等更大模型，甚至在部分測(cè)試中接近了OpenAI o1-mini的水平。這一成績(jī)充分展示了Phi-4-mini-reasoning在高效性和準(zhǔn)確性方面的卓越表現(xiàn)。

微軟Phi-4-reasoning系列的發(fā)布，無(wú)疑為人工智能領(lǐng)域注入了新的活力。這一系列模型不僅在推理能力上取得了重大突破，還兼顧了高效性和實(shí)用性，為未來(lái)的應(yīng)用和發(fā)展提供了廣闊的空間。

更多>同類(lèi)內(nèi)容

Meta推出ReasonIR-8B模型，高效破解復(fù)雜推理檢索挑戰(zhàn)

05-01

特斯拉自動(dòng)駕駛安全報(bào)告：Autopilot啟用后事故率遠(yuǎn)低于行業(yè)均值

05-01

0patch讓W(xué)in7安全更新延續(xù)至2027年，你的電腦還能再戰(zhàn)嗎？

05-01

蘋(píng)果App Store外交易收傭金遭法院禁令，違令或?qū)⒚媾R刑事調(diào)查

05-01

東方集團(tuán)財(cái)務(wù)公司違規(guī)被重罰，金融許可證遭吊銷(xiāo)，高管多人受處分

05-01

高通財(cái)報(bào)亮眼：芯片業(yè)務(wù)成盈利增長(zhǎng)“引擎”，但后市展望略保守

05-01

微軟2025財(cái)年Q3財(cái)報(bào)：Xbox游戲業(yè)務(wù)憑借熱門(mén)IP及訂閱服務(wù)大放異彩

05-01

華碩天選6 Pro系列筆記本震撼上市，滿(mǎn)功耗RTX5070僅售7599.2元起！

05-01

蘋(píng)果App Store外部支付禁令升級(jí)，27%傭金被判無(wú)效引爭(zhēng)議

05-01

海南機(jī)場(chǎng)斥資23億控股美蘭空港，打造自貿(mào)港交通新引擎？

05-01

2025款?yuàn)W迪Q3 45周年典藏版來(lái)襲，新動(dòng)力新造型，起售價(jià)25.18萬(wàn)元起

04-30

摩爾線(xiàn)程Linux顯卡驅(qū)動(dòng)v3.0.0重磅升級(jí)，Wayland支持亮相！

04-30

Hi MateBook D16評(píng)測(cè)：大屏護(hù)眼，多屏協(xié)同提升辦公效率新選擇

04-30

任天堂Switch 2新Joy-Con振動(dòng)降噪，玩家游戲體驗(yàn)將有何變化？

04-30

2025款比亞迪秦EV上市，16.88萬(wàn)起售，續(xù)航450公里配置升級(jí)

04-30

點(diǎn)擊查看更多 +

全站最新

真我GT2大師探索版大升級(jí)！realme UI 6.0帶來(lái)全新功能與視覺(jué)體驗(yàn)

英偉達(dá)黃仁勛：中美AI競(jìng)爭(zhēng)激烈，華為實(shí)力強(qiáng)大不可忽視

Meta推出ReasonIR-8B模型，高效破解復(fù)雜推理檢索挑戰(zhàn)

索尼Xperia 1 VII跑分曝光：驍龍8至尊版+12GB內(nèi)存，性能如何？

我國(guó)科學(xué)家發(fā)現(xiàn)水稻耐高溫“秘密武器”QT12基因