亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

微軟Phi-4推理模型發(fā)布,小型AI能否撼動(dòng)大型模型地位?

   時(shí)間:2025-05-01 16:01 作者:蘇婉清

微軟近期在人工智能領(lǐng)域邁出了重要一步,于4月30日正式發(fā)布了Phi-4-reasoning系列推理模型。這一系列模型專(zhuān)為應(yīng)對(duì)復(fù)雜推理任務(wù)而設(shè)計(jì),通過(guò)監(jiān)督微調(diào)Phi-4,并利用o3-mini生成的高質(zhì)量“可教導(dǎo)”提示數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)現(xiàn)了推理能力的顯著提升。

本次發(fā)布的Phi-4-reasoning系列包含三款模型:Phi-4-reasoning、Phi-4-reasoning-plus以及Phi-4-mini-reasoning。據(jù)微軟官方介紹,這些模型不僅繼承了小型模型的高效特性,還在推理能力上取得了重大突破。它們通過(guò)推理時(shí)間擴(kuò)展技術(shù),能夠處理需要多步驟分解和內(nèi)部反思的復(fù)雜任務(wù),尤其在數(shù)學(xué)推理和代理型應(yīng)用中表現(xiàn)卓越。

Phi-4-reasoning模型是一款擁有140億參數(shù)的開(kāi)源推理模型。它結(jié)合了OpenAI o3-mini的高質(zhì)量推理演示數(shù)據(jù),通過(guò)監(jiān)督微調(diào)Phi-4,并利用額外計(jì)算資源,生成了詳細(xì)的推理鏈條。這一特性使得Phi-4-reasoning在處理復(fù)雜推理任務(wù)時(shí),能夠展現(xiàn)出強(qiáng)大的解析和推理能力。

而Phi-4-reasoning-plus增強(qiáng)版則進(jìn)一步通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)提升了性能。與標(biāo)準(zhǔn)版相比,它的tokens用量增加了1.5倍,從而支持更高精度的推理任務(wù)。兩款模型在數(shù)學(xué)推理和博士級(jí)科學(xué)問(wèn)題測(cè)試中,均超越了OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B等模型,甚至在AIME 2025(美國(guó)數(shù)學(xué)奧林匹克資格賽)中擊敗了擁有6710億參數(shù)的DeepSeek-R1滿(mǎn)血模型。

針對(duì)計(jì)算資源有限的環(huán)境,微軟還推出了Phi-4-mini-reasoning模型。這是一款基于Transformer的緊湊型語(yǔ)言模型,專(zhuān)門(mén)優(yōu)化用于數(shù)學(xué)推理。它通過(guò)DeepSeek-R1生成的合成數(shù)據(jù)進(jìn)行了微調(diào),能夠在低延遲場(chǎng)景下提供高質(zhì)量的逐步問(wèn)題解決方案。這款模型覆蓋了從中學(xué)到博士級(jí)的百萬(wàn)級(jí)多樣化數(shù)學(xué)問(wèn)題,非常適合教育應(yīng)用、嵌入式輔導(dǎo)以及邊緣設(shè)備部署。

在多項(xiàng)數(shù)學(xué)基準(zhǔn)測(cè)試中,Phi-4-mini-reasoning模型憑借其3.8億參數(shù)的表現(xiàn),超越了OpenThinker-7B和Llama-3.2-3B-instruct等更大模型,甚至在部分測(cè)試中接近了OpenAI o1-mini的水平。這一成績(jī)充分展示了Phi-4-mini-reasoning在高效性和準(zhǔn)確性方面的卓越表現(xiàn)。

微軟Phi-4-reasoning系列的發(fā)布,無(wú)疑為人工智能領(lǐng)域注入了新的活力。這一系列模型不僅在推理能力上取得了重大突破,還兼顧了高效性和實(shí)用性,為未來(lái)的應(yīng)用和發(fā)展提供了廣闊的空間。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容