在近日舉行的Build 2025開發(fā)者盛會(huì)上,微軟公司震撼發(fā)布了一系列針對(duì)Windows平臺(tái)的AI開發(fā)新工具和特性,其中最引人注目的當(dāng)屬Windows AI Foundry這一全新統(tǒng)一平臺(tái)的問世。該平臺(tái)旨在為本地AI開發(fā)提供前所未有的強(qiáng)大支持,通過整合Windows Copilot Runtime及多項(xiàng)創(chuàng)新功能,進(jìn)一步推動(dòng)Windows生態(tài)內(nèi)AI應(yīng)用的蓬勃發(fā)展。
Windows AI Foundry的推出,標(biāo)志著微軟在本地AI開發(fā)領(lǐng)域邁出了關(guān)鍵步伐。該平臺(tái)不僅集成了已在Windows平臺(tái)上為本地AI應(yīng)用提供支持的Windows Copilot Runtime,還通過Windows AI API和Windows機(jī)器學(xué)習(xí)(ML)功能,讓AI模型得以在本地持續(xù)高效運(yùn)行。而Windows AI Foundry的拓展,則為開發(fā)者提供了即用型AI API,這些API由內(nèi)置AI模型驅(qū)動(dòng),滿足開發(fā)者多樣化的本地AI應(yīng)用開發(fā)需求。
該平臺(tái)的一大亮點(diǎn)在于其提供的定制Windows內(nèi)置模型工具,開發(fā)者可針對(duì)自身應(yīng)用的特定需求對(duì)模型進(jìn)行優(yōu)化調(diào)整。Windows AI Foundry還支持從Azure AI Foundry引入開源模型,極大地豐富了開發(fā)者可使用的模型資源。同時(shí),它還配備了一個(gè)推理運(yùn)行時(shí),讓開發(fā)者能夠輕松地將自己開發(fā)的模型集成到應(yīng)用中。
在AI模型的集成方面,Windows AI Foundry展現(xiàn)出了卓越的兼容性。它不僅整合了來自Azure Foundry Local的AI模型,還支持其他模型目錄,如Ollama和NVIDIA NIMs。微軟自家的Foundry Local模型目錄則提供經(jīng)過優(yōu)化的AI模型,這些模型能夠在CPU、GPU和NPU等多種硬件平臺(tái)上高效運(yùn)行。開發(fā)者只需通過簡單的命令即可瀏覽、下載和測(cè)試與設(shè)備兼容的模型,并利用Foundry Local SDK輕松將Foundry Local集成到自己的應(yīng)用中,從而大大降低了開發(fā)難度和時(shí)間成本。
Windows ML作為Windows內(nèi)置的AI推理運(yùn)行時(shí),在Windows AI Foundry中扮演著重要角色。它基于DirectML開發(fā),能夠在AMD、Intel、NVIDIA和Qualcomm等多種芯片平臺(tái)上高效運(yùn)行。Windows ML的出現(xiàn)極大地簡化了模型部署流程,使開發(fā)者無需擔(dān)憂未來硬件更新帶來的兼容性問題。該運(yùn)行時(shí)能夠自動(dòng)更新所有必要的依賴項(xiàng),并在后臺(tái)自動(dòng)適配新的芯片架構(gòu),確保應(yīng)用的穩(wěn)定性和性能。
微軟還宣布了對(duì)LoRA(Low-Rank Adaptation)技術(shù)的支持。這一技術(shù)能夠在Phi Silica模型上實(shí)現(xiàn)對(duì)模型參數(shù)的小部分微調(diào),通過自定義數(shù)據(jù)進(jìn)行微調(diào),LoRA能夠顯著提升模型在特定任務(wù)上的性能表現(xiàn)。目前,LoRA已進(jìn)入公開預(yù)覽階段,并已在Snapdragon X系列NPU上實(shí)現(xiàn)支持。未來幾個(gè)月內(nèi),LoRA還將擴(kuò)展到Intel和AMD的Copilot+ PC上,為更多開發(fā)者提供這一高效的微調(diào)工具。
微軟還推出了新的語義搜索API,幫助開發(fā)者在其應(yīng)用中創(chuàng)建AI驅(qū)動(dòng)的搜索體驗(yàn)。這些API支持本地運(yùn)行,并集成了RAG(Retrieval-Augmented Generation)技術(shù),能夠提供更加智能和高效的搜索結(jié)果。目前,語義搜索API已在所有Copilot+ PC上進(jìn)入私有預(yù)覽階段,開發(fā)者可利用這些API將AI驅(qū)動(dòng)的搜索功能集成到自己的應(yīng)用中,為用戶提供更加個(gè)性化的搜索體驗(yàn)。