在WAVE SUMMIT深度學習開發(fā)者大會上,百度正式推出文心大模型X1.1版本。這款基于文心4.5訓練的深度思考模型,通過迭代式混合強化學習框架實現(xiàn)了顯著升級,在事實準確性、指令遵循能力和智能體交互水平三大維度分別提升34.8%、12.5%和9.6%。
新模型展現(xiàn)出強大的復(fù)雜任務(wù)處理能力。在創(chuàng)意寫作場景中,它能精準調(diào)用內(nèi)置知識庫和聯(lián)網(wǎng)搜索工具,生成結(jié)構(gòu)嚴謹、文辭優(yōu)美的內(nèi)容;面對共享單車用戶的情緒化咨詢時,模型可自動規(guī)劃解決方案并調(diào)用工具,在短時間內(nèi)完成完整服務(wù)流程。權(quán)威評測顯示,該模型整體性能超越DeepSeek R1-0528,在部分任務(wù)上達到國際頂尖水平,與GPT-5和Gemini 2.5 Pro持平。
配套生態(tài)建設(shè)取得突破性進展。飛槳文心生態(tài)已聚集2333萬開發(fā)者,服務(wù)76萬家企業(yè)?,F(xiàn)場發(fā)布的"AI助老公益計劃"頗受關(guān)注,通過百度搜索或小度智能健康屏即可使用的"AI助老智能體",為老年群體提供便捷的數(shù)字化服務(wù)。同時推出的"文心導師·星耀計劃"匯聚了48%的十年以上行業(yè)專家和41%的專業(yè)技術(shù)人員,構(gòu)建起高質(zhì)量的數(shù)據(jù)指導體系。
在數(shù)字人技術(shù)領(lǐng)域,百度推出的劇本驅(qū)動多模協(xié)同方案引發(fā)行業(yè)關(guān)注。該技術(shù)整合語言、聲音和形象生成模塊,實現(xiàn)動態(tài)交互與深度思考的融合。在慧播星平臺的實際應(yīng)用中,數(shù)字人主播已展現(xiàn)出超越真人的帶貨能力,羅永浩數(shù)字人直播首秀即創(chuàng)下行業(yè)GMV新紀錄,部分品類銷售量超過真人主播。
框架層面,飛槳v3.2版本通過計算優(yōu)化、并行策略和容錯機制三大升級,將ERNIE-4.5-300B-A47B模型的預(yù)訓練效率提升至47% MFU。該版本實現(xiàn)92%的類CUDA芯片算子復(fù)用率,并兼容Safetensors權(quán)重體系,顯著降低部署成本。配套推出的FastDeploy部署套件,使大模型在50ms時延下達到57K tokens/秒的輸入吞吐量。
科研領(lǐng)域迎來兩項重要突破:PaddleCFD和PaddleMaterials科學計算套件可提升流體力學與材料科學的研發(fā)效率;GraphNet計算圖數(shù)據(jù)集提供2700余個標準化模型圖,填補AI編譯器測試基準空白?,F(xiàn)場開源的ERNIE-4.5-21B-A3B-Thinking思考模型,在內(nèi)容創(chuàng)作、邏輯推理等任務(wù)中表現(xiàn)優(yōu)異。
開發(fā)工具鏈持續(xù)完善。文心快碼3.5S版本強化多智能體協(xié)同能力,實現(xiàn)"一人即團隊"的開發(fā)模式。目前該工具已服務(wù)超千萬開發(fā)者,百度內(nèi)部45%的新增代碼由AI生成,頭部用戶的AI代碼產(chǎn)出比例更高達75%。中國科技館聯(lián)合發(fā)布的智能體矩陣,聯(lián)動全國28家科技館資源,推動科普服務(wù)智能化升級。