騰訊近日在深夜里揭曉了一項重要技術進展,自研的深度思考模型——混元T1正式版正式面世。這款模型在多個基準測試中展現(xiàn)出了卓越的推理能力。
在業(yè)界公認的評估標準上,混元T1表現(xiàn)尤為亮眼。例如,在大型語言模型評估增強數(shù)據(jù)集MMLU-PRO中,它取得了87.2分的高分,僅次于頂尖模型o1。在Ceval、AIME以及Zebra Logic等一系列中英文知識及競賽級數(shù)學、邏輯推理的基準測試中,混元T1的成績同樣達到了行業(yè)領先的推理模型水平。
騰訊的混元大模型之前已在Chatbot Arena榜單上嶄露頭角,成功躋身全球前15名。該榜單通過用戶匿名與多個模型互動,并根據(jù)投票結(jié)果生成排名,被視為大模型直接比拼的重要舞臺。
追溯至去年9月,騰訊推出了采用MoE架構(gòu)的新一代大模型混元Turbo,相較于上一代產(chǎn)品,其推理效率提升了一倍,推理成本則降低了50%。這一技術革新為混元T1的推出奠定了堅實基礎。
而在本月初,騰訊元寶電腦版App的發(fā)布更是內(nèi)置了混元和DeepSeek兩種模型,用戶可以在兩種模式間自由切換,體驗不同模型帶來的智能服務。
騰訊在人工智能領域的持續(xù)探索和突破,不僅展現(xiàn)了其技術實力,也為行業(yè)帶來了新的發(fā)展動力。隨著混元T1的正式推出,未來在更多應用場景中,或?qū)⒁娮C更多由騰訊AI技術引領的創(chuàng)新實踐。