科大訊飛近日宣布了一項重大技術(shù)進展,對其深度推理大模型星火X1進行了全面升級,并同步推出了一系列新品,其中包括備受矚目的星火一體機。
此次升級,星火X1的數(shù)學(xué)能力尤為引人注目,其表現(xiàn)已全面對標業(yè)界領(lǐng)先的DeepSeek R1和OpenAI的o1模型??拼笥嶏w表示,升級后的星火X1在數(shù)學(xué)答題效果上有了顯著提升,特別是在解決競賽級難題時,展現(xiàn)出了卓越的能力。星火X1在中小學(xué)數(shù)學(xué)作業(yè)的批改、輔導(dǎo)以及題目推薦等應(yīng)用場景中,也顯現(xiàn)出了顯著的優(yōu)勢。
為了驗證星火X1的升級效果,科大訊飛采用了涵蓋廣泛的測試集,其中包括2023/2024年各學(xué)段考試的真題、模擬題和競賽題,以及來自國際數(shù)學(xué)競賽AIME 2024/2025和MATH 500的英文測試集。
在星火X1的賦能下,科大訊飛的多個應(yīng)用與產(chǎn)品也迎來了升級。其中,訊飛曉醫(yī)首次引入了星火醫(yī)療大模型X1,該模型在回答復(fù)雜醫(yī)療問題時,能夠逐步解釋循證過程,大幅降低了醫(yī)療幻覺問題,提高了醫(yī)療復(fù)雜場景推理的邏輯正確性、專業(yè)性和可解釋性。據(jù)悉,星火醫(yī)療大模型X1在診斷推薦、健康咨詢、檢查檢驗報告解讀等任務(wù)上的表現(xiàn),均已超越了GPT-4o和DeepSeek R1。
訊飛曉醫(yī)與個人健康檔案的融合更加深入,能夠深度洞察用戶健康狀況并思考潛在需求,從而給出更加個性化、具體且實用的醫(yī)療建議。例如,在咨詢疾病用藥時,訊飛曉醫(yī)能夠循證指出正確的用藥原則,并結(jié)合個人健康狀況,給出更詳盡的處理意見和注意事項。
面向教育領(lǐng)域的星火教師助手也迎來了全面升級?;谛腔餢1的升級,星火教師助手在備課和授課過程中,能夠給出更清晰、更詳實的AI教學(xué)思路。在備課時,星火教師助手能夠結(jié)合教師意圖,明確教學(xué)的重難點和目標,并在教學(xué)設(shè)計生成過程中逐步說明,便于教師理解生成內(nèi)容的邏輯性,激發(fā)創(chuàng)新靈感。
在授課過程中,星火教師助手通過思維鏈顯性化呈現(xiàn),讓師生能夠?qū)崟r觀測認知思維的構(gòu)建過程,使課堂互動更加直觀,更易于開展探究式學(xué)習(xí)。目前,這些能力已在數(shù)學(xué)、語文、歷史等多個學(xué)科上得到了應(yīng)用,有助于教學(xué)創(chuàng)新和學(xué)生高階思維能力的培養(yǎng)。
在法律領(lǐng)域,科大訊飛也推出了升級版的AI法官助理。該助理將星火長思維鏈深度推理技術(shù)、法律法規(guī)和司法解釋等專業(yè)知識以及法律專家思維鏈深度融合,不僅解決了傳統(tǒng)大模型存在的知識幻覺問題,還提升了證據(jù)審查、量刑輔助、裁判觀點總結(jié)等復(fù)雜場景下的法律推理能力。例如,在裁判觀點總結(jié)場景中,AI法官助理能夠根據(jù)卷宗材料總結(jié)案件事實,逐條分析對比事實與匹配的法律法規(guī)和案例,并將過程可視化,輸出附有法理依據(jù)的裁判觀點,為辦案提供有力的決策依據(jù)。
目前,星火大模型的能力已經(jīng)貫穿案情分析、證據(jù)審查、庭審提綱輔助生成、裁判輔助等多個環(huán)節(jié),為法律領(lǐng)域的智能化發(fā)展注入了新的動力。