近期,隨著一年一度的高考英語科目圓滿落幕,英語作文題目再度激發(fā)了社會各界的熱烈討論。令人矚目的是,今年不僅有真實的考生參與,還有六款深度推理大模型作為“特別考生”,一同參與了這場作文挑戰(zhàn)。
在這場別開生面的測試中,各個大模型需要扮演紅星中學(xué)高三學(xué)生李華的角色,就聯(lián)合國倡議征集活動的建議,給外國好友Jim回復(fù)一封郵件。參與的大模型包括DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混元T1、訊飛星火X1以及百度文心X1。在關(guān)閉網(wǎng)絡(luò)搜索功能后,這些大模型憑借深度思考模式,開始了各自的創(chuàng)作。
在諸多大模型的作文中,訊飛星火X1的表現(xiàn)尤為亮眼。其作文不僅立意新穎,而且用詞精準高級,獲得了兩位資深英語教師的極高評價。北京市十一學(xué)校一分校的英語老師韓憲昌和深圳中學(xué)的英語教師趙文嘉,分別給予了訊飛星火X1內(nèi)容8分、語言8分、結(jié)構(gòu)4分,總分20分,以及19分的高分。綜合兩位教師的評分,訊飛星火X1的平均得分位居首位,充分證明了其在英語寫作方面的強大實力。
訊飛星火X1之所以能在眾多競爭者中拔得頭籌,關(guān)鍵在于其內(nèi)容的完整性和語言的準確性。其作文在審題、句式多樣性、邏輯清晰度以及理由的充分性方面,均展現(xiàn)出了卓越的水平。訊飛星火X1在4月20日完成的一次全新升級,也對其在本次測評中的出色表現(xiàn)起到了積極作用。盡管其模型參數(shù)相比業(yè)界同類模型小了一個數(shù)量級,但整體效果已經(jīng)可以與OpenAI o1和DeepSeek R1相媲美,且在邏輯推理、文本生成和語言理解等能力上有了顯著提升。