在人工智能領(lǐng)域,一個曾經(jīng)遙不可及的夢想正逐漸變?yōu)楝F(xiàn)實(shí)。階躍星辰創(chuàng)始人兼CEO姜大昕,在近期的一次生態(tài)開放日活動中分享了他對通用人工智能(AGI)的見解與公司的最新進(jìn)展。
階躍星辰,這家成立于2023年的大模型公司,由微軟前全球副總裁姜大昕親自掛帥。公司自成立以來,便吸引了上海國資、騰訊、五源資本和啟明創(chuàng)投等多家知名投資機(jī)構(gòu)的青睞,成為業(yè)內(nèi)備受矚目的“六小龍”之一。
姜大昕在演講中透露,階躍星辰從成立之初便制定了實(shí)現(xiàn)AGI的宏偉藍(lán)圖,這一藍(lán)圖被劃分為模擬世界、探索世界和歸納世界三個階段。在模擬世界階段,公司致力于訓(xùn)練模型模仿學(xué)習(xí)各種模態(tài)的表征,并逐步培養(yǎng)模型解決復(fù)雜問題的能力。
“為了實(shí)現(xiàn)這一目標(biāo),我們引入了強(qiáng)化學(xué)習(xí)的方法?!苯箨恐赋?,“強(qiáng)化學(xué)習(xí)能夠讓模型學(xué)會探索的過程,學(xué)會慢思考。正如AlphaGo和最近大火的DeepSeek所采用的訓(xùn)練方法一樣?!比欢?,姜大昕強(qiáng)調(diào),強(qiáng)化學(xué)習(xí)并非AI的終點(diǎn),AI的下一個重要突破將是機(jī)器能夠自主學(xué)習(xí),主動發(fā)現(xiàn)物理規(guī)律。
在談到DeepSeek時,姜大昕對其開源模型表示贊賞,認(rèn)為這為整個AI社區(qū)做出了巨大貢獻(xiàn)。受此啟發(fā),階躍星辰近期也發(fā)布了兩款開源的多模態(tài)大模型——一款是300億參數(shù)的文生視頻模型,另一款則是1300億參數(shù)的語音模型Step Audio。姜大昕表示,希望這兩款模型的開源能夠激發(fā)開發(fā)者的創(chuàng)造力,推動更多豐富多彩的應(yīng)用誕生。
姜大昕還透露了階躍星辰正在研發(fā)的推理模型Open-Reasoner-Zero。據(jù)他介紹,該模型在效率上相比DeepSeek-R1-Zero有著顯著提升,可達(dá)25倍之多。更令人振奮的是,階躍星辰將開源該模型的實(shí)驗(yàn)結(jié)果、代碼數(shù)據(jù)和論文,為AI社區(qū)貢獻(xiàn)更多智慧。
在視覺推理模型方面,姜大昕認(rèn)為視覺和文本一樣,面對復(fù)雜問題時同樣需要慢思考和思維鏈的能力。他強(qiáng)調(diào),如何將強(qiáng)化學(xué)習(xí)的方法引入視覺領(lǐng)域,實(shí)現(xiàn)慢思考,是當(dāng)前AI領(lǐng)域的前沿問題。階躍星辰正在這一領(lǐng)域進(jìn)行積極探索。
對于大模型的應(yīng)用發(fā)展,姜大昕指出Agent已成為海內(nèi)外公認(rèn)的AI超級應(yīng)用。Agent能夠自主幫助人類完成復(fù)雜的任務(wù),具備自動和主動兩大特點(diǎn)。自動意味著在執(zhí)行任務(wù)時盡可能減少或無需人類干預(yù);而主動則意味著Agent能夠觀察用戶環(huán)境,主動發(fā)起或完成任務(wù)。
“為什么Agent會在眼下這個時間點(diǎn)突然變得火熱?”姜大昕解釋道,“這是因?yàn)锳gent的爆發(fā)需要多模態(tài)和慢思考兩大能力,而這兩個能力在2024年都已得到實(shí)現(xiàn)?!彼J(rèn)為,多模態(tài)能力使Agent能夠充分理解和感知世界,更好地理解用戶任務(wù);而強(qiáng)大的推理能力則能夠提升任務(wù)完成率和效率。
姜大昕還預(yù)測,未來每一臺終端設(shè)備都將配備一個Agent,其能力將從簡單任務(wù)、組合任務(wù)、復(fù)雜任務(wù)逐步升級到主動發(fā)起任務(wù)和最后的情感陪伴。這一愿景無疑為AI的未來發(fā)展開辟了無限可能。