京東科技人工智能團(tuán)隊(duì)再度傳來捷報(bào),憑借其“多模態(tài)交互式數(shù)字人關(guān)鍵技術(shù)及產(chǎn)業(yè)應(yīng)用”項(xiàng)目,榮獲了中國(guó)智能科學(xué)技術(shù)領(lǐng)域的頂級(jí)獎(jiǎng)項(xiàng)——吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)的特等獎(jiǎng),這也是本年度該獎(jiǎng)項(xiàng)的唯一殊榮。這一消息由“京東黑板報(bào)”于近日正式公布。
京東在人工智能領(lǐng)域的成就斐然,此前已在2021年和2022年分別憑借“商品智能匹配關(guān)鍵技術(shù)及在營(yíng)銷中的應(yīng)用”和“任務(wù)型智能對(duì)話交互關(guān)鍵技術(shù)及大規(guī)模產(chǎn)業(yè)應(yīng)用”項(xiàng)目獲獎(jiǎng)。此次再度斬獲獎(jiǎng)項(xiàng),無疑進(jìn)一步鞏固了其在人工智能領(lǐng)域的領(lǐng)先地位。
多模態(tài)交互式數(shù)字人技術(shù),作為當(dāng)前國(guó)內(nèi)外研究的前沿領(lǐng)域,集成了語音、語義、形象等多種技術(shù),面臨著諸多挑戰(zhàn)。然而,京東科技人工智能團(tuán)隊(duì)卻在這一領(lǐng)域取得了顯著的技術(shù)突破。
他們首先提出了低成本、高保真的人體建模技術(shù),有效解決了人體建模成本高、觀感差的問題。同時(shí),團(tuán)隊(duì)還研發(fā)了語義一致多模態(tài)應(yīng)答技術(shù),解決了多模態(tài)語義難對(duì)齊、應(yīng)答弱的難題。他們還創(chuàng)新性地提出了多模態(tài)自然化行為生成技術(shù),使得多樣化行為能夠協(xié)調(diào)一致,避免了交互過程中的虛假感。
京東在2024年成功開啟了多模態(tài)交互式數(shù)字人的商業(yè)化應(yīng)用,并迅速取得了顯著成效。截至目前,該技術(shù)已經(jīng)服務(wù)了超過9000家商家,為商家?guī)砹顺^140億的銷售增量。這一成果不僅證明了京東在人工智能領(lǐng)域的實(shí)力,也為其未來的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
不僅如此,京東的言犀數(shù)字人技術(shù)近日也迎來了升級(jí)。通過引入語音合成大模型LiveTTS及通用數(shù)字人大模型LiveHuman,用戶現(xiàn)在只需輸入自然語言或提供1秒的視頻/照片,即可快速生成4K超高清、口型完全匹配的數(shù)字人。這一技術(shù)的升級(jí),無疑將進(jìn)一步提升京東在數(shù)字人領(lǐng)域的競(jìng)爭(zhēng)力。
京東科技人工智能團(tuán)隊(duì)的這一成果,不僅是對(duì)自身技術(shù)實(shí)力的肯定,也是對(duì)中國(guó)智能科學(xué)技術(shù)發(fā)展的貢獻(xiàn)。他們的努力和創(chuàng)新,將推動(dòng)人工智能技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。