2024年,人工智能領(lǐng)域迎來了一個(gè)充滿變革與創(chuàng)新的一年。從生成式大模型的飛速發(fā)展到多模態(tài)技術(shù)的廣泛應(yīng)用,再到AI硬件的突破性創(chuàng)新,這一年見證了科技界和風(fēng)險(xiǎn)投資圈的密切關(guān)注與高度期待。
生成式人工智能大模型在這一年中繼續(xù)發(fā)揮著引領(lǐng)作用,盡管沒有像GPT-3或ChatGPT那樣橫空出世,但技術(shù)上的持續(xù)突破和廣泛應(yīng)用仍然令人矚目。OpenAI在這一年中尤為活躍,不僅發(fā)布了新一代推理模型系列o3,還在多模態(tài)領(lǐng)域推出了Sora,這一工具能夠生成高度逼真的視頻內(nèi)容,并配備了故事板和混剪等編輯功能,極大地滿足了創(chuàng)作者的需求。
隨著多模態(tài)大語言模型(MLLMs)的崛起,AI技術(shù)開始更加自然地融合文本、圖像、音頻和視頻等多種模態(tài)的數(shù)據(jù),生成高度準(zhǔn)確的視覺內(nèi)容。例如,李飛飛創(chuàng)辦的World Labs用一張圖、一句話就能生成3D世界的AI系統(tǒng),這項(xiàng)技術(shù)不僅降低了3D內(nèi)容制作的成本,還激發(fā)了更多的沉浸式體驗(yàn)。
在算力方面,英偉達(dá)憑借其H100 GPU和新一代GPU架構(gòu)Blackwell,在AI訓(xùn)練與推理方面展現(xiàn)了卓越性能,進(jìn)一步鞏固了其在行業(yè)中的領(lǐng)導(dǎo)地位。同時(shí),谷歌的TPU和亞馬遜的Inferentia等定制芯片也在加速普及,推動(dòng)了算力效率的持續(xù)提升。
在應(yīng)用層面,2024年可以說是AI大模型全面爆發(fā)的一年。從辦公效率工具到精準(zhǔn)醫(yī)療,從智能金融到數(shù)字人直播體驗(yàn),AI技術(shù)開始廣泛滲透到各個(gè)行業(yè),成為推動(dòng)行業(yè)變革的重要力量。例如,微軟Copilot通過文章寫作、PPT制作等功能,為用戶節(jié)省了大量時(shí)間,并生成了新穎、有創(chuàng)意的成果。
在金融、法律、醫(yī)療等專業(yè)領(lǐng)域,盡管存在一些具有針對性的AI應(yīng)用,但尚未實(shí)現(xiàn)廣泛的“破圈”。紅杉資本在報(bào)告中指出,AI在各專業(yè)場景中的深度整合是未來趨勢,這一過程正在持續(xù)進(jìn)化之中。
AI搜索引擎在2024年也取得了顯著進(jìn)展。Perplexity AI、Glean等企業(yè)在融資方面取得了重要突破,OpenAI也推出了搜索引擎產(chǎn)品SearchGPT。這些進(jìn)展背后,是大模型、RAG技術(shù)以及算力的不斷進(jìn)步,讓搜索結(jié)果變得更加簡單可靠。
在廣告領(lǐng)域,美國數(shù)字營銷公司AppLovin通過生成式AI和動(dòng)態(tài)預(yù)算優(yōu)化,大幅提高了投資回報(bào)率和貨幣化機(jī)會(huì),其股價(jià)在一年內(nèi)飆升了超過977%。同樣,基于提示詞自動(dòng)生成應(yīng)用程序的AI公司Cursor也迅速崛起,成為百萬程序員的必備神器。
在硬件方面,AI技術(shù)也開始融入手機(jī)、PC、汽車等各類設(shè)備,增強(qiáng)了用戶體驗(yàn)。蘋果和Google推出的AI手機(jī)成為行業(yè)標(biāo)志性事件,端側(cè)AI(On-device AI)的流行讓AI模型能夠在本地設(shè)備上運(yùn)行,實(shí)現(xiàn)實(shí)時(shí)響應(yīng)和互聯(lián)互通。
具身智能(Embodied AI)也在2024年取得了顯著進(jìn)步。特斯拉Optimus機(jī)器人和Figure AI人形機(jī)器人Figure 02等產(chǎn)品在運(yùn)動(dòng)控制、任務(wù)執(zhí)行和學(xué)習(xí)能力方面不斷提升,開始在汽車生產(chǎn)線等場景中發(fā)揮作用。
在競爭格局方面,2024年不再是OpenAI一枝獨(dú)秀的局面。Claude和Gemini等大模型開始挑戰(zhàn)OpenAI的領(lǐng)先地位,市場份額不斷增長。Anthropic通過提出“憲法AI”的理念,強(qiáng)調(diào)安全性和可靠性,贏得了企業(yè)級(jí)用戶的青睞。而Google則通過整合DeepMind團(tuán)隊(duì),推出了多模態(tài)能力更強(qiáng)的Gemini 2.0,并在云平臺(tái)上深度布局AI,以吸引更多企業(yè)客戶。
在國內(nèi),阿里巴巴和字節(jié)跳動(dòng)等企業(yè)也在積極布局AI領(lǐng)域。阿里巴巴依托阿里云生態(tài),推出了通義千問大模型,為企業(yè)提供定制化的行業(yè)解決方案。字節(jié)跳動(dòng)則通過成立Flow部門,專注于AI模型的技術(shù)開發(fā)與應(yīng)用,并推出了一系列AI產(chǎn)品和硬件,以更低價(jià)格和更易落地的策略搶占市場先機(jī)。
總的來說,2024年是人工智能領(lǐng)域充滿變革與創(chuàng)新的一年。從生成式大模型的技術(shù)突破到多模態(tài)應(yīng)用的全面爆發(fā),再到AI硬件的突破性創(chuàng)新,AI技術(shù)已經(jīng)開始深刻改變社會(huì)經(jīng)濟(jì)格局。盡管未來仍面臨算力、幻覺、成本、倫理和監(jiān)管等挑戰(zhàn),但人工智能的發(fā)展?jié)摿σ廊痪薮?,值得期待?/p>