這篇報告主要講了人工智能大模型的發(fā)展情況,尤其是DeepSeek的創(chuàng)新和應(yīng)用,還介紹了大模型在各個領(lǐng)域的應(yīng)用以及如何幫助個人提升工作和生活效率。
1. 大模型發(fā)展現(xiàn)狀:人工智能發(fā)展迅速,應(yīng)用廣泛,大模型成為關(guān)鍵技術(shù)。DeepSeek自2023年11月起陸續(xù)發(fā)布多個版本,引發(fā)熱潮。全球很多云服務(wù)廠商都接入了DeepSeek,它在央國企和政務(wù)領(lǐng)域得到了大量應(yīng)用,像在通信、能源、汽車、金融等行業(yè),以及北京、廣東等多地的政務(wù)工作中都發(fā)揮了作用。DeepSeek有文件處理、多種任務(wù)處理、聯(lián)網(wǎng)搜索和深度思考的能力,它通過思維鏈技術(shù)提升推理能力,但也存在局限性 。在發(fā)展過程中,它經(jīng)過多個階段的演化,性能不斷提升,還能對其他開源模型進行蒸餾訓(xùn)練,讓小模型也有更好的表現(xiàn)。
2. 大模型發(fā)展趨勢:隨著芯片技術(shù)發(fā)展受限,大模型開始依靠優(yōu)化架構(gòu)來提升知識密度,并且每8個月左右知識密度就能提升一倍。訓(xùn)練方式也在改變,合成數(shù)據(jù)訓(xùn)練越來越普遍,強化學(xué)習(xí)讓AI模型能夠自我迭代?,F(xiàn)在的大模型可以分為概率預(yù)測和鏈?zhǔn)酵评韮深?,各有特點和適用場景。高質(zhì)量的數(shù)據(jù)對大模型很重要,通用大模型和垂域大模型會一起發(fā)展,小模型本地部署也會因為資源需求低和數(shù)據(jù)安全等優(yōu)勢成為主流。
3. 大模型重點應(yīng)用場景:在現(xiàn)實世界中,端側(cè)大模型用在智能眼鏡、手機、智慧臺燈等設(shè)備上;具身智能結(jié)合大模型在工業(yè)、醫(yī)療等領(lǐng)域發(fā)揮作用;醫(yī)療大模型能進行病歷生成、醫(yī)學(xué)問答等工作。在數(shù)字世界里,大模型可以用于智能客服、金融業(yè)務(wù)、內(nèi)容創(chuàng)作,還能通過智能體拓展功能。不過,大模型應(yīng)用落地需要逐步推進,先試點驗證成果,再進行推廣。
4. DeepSeek能力賦能個人發(fā)展:我們可以通過網(wǎng)頁端和手機端多種方式使用DeepSeek。它能幫助我們進行文本讀寫,比如寫公文、閱讀文檔、搜索知識、寫論文;在辦公方面,能處理會議紀(jì)要,生成PPT、圖表、流程圖;在創(chuàng)意設(shè)計上,能制作演講插圖、海報、創(chuàng)意圖片和視頻。它還能用于搭建個人知識庫、編程、處理Excel表格、設(shè)置工作流等。如果DeepSeek的回答效果不好,還可以把思考過程復(fù)制給其他大模型。我們還能本地部署AI工具,對特定領(lǐng)域的模型進行微調(diào),在和AI協(xié)作時,要發(fā)揮人類的優(yōu)勢 。