近期,DeepSeek在全球范圍內(nèi)的熱度持續(xù)攀升,引發(fā)廣泛關(guān)注。上海超算計(jì)算中心攜手上海昇騰人工智能創(chuàng)新中心,成功在其依托的昇騰硬件上部署了DeepSeek大模型,這一舉措為行業(yè)市場(chǎng)帶來了全方位的強(qiáng)大支持,依托于上海市人工智能公共算力服務(wù)平臺(tái)。
在模型部署方面,DeepSeek推出了兩款重量級(jí)模型——DeepSeek-R1-Distill-Qwen-32與Janus-Pro-7B。前者專注于復(fù)雜推理任務(wù),通過先進(jìn)的蒸餾技術(shù),模型體積大幅縮減,同時(shí)保持了高質(zhì)量的推理能力。其靈活性與適用性顯著增強(qiáng),能夠以更加合理的資源占用,為自然語言處理、智能推薦系統(tǒng)等應(yīng)用場(chǎng)景提供高效、精準(zhǔn)的服務(wù)。這款模型能夠迅速應(yīng)對(duì)各類復(fù)雜任務(wù),充分滿足了不同行業(yè)對(duì)于復(fù)雜推理的嚴(yán)苛需求。
而Janus-Pro-7B作為DeepSeek推出的前沿多模態(tài)理解和生成模型,在圖像理解與生成方面展現(xiàn)出了卓越的性能。該模型采用了獨(dú)特的獨(dú)立編碼方法,直接利用文本到圖像數(shù)據(jù)進(jìn)行訓(xùn)練,并引入了合成美學(xué)數(shù)據(jù),進(jìn)一步提升了圖像生成的質(zhì)量。無論是從文本生成圖像,還是理解圖片并生成精準(zhǔn)描述,Janus-Pro-7B都能表現(xiàn)出色。盡管在圖像分辨率方面存在一定的局限,但在近景、特寫等特定場(chǎng)景下,其優(yōu)勢(shì)尤為明顯。
在部署方式上,DeepSeek采用了區(qū)域本地化部署策略,充分利用本地服務(wù)器資源,不依賴云服務(wù)。這一舉措為企業(yè)提供了DeepSeek-R1和Janus-Pro兩款模型的接口調(diào)用服務(wù),實(shí)現(xiàn)了開箱即用,極大地提高了企業(yè)的運(yùn)營效率,并滿足了其個(gè)性化業(yè)務(wù)場(chǎng)景的需求。
上海市人工智能公共算力服務(wù)平臺(tái)作為貫徹落實(shí)國家戰(zhàn)略、加快實(shí)施“東數(shù)西算”工程、深化發(fā)展數(shù)字經(jīng)濟(jì)的重要舉措,由上海超級(jí)計(jì)算中心負(fù)責(zé)建設(shè)和運(yùn)營。該平臺(tái)致力于為廣大科研機(jī)構(gòu)和中小企業(yè)提供具有公信力的普惠算力服務(wù),全部采用昇騰AI軟硬件平臺(tái),計(jì)算峰值能力高達(dá)100PFLOPS(FP16)。這一平臺(tái)的建立,為科研探索與產(chǎn)業(yè)創(chuàng)新領(lǐng)域提供了強(qiáng)大的算力底座與模型支持。