滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 行業(yè)動(dòng)態(tài) > 正文內(nèi)容

DeepSeek梁文鋒：以“小力出奇跡”挑戰(zhàn)字節(jié)的“大力”時(shí)代

時(shí)間：2025-01-28 21:02 來源：字母榜作者：顧青青

在AI領(lǐng)域，一位新星正以獨(dú)特的姿態(tài)崛起，他就是DeepSeek的創(chuàng)始人梁文鋒。與眾多科技巨頭的大手筆投入不同，梁文鋒和他的團(tuán)隊(duì)正走在一條截然不同的道路上，卻同樣收獲了令人矚目的成果。

近日，DeepSeek發(fā)布了新一代多模態(tài)大模型Janus-Pro，該模型分為70億參數(shù)和15億參數(shù)兩個(gè)版本，并且全部開源。這一消息迅速在AI界引起了轟動(dòng)，Janus-Pro一經(jīng)發(fā)布便登上了知名AI開源社區(qū)Hugging Face的模型熱門榜，甚至在前五名中占據(jù)了四席之地。

據(jù)DeepSeek介紹，相比去年11月發(fā)布的JanusFlow，Janus-Pro在訓(xùn)練策略上進(jìn)行了優(yōu)化，擴(kuò)展了訓(xùn)練數(shù)據(jù)，模型規(guī)模也更大。在多模態(tài)理解和文本到圖像的指令跟蹤功能方面，Janus-Pro取得了重大進(jìn)步，同時(shí)增強(qiáng)了文本到圖像生成的穩(wěn)定性。這一系列的改進(jìn)使得Janus-Pro在多項(xiàng)基準(zhǔn)測試中表現(xiàn)出色，甚至在某些方面超越了OpenAI的DALL-E 3和Stable Diffusion。

值得注意的是，DeepSeek的“小力出奇跡”策略再次得到了驗(yàn)證。與眾多投入巨資打造大模型的科技公司不同，DeepSeek以較小的參數(shù)量和較低的成本實(shí)現(xiàn)了令人驚艷的效果。這種策略不僅體現(xiàn)在Janus-Pro上，早在本月早些時(shí)候發(fā)布的R1大模型上就已經(jīng)初露鋒芒。R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能號稱可以比肩OpenAI的o1模型正式版，但DeepSeek所花費(fèi)的資金和資源卻遠(yuǎn)遠(yuǎn)低于OpenAI。

DeepSeek的這種策略對AI行業(yè)的傳統(tǒng)思維構(gòu)成了挑戰(zhàn)。長期以來，許多科技公司都信奉“大力出奇跡”的理念，認(rèn)為只有投入巨資和資源才能取得突破。然而，DeepSeek的成功證明，在技術(shù)創(chuàng)新的加持下，“小力”同樣可以創(chuàng)造“奇跡”。這一發(fā)現(xiàn)不僅揭示了一條新的技術(shù)路線，也蘊(yùn)含著新的商業(yè)哲學(xué)。

在Janus-Pro發(fā)布之前，R1大模型已經(jīng)讓科技界為之驚嘆。而Janus-Pro的發(fā)布更是進(jìn)一步鞏固了DeepSeek在AI領(lǐng)域的地位。據(jù)DeepSeek披露的信息，Janus-Pro的訓(xùn)練成本相對較低，使用輕量級的分布式訓(xùn)練框架，1.5億參數(shù)模型大約需要使用128張英偉達(dá)A100芯片訓(xùn)練7天，70億參數(shù)模型則需要256張A100芯片和14天訓(xùn)練時(shí)間。這樣的成本在大模型訓(xùn)練成本動(dòng)輒以億為單位的大環(huán)境中顯得尤為突出。

除了成本上的優(yōu)勢外，Janus-Pro在性能上也表現(xiàn)出色。它采用自回歸框架，將多模態(tài)理解和生成統(tǒng)一起來，通過解耦視覺編碼來增強(qiáng)框架的靈活性。這種設(shè)計(jì)使得Janus-Pro在多模態(tài)理解和生成方面取得了顯著進(jìn)步。在實(shí)際應(yīng)用中，無論是文生圖還是圖生文任務(wù)，Janus-Pro都能生成高質(zhì)量的結(jié)果。

DeepSeek的開源策略也為其贏得了廣泛的關(guān)注和贊譽(yù)。Janus-Pro使用MIT協(xié)議進(jìn)行開源，使得個(gè)人和中小企業(yè)能夠以較低的成本使用這一先進(jìn)的大模型。由于模型體量相對較小，Janus-Pro還可以在PC端安裝、本地運(yùn)行，進(jìn)一步降低了使用成本。

DeepSeek的成功對AI行業(yè)產(chǎn)生了深遠(yuǎn)的影響。它不僅打破了傳統(tǒng)的大模型訓(xùn)練成本高昂的固有印象，還展示了技術(shù)創(chuàng)新在推動(dòng)AI發(fā)展方面的重要作用。與此同時(shí)，DeepSeek的開源策略也為AI技術(shù)的普及和應(yīng)用提供了有力的支持。

然而，DeepSeek的成功并非沒有挑戰(zhàn)。在AI領(lǐng)域，許多科技公司仍然堅(jiān)持“大力出奇跡”的策略，投入巨資和資源進(jìn)行研發(fā)。隨著AI技術(shù)的不斷發(fā)展，新的競爭者和挑戰(zhàn)者也在不斷涌現(xiàn)。因此，DeepSeek需要不斷創(chuàng)新和進(jìn)步，以保持其在AI領(lǐng)域的領(lǐng)先地位。

盡管如此，DeepSeek已經(jīng)以其獨(dú)特的策略和卓越的表現(xiàn)成為了AI領(lǐng)域的一股不可忽視的力量。它的成功不僅為AI技術(shù)的發(fā)展提供了新的思路和方法，也為整個(gè)行業(yè)的發(fā)展注入了新的活力和動(dòng)力。

03-02

微軟TypeScript 5.8發(fā)布：強(qiáng)化代碼安全，提升編譯性能

03-02

SpaceX星艦第八次試飛再延期，3月4日能否成功起飛？

03-02

346萬豪車換擋異常，維修40天難退車，蘭博基尼車主維權(quán)路何在？

03-02

華為Mate 70 Pro優(yōu)享版3月5日來襲，性能升級價(jià)格更親民？

03-02

《死月妖花》重制版《祀月耀花》登陸Steam，恐怖視覺小說再續(xù)前緣！

03-02

微軟2025年起將移除Windows中的DES加密算法，增強(qiáng)系統(tǒng)安全性

03-02

華為注冊“兼容鴻蒙電腦”商標(biāo)，新折疊屏機(jī)型呼之欲出？

03-02

劉永好兩會前夕揭秘：AI獨(dú)角獸DeepSeek僅160人團(tuán)隊(duì)，如何創(chuàng)造大影響？

03-02

智能家居讓生活大變樣，你還在等什么？

03-02

華為Pura 80系列來襲，5月見證國產(chǎn)1英寸超大底主攝新突破

03-02

樹莓派基金會新刊RPOM亮相，融合The MagPi與HackSpace精華

03-02

iPhone17全系渲染圖出爐：取消Plus推Air，外觀大變革！

03-02

小鵬新款G6官圖曝光：顏值飆升，一體化日行燈成亮點(diǎn)

03-01

小米SU7 Ultra震撼上市：2.1秒破百，極速超350km/h，配置曝光！

03-01

點(diǎn)擊查看更多 +

全站最新

尼康Z50II：高性能微單，一鍵解鎖個(gè)性色彩，攝影創(chuàng)作新境界

尼康Z50II攜手云創(chuàng)服務(wù)：攝影師如何實(shí)現(xiàn)創(chuàng)意與效率的雙重飛躍？

尼康Z50II：攝影神器，輕松拍出驚艷大片，后期服務(wù)更便捷！

小米Buds 5 Pro耳機(jī)京東首發(fā)：雙功放三單元，降噪新體驗(yàn)，享12期免息

華為新商標(biāo)“二郎神”“雷震子”曝光，智能汽車領(lǐng)域再添新布局？

聯(lián)想京東超品周：AI煥新多重福利，共繪企業(yè)智能化升級藍(lán)圖

熱門內(nèi)容

本欄最新

小鵬新款G6官圖曝光：顏值飆升，一體化日行燈成亮點(diǎn)

小米SU7 Ultra震撼上市：2.1秒破百，極速超350km/h，配置曝光！

英偉達(dá)股價(jià)大跌8%，市值一夜蒸發(fā)近2萬億！AI芯片龍頭怎么了？

華為Mate 70 Pro優(yōu)享版來襲！起售價(jià)6199元，遺憾錯(cuò)過國補(bǔ)

驍龍8 Elite跌破3000大關(guān)，逼近2500元，廠商利潤何在？

新款坦克300霸氣開訂！汽油、柴油、Hi4混動(dòng)，三款動(dòng)力任你選

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

DeepSeek梁文鋒：以“小力出奇跡”挑戰(zhàn)字節(jié)的“大力”時(shí)代