滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 智能出行 > 正文內(nèi)容

Hugging Face發(fā)布SmolVLM系列：小巧而強(qiáng)大的視覺語言模型登場

時(shí)間：2025-01-26 20:38 來源：ITBEAR作者：楊凌霄

近日，Hugging Face 推出了兩款創(chuàng)新的多模態(tài)模型——SmolVLM-256M和SmolVLM-500M，這兩款模型在視覺與語言處理領(lǐng)域引起了廣泛關(guān)注。其中，SmolVLM-256M更是被譽(yù)為全球最小的視覺語言模型，這一突破性的成就令人矚目。

據(jù)了解，這兩款模型均源自Hugging Face團(tuán)隊(duì)去年訓(xùn)練的龐大800億參數(shù)模型，通過精心的蒸餾技術(shù)提煉而成。它們成功地在高性能與資源效率之間找到了完美的平衡點(diǎn)。官方強(qiáng)調(diào)，無論是SmolVLM-256M還是SmolVLM-500M，都無需復(fù)雜配置，即可“即插即用”，輕松部署在transformer MLX和ONNX平臺(tái)上。

從技術(shù)細(xì)節(jié)來看，SmolVLM-256M和SmolVLM-500M均采用了SigLIP作為圖像編碼器，而文本編碼任務(wù)則交由SmolLM2完成。SmolVLM-256M以其小巧的體積脫穎而出，成為目前最小的多模態(tài)模型。它能夠接收任意序列的圖像和文本輸入，并生成相應(yīng)的文字輸出，功能涵蓋圖像描述、視頻字幕生成、PDF處理等。尤為該模型體積小巧，即便在移動(dòng)平臺(tái)上也能流暢運(yùn)行，僅需不到1GB的GPU顯存即可完成單張圖像的推理任務(wù)。

相比之下，SmolVLM-500M則針對(duì)高性能需求進(jìn)行了優(yōu)化。Hugging Face表示，這款模型非常適合企業(yè)運(yùn)營環(huán)境，盡管其資源需求略高于SmolVLM-256M，但在推理輸出的精準(zhǔn)度上有了顯著提升。具體來說，SmolVLM-500M在處理單張圖像時(shí)，僅需1.23GB的GPU顯存。

這兩款模型均遵循Apache 2.0開源協(xié)議，研究團(tuán)隊(duì)還提供了基于transformer和WebGUI的示例程序，以便開發(fā)者快速上手。目前，所有模型及其演示均已公開發(fā)布，開發(fā)者可以輕松下載并使用，具體訪問頁面請點(diǎn)擊此處。

更多>同類內(nèi)容

中鋁國際2024年預(yù)計(jì)凈利1.7至2.3億，轉(zhuǎn)型升級(jí)成果顯著實(shí)現(xiàn)扭虧

01-26

周成建直播救火，美邦能否重?zé)ㄉ鷻C(jī)？

01-26

萬通發(fā)展高端光模塊轉(zhuǎn)型夢碎，重大資產(chǎn)重組終止

01-26

上汽“尚界”來襲，華為鴻蒙智行“第五界”懸念再起？

01-26

羅永浩的還債長征：AI新賽道能否成為清債最后一站？

01-26

限時(shí)點(diǎn)券怎么用最劃算？除了云纓新皮，這些皮膚也值得兌換！

01-26

2025年1月26日匯率播報(bào)：人民幣對(duì)美元匯率穩(wěn)定，最新匯率是多少？

01-26

雷軍親測小米汽車自駕：直播雖遇波折，整體表現(xiàn)絲滑順暢

01-26

上汽集團(tuán)新商標(biāo)“尚界”等待審查，業(yè)績下滑卻籌備大乘用車板塊合并？

01-26

雪佛蘭海外新Spark曝光，竟是寶駿悅也Plus換標(biāo)版？

01-26

王自如關(guān)聯(lián)公司陷經(jīng)營異常，150萬股權(quán)遭凍結(jié)！

01-26

雷軍直播秀智駕遭封禁，開車直播安全性引熱議！

01-26

太行山新能源大動(dòng)脈貫通！500千伏變電站助力年發(fā)電42億千瓦時(shí)

01-26

帝王蟹春節(jié)熱銷！中國市場占比過半，價(jià)格創(chuàng)新低引搶購潮

01-26

微三云眾店模式：線上線下融合的新商業(yè)生態(tài)如何賦能商家與消費(fèi)者？

01-26

點(diǎn)擊查看更多 +

全站最新

Hugging Face發(fā)布SmolVLM系列：小巧而強(qiáng)大的視覺語言模型登場

多維度解鎖企業(yè)價(jià)值，你也能成為投資高手！

成都“鐵路快通”模式：國際貿(mào)易提速，通關(guān)時(shí)間大幅縮減

字節(jié)AI戰(zhàn)事升溫：張一鳴豪擲千億，獵頭力薦百萬年薪人才可獲三成提成

中鋁國際2024年預(yù)計(jì)凈利1.7至2.3億，轉(zhuǎn)型升級(jí)成果顯著實(shí)現(xiàn)扭虧

矽電股份IPO新進(jìn)展：大客戶關(guān)聯(lián)方入股，業(yè)績下行與財(cái)務(wù)壓力并存

熱門內(nèi)容

本欄最新

Hugging Face發(fā)布SmolVLM系列：小巧而強(qiáng)大的視覺語言模型登場

中鋁國際2024年預(yù)計(jì)凈利1.7至2.3億，轉(zhuǎn)型升級(jí)成果顯著實(shí)現(xiàn)扭虧

萬通發(fā)展高端光模塊轉(zhuǎn)型夢碎，重大資產(chǎn)重組終止

上汽“尚界”來襲，華為鴻蒙智行“第五界”懸念再起？

羅永浩的還債長征：AI新賽道能否成為清債最后一站？

限時(shí)點(diǎn)券怎么用最劃算？除了云纓新皮，這些皮膚也值得兌換！

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

Hugging Face發(fā)布SmolVLM系列：小巧而強(qiáng)大的視覺語言模型登場