滾動資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟 > 正文內(nèi)容

Meta推出Llama API，攜手Cerebras和Groq打造超高速AI推理方案

時間：2025-04-30 15:25 作者：楊凌霄

在科技界的矚目下，meta公司在首屆LlamaCon大會上不僅推出了獨立的AI應(yīng)用，還解鎖了一項重要資源——Llama API，目前正以免費預(yù)覽模式面向全球開發(fā)者開放。

據(jù)悉，Llama API為開發(fā)者提供了測試最新模型的機會，包括備受期待的Llama 4 Scout和Llama 4 Maverick。為了簡化開發(fā)流程，meta公司特別設(shè)計了一鍵API密鑰創(chuàng)建功能，并配備了輕量級的Type和Python SDK。這些舉措使得開發(fā)者能夠迅速上手，無需繁瑣的配置。

更為貼心的是，Llama API完全兼容OpenAI SDK，為那些計劃從OpenAI平臺遷移應(yīng)用的開發(fā)者提供了極大的便利。這意味著他們可以在不改變原有開發(fā)習(xí)慣的前提下，輕松切換至Llama API，享受meta帶來的技術(shù)紅利。

為了進一步提升Llama API的性能，meta攜手Cerebras和Groq兩大技術(shù)巨頭展開合作。Cerebras宣稱，其Llama 4 Cerebras模型的tokens生成速度高達2600 tokens/s，這一速度遠超傳統(tǒng)GPU解決方案，如NVIDIA，達到了18倍的領(lǐng)先優(yōu)勢。

根據(jù)Artificial Analysis的基準(zhǔn)測試數(shù)據(jù)，Cerebras的這一速度不僅超過了ChatGPT的130 tokens/s，更是DeepSeek的25 tokens/s的數(shù)十倍之多。Cerebras的CEO兼聯(lián)合創(chuàng)始人Andrew Feldman對此表示：“我們非常自豪能夠讓Llama API成為全球最快的推理API。在構(gòu)建實時應(yīng)用時，開發(fā)者對速度有著極高的要求，Cerebras的加入使得AI系統(tǒng)的性能達到了GPU云無法比擬的高度?！?/p>

而Groq提供的Llama 4 Scout模型雖然速度略遜于Cerebras，但也達到了460 tokens/s，相比其他GPU方案快了4倍。在費用方面，Groq上的Llama 4 Scout每百萬tokens輸入費用為0.11美元，每百萬tokens輸出費用為0.34美元；而Llama 4 Maverick的對應(yīng)費用則分別為0.50美元和0.77美元。這些數(shù)據(jù)顯示出Groq在提供高性能的同時，也保持了較低的成本。

此次meta推出的Llama API及其與Cerebras和Groq的合作，無疑為AI領(lǐng)域注入了新的活力。隨著技術(shù)的不斷進步和成本的進一步降低，AI應(yīng)用將更加廣泛地滲透到各個領(lǐng)域，為人類社會的發(fā)展帶來前所未有的變革。

更多>同類內(nèi)容

艾利和PD10 Hi-Fi播放器來襲，全球首發(fā)AK4498EX DAC引期待

04-30

貝殼CEO彭永東7億年薪合規(guī)合法不要指手畫腳

文/王德生 “當(dāng)輿論場被情緒淹沒時，我們需要冷思考”2025年4月，貝殼找房董事長彭永東因7.13億元年薪被推上風(fēng)口浪尖。社交平臺上，“高管年薪=1萬名經(jīng)紀(jì)人收入總和”的對比圖瘋狂刷屏，公眾憤怒的矛頭直指“貧富差距”與“資本貪婪”。但在一片聲討中，一個更本質(zhì)的問

04-30

魔方《暗區(qū)突圍：無限》純端游挑戰(zhàn)，能否續(xù)寫硬核傳奇？

04-30

網(wǎng)約車飽和危機下，T3出行能否靠多線戰(zhàn)略突出重圍？

04-30

福鹿家挑戰(zhàn)精釀賽道，蜜雪冰城奶茶戰(zhàn)術(shù)能否續(xù)寫酒館傳奇？

04-30

Hi MateBook D系列新品開箱：大屏護眼，簡約高效新體驗！

04-30

榮耀X70i開售：1億像素+iPhone同款A(yù)I鍵，國補價僅1189元起！

04-30

沃爾沃一季度利潤大跌，全球裁員計劃出爐！

04-30

超休閑小游戲新勢力崛起：廣深廠商領(lǐng)航，混變模式成新風(fēng)口？

04-30

谷歌Play嚴(yán)控質(zhì)量，2024年應(yīng)用數(shù)量大幅減少47%，iOS卻微增2.5%

04-30

理想超充站突破2200座，G318川藏線全線貫通，車主享限時免費充電福利！

04-30

任天堂Switch V20.0.0大更新：游戲共享、系統(tǒng)遷移功能來襲！

04-30

英偉達官方辟謠：中國業(yè)務(wù)分拆傳聞不實

04-30

2025國補倒計時！江西家電手機汽車補貼12月31日截止，抓緊薅羊毛！

04-30

英企合作研發(fā)：霸王龍“滅絕皮革”手袋即將面世？

04-30

點擊查看更多 +

全站最新

零跑B01純電轎車盲訂啟動，7月上市在即，你會心動嗎？

迎廣PRISM機箱來襲：三片玻璃拼接，透視設(shè)計再升級！

Freepik發(fā)布F Lite：基于8000萬張安全內(nèi)容訓(xùn)練的AI圖像生成器

《長安三萬里》閩南語版登陸臺灣，唐詩韻味引共鳴！

微軟Mail & Calendar應(yīng)用停用，用戶數(shù)據(jù)遷移至Outlook成必然？

Meta Llama模型下載量飆升，開發(fā)者助力衍生模型數(shù)萬，競爭白熱化

熱門內(nèi)容

本欄最新

艾利和PD10 Hi-Fi播放器來襲，全球首發(fā)AK4498EX DAC引期待

貝殼CEO彭永東7億年薪合規(guī)合法不要指手畫腳

魔方《暗區(qū)突圍：無限》純端游挑戰(zhàn)，能否續(xù)寫硬核傳奇？

福鹿家挑戰(zhàn)精釀賽道，蜜雪冰城奶茶戰(zhàn)術(shù)能否續(xù)寫酒館傳奇？

Hi MateBook D系列新品開箱：大屏護眼，簡約高效新體驗！

榮耀X70i開售：1億像素+iPhone同款A(yù)I鍵，國補價僅1189元起！

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

Meta推出Llama API，攜手Cerebras和Groq打造超高速AI推理方案