飘花国产午夜精品不卡,日韩AV片观看无码,亚州一区二区成人片免费

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

“參數(shù)王者、開源期貨”，Meta這波Llama 4贏了嗎？

鯨選AI

2025-04-09

0 評論 577 瀏覽 0 收藏

從支持1000萬token上下文的Scout，到4000億參數(shù)的Maverick，再到2萬億參數(shù)的Behemoth，Llama 4以MoE架構(gòu)、多模態(tài)能力和超低成本推理重新定義開源模型的性能邊界。然而，面對DeepSeek和GPT-4.5的圍剿，Llama 4能否真正逆襲？當(dāng)參數(shù)規(guī)模不再是勝負(fù)手，開源模型的未來究竟在何方？

1000萬上下文？2萬億參數(shù)？MoE混合架構(gòu)，原生多模態(tài)。清明假期，你是否也被Meta這波Llama 4系列模型發(fā)布后，各種酷炫數(shù)據(jù)和名詞炸醒？

曾經(jīng)的開源領(lǐng)袖，實際已經(jīng)被DeepSeek搶了各種風(fēng)頭。萬眾期待的Llama 4模型，原本使命是超越GPT和Claude等閉源模型，吊打一切的存在，然后呢？實現(xiàn)了嗎？

Llama 4系列模型發(fā)布

Llama 4 Scout（?。?/strong>

單張H100 GPU可運行，適合本地部署，支持 1000萬token上下文，這是行業(yè)最牛成績。

Llama 4 Maverick（中）

總參數(shù)高達(dá)4000億，但推理時僅激活部分專家，效率更高。

多模態(tài)性能超越GPT-4o，在ChartQA、DocVQA等基準(zhǔn)測試中領(lǐng)先，編程能力媲美DeepSeek v3，但參數(shù)僅一半。

Llama 4 Behemoth（大，預(yù)覽版）

Meta 2萬億參數(shù)巨獸，仍在訓(xùn)練中。

超大參數(shù)，據(jù)說STEM任務(wù)超越GPT-4.5、Claude3.7等。

將作為“教師模型”，用于蒸餾優(yōu)化更小的Llama 4模型。

測評分?jǐn)?shù)高居全球第二

Llama 4 Maverick 目前在LM Arena 排行榜上排名第二，僅次于 Gemini 2.5 Pro。

而且具備原生多模態(tài)能力：Llama 4采用了早期融合（Early Fusion）技術(shù)，可以用海量的無標(biāo)簽文本、圖片和視頻數(shù)據(jù)一起來預(yù)訓(xùn)練模型。

超長上下文

Scout 版本支持 1000萬 tokens（約15000頁文本！），醫(yī)學(xué)、科研、代碼分析等超長文檔處理能力直接拉滿。

在其他大模型僅有200萬 tokens上下長度時，小扎掏出了大炸雷，不想和大家閑聊。

幾個核心技術(shù)

MoE架構(gòu)效率炸裂

Llama 4開始轉(zhuǎn)向采用混合專家模型（MoE），推理時僅激活部分參數(shù)，成本更低——Maverick 推理成本僅 $0.19/百萬token，比GPT-4o便宜90%。

iRoPE實現(xiàn)超長上下文

iRoPE（交錯旋轉(zhuǎn)位置編碼）是Meta為Llama 4設(shè)計的升級版位置編碼技術(shù)。

局部注意力層：用旋轉(zhuǎn)位置編碼（RoPE）處理短上下文（如8K token），保留位置關(guān)系。

全局注意力層：直接去掉位置編碼（NoPE），通過動態(tài)調(diào)整注意力權(quán)重處理超長內(nèi)容，類似“模糊匹配”長距離關(guān)聯(lián)。

就像讀書時用書簽（RoPE）標(biāo)記重點段落，同時靠記憶（NoPE）串聯(lián)全書脈絡(luò)。

埋葬RAG技術(shù)？

相比RAG技術(shù)，iRoPE無需依賴外部知識庫檢索，直接通過模型內(nèi)部自身處理完整信息，減少信息丟失風(fēng)險，預(yù)計未來會成為大模型技術(shù)標(biāo)配，以后大模型容易忘記前文的事情，基本就不會出現(xiàn)了。開源但有限制：商用需遵守 Meta 政策，月活超7億的公司需額外授權(quán)，且產(chǎn)品名必須帶“Llama”。鯨哥在Together AI上體驗了Llama 4 Scout，并沒有什么特別的強悍之處，DeepSeek對比之下體感還是強很多。Llama 4有點像Google，“參數(shù)沒輸過，實戰(zhàn)沒贏過”。

一句話總結(jié)：Meta 這次把開源AI卷到新高度，多模態(tài)+長上下文+超低成本，Llama 4 可能是目前最香的開源大模型之一。但下周OpenAI o3和Claude等新模型發(fā)布，Llama 4估計又會被奪走注意力。只能說模型競爭，太卷了，Llama 4要成千年追趕者了。

本文由人人都是產(chǎn)品經(jīng)理作者【鯨選AI】，微信公眾號：【鯨選AI】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

Llama 4 Meta 個人觀點行業(yè)動態(tài)

鯨選AI

最新AI產(chǎn)業(yè)報道和產(chǎn)品分析

37篇作品 78129總閱讀量

為你推薦

邁向數(shù)字化產(chǎn)品經(jīng)理的10個工具：如何抽象具體的一個業(yè)務(wù)？

06-056618 瀏覽

產(chǎn)品經(jīng)理必備技能之「UML用例圖」

10-269324 瀏覽

抖音再度加碼種草產(chǎn)品，推出“有柿”APP

04-245592 瀏覽

面向?qū)ο蟮挠脩趔w驗是 XR 體驗的缺失環(huán)節(jié)

03-073308 瀏覽

聊聊我對借錢用戶的理解

03-133161 瀏覽

評論

評論請登錄

目前還沒評論，等你發(fā)揮！

為你推薦

《狂飆》熱播背后，長視頻收費的花樣與無奈

02-073993 瀏覽

商品中心：SPU與SKU狀態(tài)優(yōu)化的復(fù)盤

05-065833 瀏覽

阿北和他的豆瓣十八年?

02-037215 瀏覽

推荐专题更多专题

社群
付费群 | 免费群

产品经理交流群加入
AI 学习交流群加入
华为鸿蒙交流群加入
运营增长交流群加入
小红书抖音视频号群加入
互联网中年转型交流群加入

快訊
查看更多

宝马3月欧盟新车注册量下降3%

刚刚

美团创始人王兴清空微博？知情人士否认

刚刚

芒果TV与抖音集团旗下红果短剧正式达成系列合作

刚刚

熱門文章

抖音推薦算法原理公開！不只取決于完播率，還有推薦打分公式

04-01

大事微妙，小紅書軟廣鋪量也可以聚光投流了！

04-02

鴻蒙應(yīng)用問答：應(yīng)用開發(fā)系列-第二期

04-07

外賣騎手和他的“全職圍城”

04-11

AI時代，如何從0到1打造一款A(yù)I產(chǎn)品？

04-11

B端產(chǎn)品到底需不需要設(shè)置【非必填字段】

04-15

东方甄选淘宝首秀“翻车”，从运营角度分析该事件带来的影响？

据第一财经，8月29日早上8点，东方甄选首次在淘宝直播带货，结果首秀即遭遇“翻车”：一款“东方甄选自...

19.1k 点击45 回答
进入回答

为什么从短视频进来的用户，远比直播feed流和投放转化率高？

14.8k 点击40 回答
你认为微信最终会以哪种方式衰落？

26k 点击34 回答
未来语音搜索会不会代替搜索对话框？

21.7k 点击29 回答

文章導(dǎo)航

Llama 4系列模型發(fā)布

幾個核心技術(shù)

埋葬RAG技術(shù)？

關(guān)于
人人都是產(chǎn)品經(jīng)理（woshipm.com）是以產(chǎn)品經(jīng)理、運營為核心的學(xué)習(xí)、交流、分享平臺，集媒體、培訓(xùn)、社群為一體，全方位服務(wù)產(chǎn)品人和運營人，成立12年舉辦在線講座1000+期，線下分享會500+場，產(chǎn)品經(jīng)理大會、運營大會50+場，覆蓋北上廣深杭成都等20個城市，在行業(yè)有較高的影響力和知名度。平臺聚集了眾多BAT美團(tuán)京東滴滴360小米網(wǎng)易等知名互聯(lián)網(wǎng)公司產(chǎn)品總監(jiān)和運營總監(jiān)，他們在這里與你一起成長。

合作伙伴

鏈接

隱私政策

投稿須知

意見反饋

幫助中心

公眾號

視頻號

友情鏈接

PM265

產(chǎn)品經(jīng)理導(dǎo)航

起點課堂

豬八戒網(wǎng)

人才熱線

伙伴云表格

網(wǎng)易易盾

個推

友盟+

糧倉

創(chuàng)業(yè)邦

每日報告

鳥哥筆記

慕課網(wǎng)

旗下品牌: 起點課堂 | 運營派 | 糧倉企微管家
?2010-2024 - 人人都是產(chǎn)品經(jīng)理 - 粵ICP備14037330號-粵公網(wǎng)安備 44030502001309號
 廣播電視節(jié)目制作經(jīng)營許可證（粵）字第03109號增值電信業(yè)務(wù)經(jīng)營許可證粵B2-20190788 版權(quán)所有 ? 深圳聚力創(chuàng)想信息科技有限公司

“參數(shù)王者、開源期貨”，Meta這波Llama 4贏了嗎？

Llama 4系列模型發(fā)布

測評分?jǐn)?shù)高居全球第二

超長上下文

幾個核心技術(shù)

MoE架構(gòu)效率炸裂

iRoPE實現(xiàn)超長上下文

埋葬RAG技術(shù)？

“參數(shù)王者、開源期貨”，Meta這波Llama 4贏了嗎？

埋葬RAG技術(shù)？