?Meta推出變革性開源大模型Llama
Meta推出變革性開源大模型Llama 4:2萬億參數、多模態融合,開啟AI競爭新紀元
北京時間4月6日凌晨,美國科技巨頭Meta正式發布其蕞新一代理源大模型Llama 4系列,包括面向高效推理的Llama 4 Scout、專注多模態的Llama 4
Maverick,以及預覽版超大規模模型Llama 4 Behemoth。這一發布不僅標志著Meta在開源領域的強勢回歸,更以2萬億參數規模、原生多模態架構和千萬級上下文窗口刷新行業紀錄,直面DeepSeek、阿里等新興勢力的挑戰。
技術突破:混合展業人士架構+多模態融合,參數規模碾壓競品
Llama 4是Meta較早采用混合展業人士(MoE)架構的開源模型,通過動態激發部分參數提升計算效率。其中:
Llama 4 Scout(1090億參數)專攻文檔摘要與復雜代碼推理,支持1000萬token上下文窗口,遠超GPT-4o等閉源模型;
Llama 4 Maverick(4000億參數)主打多模態,支持視覺、語音輸入及多語言編程,通過早期融合技術實現文本與視覺數據的無縫整合;
Llama 4 Behemoth(2萬億總參數)作為“教師模型”預覽版,激發參數量達2880億,規模為DeepSeek-R1的3倍,劍指下一代通用人工智能。
Meta強調,模型通過海量無標簽多模態數據預訓練,蕞多可處理48張圖像輸入,在視頻理解、多圖推理等任務中表現超越 ,其技術路徑或重新定義開源多模態模型的標準。
開源生態爭奪戰:Meta直面DeepSeek、阿里“圍剿”
作為開源社區的奠基者,Meta曾憑借Llama 2低成本商用策略引起開發者生態。然而,中國廠商的崛起正改寫競爭格局:
DeepSeek憑借低成本高效模型(如訓練費只550萬美元的DeepSeek-V3)在基準測試中碾壓Llama系列,迫使Meta加速技術追趕;
阿里通義千問以Qwen2.5-Omni登頂Hugging Face榜單,開源模型數量突破10萬,形成全球比較大開源族群。
匿名社區爆料顯示,Meta高管正承受“投入產出比”壓力——其AI部門高管的年薪總和已超過競品整模型訓練成本。此次Llama 4的發布,被視為Meta重奪開源話語權的關鍵一役。
行業激戰升級:推理能力成下半場關鍵賽道
大模型競爭正從參數規模轉向推理強化與應用落地。OpenAI宣布將發布推理模型o3和基座模型o4-mini,GPT-5亦進入倒數;DeepSeek聯合清華發布SPCT和元獎勵模型技術論文,為下一代模型R2鋪路。
業內人士指出,開源開放已成核心競爭力,而“大算力、多模態、強推理、廣生態”將是未來趨勢。Meta能否憑借Llama 4守住開源高地,抑或DeepSeek、阿里等后來居上,全球AI格局或在此一役見分曉。