智源研究院發布LM-Cocktail模型治理策略低成本提升模型性能

2023-12-11 13:57 · 稿源：站長之家

站長之家(ChinaZ.com) 12月11日消息:智源研究院最近發布了 LM-Cocktail 模型治理策略，旨在為大模型開發者提供一個低成本持續提升模型性能的方式。

該策略通過融合多個模型的優勢，實現在目標任務上性能的提升，同時保持在通用任務上的強大能力。

微信截圖_20231211135737.png

LM-Cocktail 可以幫助開發者將多個模型的優勢能力匯總起來，生成一個具備多種特長的 “多技能” 模型。通過少量樣例計算加權權重，可以融合現有模型，無需重新訓練。

這種策略對于缺乏目標任務標簽數據或計算資源的開發者尤為有用。LM-Cocktail 的核心是將微調后的模型與多個其他模型的參數進行融合，整合多個模型的優點，提高目標任務的準確度，同時保持在其他任務上的通用能力。

目前，LM-Cocktail 已在實驗中展現了良好的性能。

論文：https://arxiv.org/abs/2311.13534

代碼：https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

項目地址：https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

（舉報）

相關推薦

關鍵詞：

WLS 2026在迪拜開幕，WLA主辦、KuCoin聯合主辦，聚焦基礎科學與全球治理的未來路徑

世界頂尖科學家協會（WLA）與KuCoin聯合主辦的世界頂尖科學家峰會2026（WLS2026）于2月1日在阿聯酋迪拜開幕。本屆峰會以“基礎科學：以科學共識應對人類挑戰”為主題，匯聚全球頂尖科學家、科研機構代表、政策制定者與技術實踐者，共同探討基礎科學、前沿技術與全球治理的未來路徑。峰會強調將基礎科學發現與全球治理及公共政策需求更直接地連接，推動科學從知識積累走向制度與治理層面的結構性支撐。KuCoin作為聯合主辦方，從“可信數字基礎設施”的視角參與議程，探討區塊鏈與人工智能在科研協作、數字基礎設施與公共治理領域的基礎性價值，并主導“AI×區塊鏈科學論壇”。峰會獲得阿聯酋政府的高規格支持，為期三天，吸引了來自全球的逾千名與會者，包括諾貝爾獎、圖靈獎、沃爾夫獎等國際頂級科學獎項獲得者，規模與學術影響力再創新高。

?World ?Laureates ?Summit
憶聯發布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

在AI與云計算驅動的數據洪流時代，企業存儲系統面臨前所未有的效率與成本壓力。憶聯正式推出SATA SSD新品UM311d，旨在以更優性能與更佳成本效率，助力企業夯實數據基石。UM311d支持SATA III接口，容量覆蓋480GB至3.84TB，順序讀寫速度高達560/535MB/s，隨機讀寫性能達99K/48K IOPS。相比前代產品，其隨機IOPS最高提升14%，關鍵時延最大降低35%，能顯著優化虛擬機、分布式存儲及溫冷數據池等企業場景的數據存取體驗。產品采用2.5英寸標準形態，無需改造即可兼容主流服務器與存儲陣列，并通過大規模樣本驗證、深度可靠性驗證及廣泛兼容性驗證，確保性能穩定與數據安全。UM311d致力于從技術驅動降本與性能轉化增效兩個層面優化企業總擁有成本（TCO），成為應對規模化部署挑戰的優選方案，為各類關鍵業務提供高效、穩定的數據支撐。

?企業存儲 ?SATA ?SSD
騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

騰訊混元圖像3.0圖生圖模型正式發布，支持圖片編輯與多圖融合功能，已在元寶同步上線。該模型基于混元圖像3.0原生多模態架構，采用混合專家（MoE）架構，總參數量達800億。通過指令微調和后訓練，模型能深度理解并處理用戶輸入的圖像和編輯指令，生成圖片一致性強、真實感佳、情緒表現力好，且速度顯著提升。功能上支持增刪改、風格變換、老照片修復、人物與文字修改等多種編輯能力，并能實現多圖融合，適用于表情包制作、虛擬人物合拍、社交分享、電商海報設計、游戲角色定制及創意圖片制作等多樣化操作。

?騰訊混元 ?混元圖像3.0 ?圖生圖模型
重新定義“實時在線交互”，Soul App開源實時數字人生成模型SoulX-FlashTalk

Soul AI Lab開源實時數字人生成模型SoulX-FlashTalk，實現0.87秒亞秒級超低延遲、32fps高幀率，支持超長視頻穩定生成。該模型具備“零延遲”即時反饋、高精細度全身動作合成、超長視頻穩定生成等亮點，通過雙向蒸餾與多步回溯自校正機制解決傳統方案延遲高、畫面不一致等問題。在電商直播、短視頻制作、AI客服等場景提供高質量、可落地的解決方案，推動大參數量實時生成式數字人邁入具體商用階段。

?數字人生成 ?SoulX-FlashTalk ?AI開源模型
階躍星辰發布最強開源基座模型 Step 3.5 Flash，多家頭部芯片廠商已完成適配

階躍星辰發布新一代開源Agent基座模型Step 3.5 Flash。該模型面向實時Agent工作流場景，兼顧推理速度、智能水平與使用成本，在單請求代碼類任務上，最高推理速度可達每秒350個token。模型采用稀疏MoE架構，每個token僅激活約110億參數，顯著提升推理效率，為Agent應用提供更高效、可負擔的底層模型選擇。多家芯片廠商已完成適配，通過底層聯合創新提升模型適配性和算力效率，有效降低推理成本與應用門檻，加速大模型在實際場景中的落地。

?Step ?3.5 ?Flash
薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

這兩天，又有一款全新的AI模型出現了。雖說如今AI改變各行各業的事情早就屢見不鮮，在游戲業，很多崗位也或多或少已經用上了AI技術，但最近發布的這款AI模型，它真不一樣。這款AI模型名叫PixVerse R1，按官方說法，PixVerse R1是全球首個真正意義上的「實時生成世界模型（Real-time World Model）」。

?AI模型 ?游戲行業 ?實時生成
薦大模型六小龍告別青春期

?不到一個月的時間，大模型六小龍中的五家都集中進行了新一輪的戰略表態。月之暗面今天發布了新模型Kimi2.5，其創始人楊植麟在2025年12月31日發布了一封全員信，公開公司完成新一輪5億美元融資，并表示會讓Kimi成為一個「與眾不同」和「不被定義」的大語言模型。1月26日，階躍星辰公布了超50億B+輪融資，并宣布前曠視科技創始人印奇出任公司董事長，明確押注AI與智能?

?大模型 ?戰略表態 ?融資
“TapTap 制造” 重磅發布：一款讓想象力直接變成游戲的AI智能體

2026年1月30日，TapTap正式推出AI游戲創作智能體“TapTap制造”。該產品以“想到就能做到”為核心，旨在通過AI與平臺能力結合，打破游戲創作的技術壁壘與門檻限制，推動游戲進入“0門檻創作”時代。創作者無需編程知識，只需用自然語言描述創意，即可在聊天窗口中完成從開發到上線的全過程，實現真正的“0門檻”游戲開發。產品整合了自研AI Native引擎、多元資源工具箱及專業游戲創作技能，支持一鍵發布至TapTap平臺，形成創作、發布、運營的一站式閉環。目前產品以免費模式開放，旨在降低創作成本，匯聚優質內容，構建繁榮的游戲開發生態。

?AI游戲創作 ?TapTap制造 ?0門檻創作
MiroMind 破局：在大語言模型的夾縫中，陳天橋在造什么？

本文闡述了陳天橋創立的MiroMind在AI領域的獨特路徑。文章將當前主流AI分為“文科模型”（如OpenAI，側重語言生成與模擬）和“理科模型”（MiroMind追求的方向，強調因果推理與可驗證性）。MiroMind反對單純追求“行為主義”（圖靈測試）或“功能主義”（替代工作），提出構建“通用推理引擎”的新定位。其核心是放棄“全知全能”幻想，承認模型會出錯，通過引入“自我糾錯”機制和外部反饋閉環來生存。目標不是聊天機器人，而是“可審計、可驗證的通用問題求解器”，瞄準科研、工業等高容錯門檻的B端“深水區”。文章以BrowseComp案例說明，小參數模型通過Agent交互可戰勝更大模型，證明了推理能力可通過架構創新實現。最終，作者將理想的AGI比作一把精準剔除謬誤的“手術刀”，而非無所不知的“神”。

?Scale ?Law ?能力分級
百度發布文心大模型5.0正式版：2.4萬億參數原生全模態建模

今日，百度文心Moment”大會在上海召開。大會現場，百度正式發布了文心大模型5.0正式版。據介紹，該模型基于原生全模態建模，擁有2.4萬億參數，支持文本、圖像、音頻、視頻等多種信息理解輸出。目前，文心5.0正式版可在百度千帆平臺調用，文心一言官網、百度慧播星及文心助手等其他百度AI產品也已接入。此前，文心5.0以1460分位列LMArena文本榜國內第一、全球第八?

?百度文心 ?文心大模型5.0 ?全模態建模

今日大家都在搜的詞：

熱文

3 天
7天

智源研究院發布LM-Cocktail模型治理策略低成本提升模型性能

WLS 2026在迪拜開幕，WLA主辦、KuCoin聯合主辦，聚焦基礎科學與全球治理的未來路徑

憶聯發布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

重新定義“實時在線交互”，Soul App開源實時數字人生成模型SoulX-FlashTalk

階躍星辰發布最強開源基座模型 Step 3.5 Flash，多家頭部芯片廠商已完成適配

薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

薦大模型六小龍告別青春期

“TapTap 制造” 重磅發布：一款讓想象力直接變成游戲的AI智能體

MiroMind 破局：在大語言模型的夾縫中，陳天橋在造什么？

百度發布文心大模型5.0正式版：2.4萬億參數原生全模態建模

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

余承東公布問界M6實車外觀預計將于今年春季發布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

iQOO 15 Ultra今日發布主打極致性能

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

余承東公布問界M6實車外觀預計將于今年春季發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

站長商機

智源研究院發布LM-Cocktail模型治理策略 低成本提升模型性能

今日大家都在搜的詞：

熱文

站長商機

智源研究院發布LM-Cocktail模型治理策略低成本提升模型性能