AI日報：騰訊混元推出5個開源3D模型；Anthropic發布MCP傳輸機制重大升級；Mistral開源模型Mistral Small 3.1

2025-03-18 15:23 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們為你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、了解創新AI產品應用。

新鮮AI產品點擊了解:https://top.aibase.com/

1、騰訊混元推出5個開源3D模型:30秒生成，兼容多平臺

騰訊混元宣布推出五個全新開源3D生成模型，基于Hunyuan3D-2.0，具備更快的生成速度和更豐富的細節。Turbo系列模型利用FlashVDM框架實現生成加速，縮短至30秒內完成。升級后的3D AI創作引擎支持多視圖輸入，用戶可通過上傳少量圖片快速生成高質量3D模型，降低制作成本。新模型廣泛應用于UGC、商品素材合成和游戲資產生成，滿足游戲3D資產標準。

【AiBase提要:】
? Turbo系列模型通過FlashVDM框架實現數十倍加速，生成時間縮短至30秒。
??? Hunyuan3D-2-MV模型能更好地捕捉細節，生成符合用戶預期的3D資產。
??? 升級后的引擎支持多視圖輸入，用戶只需上傳2-4張圖片即可快速生成高質量3D模型。

2、Anthropic發布MCP傳輸機制重大升級:告別長連接，迎接更靈活的Streamable HTTP

Anthropic對Model Context Protocol（MCP）進行了重大更新，推出了Streamable HTTP傳輸方式，取代了傳統的HTTP+SSE方案。這一創新解決了MCP遠程傳輸的關鍵限制，提升了靈活性和兼容性。新機制允許客戶端與服務器之間更高效的雙向通信，支持無狀態服務器運行，簡化了部署流程，并提高了系統的可擴展性。

【AiBase提要:】
?? 移除專用的/sse端點，所有消息通過統一的/message端點傳輸，簡化了通信流程。
?? 服務器可動態將HTTP請求升級為SSE流，支持靈活的雙向通信，解決了SSE的單向限制。
?? 新方案兼容性大幅提升，適用于各種網絡基礎設施，支持無狀態模式，降低了資源消耗。
詳情鏈接:https://github.com/modelcontextprotocol/specification/pull/206

3、生數科技Vidu將打造首部海外AI原創科幻動漫劇集

生數科技有限公司與Aura Productions達成戰略合作，計劃推出首部海外AI原創科幻動漫劇集。這一合作標志著AI技術在動漫制作中的應用，開啟了動漫行業新的篇章。雙方將共同制作50集短篇科幻動漫系列，利用Vidu的先進視頻生成技術，提升制作效率和質量，預示著未來動漫創作將更加智能化和高效化。

【AiBase提要:】
?? 合作推出50集短篇科幻動漫系列，計劃在全球主流社交媒體平臺發布。
?? Vidu的多主體一致性功能確保角色與場景的無縫融合，實現高質量動畫敘事。
?? Vidu2.0版本大幅提升視頻生成效率，能在10秒內快速生成高質量視頻。

4、谷歌云重磅推出高清語音模型 Chirp3，支持248種聲音

谷歌云在倫敦的DeepMind總部推出了高清語音模型Chirp3，旨在為開發者提供強大的語音合成工具。該模型支持248種不同的聲音和31種語言，能夠幫助開發者創建智能語音助手、有聲讀物和視頻配音等應用。為了確保負責任的使用，谷歌限制了語音克隆功能的訪問權限，并重申了對數據隱私的承諾。

【AiBase提要:】
?? 谷歌云推出Chirp3語音模型，支持248種聲音和31種語言，助力開發者構建智能應用。
?? 谷歌限制語音克隆功能的訪問權限，以確保倫理AI的實踐和防止濫用。
?? 谷歌發起計劃提升英國AI技能，并向初創企業提供云基礎設施支持，促進創新。
詳情鏈接:https://cloud.google.com/text-to-speech/docs/chirp3-hd

5、馬斯克xAI收購視頻生成初創公司Hotshot，AI視頻領域競爭再升級

埃隆·馬斯克旗下的xAI公司收購了視頻生成AI初創公司Hotshot，標志著其在多模態AI技術領域的進一步擴展。Hotshot以其獨特的技術優勢和強大的算力支持，致力于提升視頻生成能力。

【AiBase提要:】
?? Hotshot專注于AI視頻生成，利用600萬個視頻片段進行訓練，提升了模型理解視頻內容的能力。
?? 收購后，Hotshot將繼續擴大視頻生成器的開發，利用xAI的Colossus超級計算機的強大算力。
?? 此次收購標志著馬斯克在AI技術領域的進一步布局，預示著AI視頻生成技術將迎來新一輪的突破。

6、Roblox開源Cube3D:首個基礎AI模型實現3D對象生成

Roblox近日推出并開源了Cube3D，這是其首個用于生成3D對象的基礎AI模型，旨在提升3D創作效率。該模型通過創新的訓練方法，將3D對象標記化，能夠快速生成完整的3D形狀。未來，Cube3D將發展為一個多模態模型，支持多種輸入類型，包括文本、圖像和視頻，進一步增強與Roblox現有AI創作工具的整合。

【AiBase提要:】
??? Cube3D是Roblox首個開源的3D對象生成AI模型，旨在提高開發者的創作效率。
?? 該模型通過創新的訓練方法，能夠將3D對象標記化并預測下一個形狀，快速構建完整的3D對象。
?? Roblox計劃將Cube3D發展為多模態模型，未來將支持文本、圖像和視頻輸入，增強創作工具的功能。

7、Zoom AI助手AI Companion功能升級

Zoom公司最近宣布了其AI助手Zoom AI Companion的新一輪功能升級，標志著這一工具的演變，旨在提升用戶在視頻會議中的互動體驗和工作效率。新功能包括自動識別和完成待辦事項的Zoom Tasks、轉錄線下對話的新語音錄音器、以及定制AI助手等，預計將顯著增強用戶的生產力和協作能力。

【AiBase提要:】
?? Zoom Tasks功能可以自動識別會議中的待辦事項并完成相關任務。
??? 新語音錄音器能夠轉錄線下對話并提供實時會議筆記。
?? 定制AI助手功能將于4月推出，用戶可根據需求定制功能。

8、128K超長記憶!Mistral最新開源模型Mistral Small3.1登場，參數方面優于 GPT-4o Mini

Mistral AI發布了開源模型Mistral Small3.1，憑借240億參數的設計，其性能可與谷歌和OpenAI的產品相媲美。該模型在文本處理和多模態理解上有顯著提升，支持128k tokens的上下文窗口，處理速度達到每秒150個tokens。

【AiBase提要:】
?? Mistral Small3.1具備240億參數，性能媲美谷歌和OpenAI的同類產品，推動AI市場競爭。
?? 該模型支持128k tokens的上下文窗口，處理速度高達每秒150個tokens，適用于長文檔和快速響應場景。
?? Mistral采取開源策略，發布Apache2.0許可證，強調歐洲數字主權，吸引全球開發者參與創新。
詳情鏈接:https://top.aibase.com/tool/mistral-small-3-1

9、誰說視頻只能“一鏡到底”?字節創新技術LCT，讓AI像導演一樣拍攝電影大片!

長上下文調整（LCT）技術的出現，極大提升了AI生成視頻的敘事能力，使其能夠像電影導演一樣自由切換鏡頭，構建更連貫的故事場景。通過引入全注意力機制、交錯的3D位置嵌入和異步噪聲策略，LCT解決了多鏡頭生成中的視覺一致性和時間動態問題。

【AiBase提要:】
?? LCT技術使AI視頻生成模型能夠執導多鏡頭敘事視頻，提升敘事能力。
?? 通過全注意力機制和交錯的3D位置嵌入，LCT確保視覺一致性和時間動態。
?? LCT支持自回歸鏡頭擴展，便于長視頻創作和交互式修改。
詳情鏈接:https://top.aibase.com/tool/zhangshangxiawentiaoyoulct

10、32B參數的“逆襲”!OLMo232B橫空出世，叫板GPT-3.5Turbo

OLMo232B是艾倫人工智能研究所發布的最新大型語言模型，憑借320億參數和完全開源的特性，挑戰了許多專有模型。通過精細的訓練過程，OLMo232B在多項基準測試中超越了GPT-3.5Turbo和GPT-4o mini，展現出卓越的性能和更高的訓練效率。

【AiBase提要:】
?? OLMo232B是完全開源的語言模型，公開了所有數據、代碼和訓練過程，促進全球研究合作。
?? 該模型擁有320億參數，在多項基準測試中超越了GPT-3.5Turbo，證明了開源模型的強大實力。
? OLMo232B在訓練效率上表現優異，僅使用三分之一的計算資源，展現出高效的AI開發潛力。
詳情鏈接:https://github.com/allenai/OLMo-core

（舉報）

相關推薦

關鍵詞：

薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

這兩天，又有一款全新的AI模型出現了。雖說如今AI改變各行各業的事情早就屢見不鮮，在游戲業，很多崗位也或多或少已經用上了AI技術，但最近發布的這款AI模型，它真不一樣。這款AI模型名叫PixVerse R1，按官方說法，PixVerse R1是全球首個真正意義上的「實時生成世界模型（Real-time World Model）」。

?AI模型 ?游戲行業 ?實時生成
騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

騰訊混元圖像3.0圖生圖模型正式發布，支持圖片編輯與多圖融合功能，已在元寶同步上線。該模型基于混元圖像3.0原生多模態架構，采用混合專家（MoE）架構，總參數量達800億。通過指令微調和后訓練，模型能深度理解并處理用戶輸入的圖像和編輯指令，生成圖片一致性強、真實感佳、情緒表現力好，且速度顯著提升。功能上支持增刪改、風格變換、老照片修復、人物與文字修改等多種編輯能力，并能實現多圖融合，適用于表情包制作、虛擬人物合拍、社交分享、電商海報設計、游戲角色定制及創意圖片制作等多樣化操作。

?騰訊混元 ?混元圖像3.0 ?圖生圖模型
重新定義“實時在線交互”，Soul App開源實時數字人生成模型SoulX-FlashTalk

Soul AI Lab開源實時數字人生成模型SoulX-FlashTalk，實現0.87秒亞秒級超低延遲、32fps高幀率，支持超長視頻穩定生成。該模型具備“零延遲”即時反饋、高精細度全身動作合成、超長視頻穩定生成等亮點，通過雙向蒸餾與多步回溯自校正機制解決傳統方案延遲高、畫面不一致等問題。在電商直播、短視頻制作、AI客服等場景提供高質量、可落地的解決方案，推動大參數量實時生成式數字人邁入具體商用階段。

?數字人生成 ?SoulX-FlashTalk ?AI開源模型
薦AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內測截圖泄露；Clawd更名為OpenClaw

本期AI日報聚焦具身智能與AI應用新動態。螞蟻集團發布LingBot-VLA模型，實現雙手機器人通用操控；宇樹開源UnifoLM-VLA-0模型，為機器人注入物理常識。開源AI助手OpenClaw更名后受關注，強調隱私安全。商湯開源SenseNova-MARS模型，在多個榜單超越GPT-5.2。騰訊“元寶派”社交功能內測截圖泄露，整合微信與QQ好友，支持同步觀影聽歌。馬斯克計劃明年推出高度個性化AI生成游戲與影音內容。Anthropic因涉嫌大規模盜版遭音樂出版商起訴，索賠30億美元。字節與阿里在春節前后發布新一代大模型，爭奪云端主導權。

?人工智能 ?機器人技術 ?螞蟻集團
2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

AI正從參數比拼轉向賦能實體經濟的“下半場”，行業重心轉向千行百業的規模化應用落地。華為云憑借基于CloudMatrix+AI Infra的智算云服務，成功入選“人工智能基礎與產業融合”示范案例TOP5，彰顯了中國式AI與產業融合發展新路徑。華為云堅持深入產業，解決行業難題，通過“車-網-云”協同的AI無人駕駛全棧方案，賦能礦山、水泥等行業實現降本增效。未來，華為云將繼續堅持“做難而正確的事”，推動AI真正深入行業場景，共同邁向新質生產力發展的下一程。

?新質生產力 ?AI產業融合 ?華為云
薦AI日報：混元圖像3.0圖生圖模型發布；開源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂奇AI眼鏡

本期AI日報聚焦多領域AI新動態：騰訊發布混元圖像3.0，實現語義驅動的精準修圖；開源AI助手Clawdbot單日獲9000星，具備物理級執行力；京東購物智能體JoyGlance登陸Rokid眼鏡，簡化購物流程；蘋果Siri將整合谷歌Gemini核心，預計2月發布；騰訊“元寶派”開啟內測，探索AI深度融入社交場景；百度文心助手推出5億現金紅包活動，結合春節習俗；中國團隊SeaArt用戶破5000萬，實現創意到變現閉環；上海交大發布光學垂直大模型Optics GPT，重塑光學研發模式。

?AI ?圖像編輯 ?語義理解
薦AI日報：騰訊混元圖像3.0正式開源；Clawdbot迫于壓力更名Moltbot；月之暗面發布 Kimi Code

本期AI日報聚焦多領域AI新動態：騰訊混元圖像3.0開源，成為全球最強開源圖生圖模型；月之暗面發布Kimi Code，推動國產AI編程工具進入新階段；開源項目Clawdbot因商標風險更名Moltbot，并遭詐騙者利用舊賬號發布虛假代幣；谷歌AI Plus計劃正式擴展至美國等35個市場，月費不足8美元；OpenAI發布基于GPT-5.2的科研協作平臺Prism；谷歌Aluminum OS界面首曝，深度融合Android與ChromeOS；Mistral AI發布終端編程助手Vibe 2.0，步入“子代理”時代；小米AI眼鏡深度集成支付寶，實現停車繳費與健康管理“無感交互”。

?AI ?開源 ?圖生圖
卷完價格與參數，3D 打印全面爆發的臨界點在哪？

2026 年開年，民營火箭密集升空與可回收技術的突破，讓商業航天的熱度進一步攀升。3D 打印作為航天領域「降本增效」的關鍵技術，又一次站在了公眾視野。據市場研究機構 CONTEXT 發布的最新報告顯示，得益于航空航天與國防需求的攀升以及中國市場的強勁復蘇，全球工業級 3D 打印行業終于擺脫了長期低迷，重回增長軌道，與入門級市場共同推動行業向前。值得關注的是:?

?3D打印 ?商業航天 ?工業級3D打印
薦AI日報：MiniMax Music 2.5 發布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

本期AI日報聚焦多項AI技術突破：MiniMax Music 2.5發布，提升AI音樂可控性與真實度；螞蟻靈波開源世界模型LingBot-World，為具身智能等提供高保真數字環境；谷歌Gemini 3.5泄露，單次提示可生成三千行代碼；Kimi K2.5 Agent升級，高效處理Excel、Word等辦公文檔；蘑菇物聯“靈知”垂直大模型通過備案，專注工業輔助與能源領域；昆侖萬維SkyReels-V3開源，實現多模態視頻生成；昆侖天工發布音樂大模型Mureka V8，推動AI音樂邁向“可發布”級別；三星宣布下一代AR眼鏡將于2026年發布，主打多模態AI體驗。

?AI音樂 ?MiniMax ?Music
薦AI日報：天貓上線AI假圖識別模型；百川發布醫學模型Baichuan-M3 Plus；Remotion Skills開啟一句話做大片時代

本期AI日報聚焦多領域AI新進展：淘寶天貓上線AI假圖識別模型，打擊惡意售后；Inworld推出低延遲多語言TTS-1.5，革新游戲對話體驗；百川智能發布醫療大模型Baichuan-M3+Plus，醫學幻覺率降至2.6%；Remotion Skills實現自然語言生成專業視頻動畫；蘋果內部AI工具Enchanté和Enterprise Assistant曝光，提升辦公效率；YouTube計劃推出“AI個人形象”功能，變革短視頻創作；微軟為Windows 11記事本與畫圖注入AI新能力；蘋果擬將Siri重塑為類ChatGPT聊天機器人，代號“Campos”。

?AI ?電商 ?假圖識別

今日大家都在搜的詞：

熱文

3 天
7天

AI日報：騰訊混元推出5個開源3D模型；Anthropic發布MCP傳輸機制重大升級；Mistral開源模型Mistral Small 3.1

薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

重新定義“實時在線交互”，Soul App開源實時數字人生成模型SoulX-FlashTalk

薦AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內測截圖泄露；Clawd更名為OpenClaw

2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

薦AI日報：混元圖像3.0圖生圖模型發布；開源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂奇AI眼鏡

薦AI日報：騰訊混元圖像3.0正式開源；Clawdbot迫于壓力更名Moltbot；月之暗面發布 Kimi Code

卷完價格與參數，3D 打印全面爆發的臨界點在哪？

薦AI日報：MiniMax Music 2.5 發布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

薦AI日報：天貓上線AI假圖識別模型；百川發布醫學模型Baichuan-M3 Plus；Remotion Skills開啟一句話做大片時代

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

余承東公布問界M6實車外觀預計將于今年春季發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色