AI日報：重磅！阿里新夸克升級為“AI框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

2025-03-13 15:34 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們為你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、了解創新AI產品應用。

新鮮AI產品點擊了解:https://top.aibase.com/

1、阿里巴巴推出AI旗艦應用“新夸克” 全面升級為“AI超級框”

阿里巴巴于3月13日推出了其全新升級的AI旗艦應用——新夸克。這款應用基于阿里通義的先進推理與多模態大模型，整合了多種AI功能，旨在為用戶提供無縫的智能體驗。新夸克不僅能夠進行智能對話，還具備深度思考和執行能力，能夠滿足用戶在多個場景下的需求。

【AiBase提要:】
?? 新夸克整合了AI對話、深度思考、深度搜索等多種功能，提供一站式服務。
?? 通過智能中樞系統，新夸克能夠自動識別用戶指令并進行深度執行。
?? 阿里巴巴計劃將通義系列模型的最新成果快速接入新夸克，以增強其功能。

2、谷歌開源新一代多模態模型 Gemma-3:性能卓越、成本降低10倍

谷歌最新發布的多模態大模型Gemma-3以其低成本和高性能引起了廣泛關注。該模型支持多種參數規模，最大可達270億參數，且僅需一張H100顯卡進行高效推理，算力需求顯著降低。Gemma-3在對話模型評比中表現優異，支持長文本處理和多模態數據，展現出強大的語言處理能力和創新的架構設計，是當前算力要求最低的高性能模型之一。

【AiBase提要:】
?? Gemma-3是谷歌最新開源的多模態大模型，參數范圍從10億到270億，且算力需求降低10倍。
?? 模型采用創新的架構設計，有效處理長上下文和多模態數據，支持文本與圖像的同時處理。
?? Gemma-3支持140種語言的處理能力，經過訓練優化后在多項任務中表現優異，展現了強大的綜合能力。
詳情鏈接:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3、百度文心快碼推出Comate Zulu版本并正式開放公測

百度旗下的文心快碼推出了Comate Zulu版本，標志著在智能編程領域的一次重大突破。該版本通過結合文心大模型的強大能力和豐富的編程大數據，為開發者提供了更高效的編程體驗。用戶可以通過自然語言與系統進行交流，快速搭建項目和理解代碼邏輯，大幅提升開發效率。公測活動將持續至3月28日，開發者可以在主流IDE中體驗這一創新功能。

【AiBase提要:】
??? 通過全自然語言實現需求，無需編寫代碼即可自動搭建項目，支持口語交流和圖片展示。
?? 快速理解代碼庫的業務邏輯，提供架構圖梳理和智能啟發思路，幫助開發者迅速上手新項目。
?? 自動搭建開發環境，支持依賴自動安裝和服務自啟動，實現從需求到代碼的端到端生成。
詳情鏈接:https://comate.baidu.com

4、字節Trae接入硅基流動SiliconCloud 支持DeepSeek多款模型API

硅基流動平臺與字節跳動推出的AI IDE——Trae正式接入，提升了開發者的編程體驗。用戶可以通過簡單的步驟接入多款編碼模型，包括DeepSeek-R1、V3等，滿足不同需求。平臺還提供免費的API服務，助力開發者實現更高效的開發過程。未來，硅基流動將繼續擴展模型種類和合作應用，致力于為開發者提供更穩定的服務。

【AiBase提要:】
?? Trae接入硅基流動，提供多種高效編碼模型，提升編程體驗。
?? 用戶可通過簡單步驟添加模型，獲取API密鑰。
?? 硅基流動致力于提供穩定的API服務，未來將擴展模型種類。

5、王炸更新!谷歌AI Studio再進化:YouTube視頻秒懂，AI作畫還能保持角色統一

谷歌AI Studio的最新升級引發了科技圈的轟動，用戶現在可以直接通過YouTube鏈接理解視頻內容，無需下載和上傳。Gemini2.0Flash Experimental模型不僅在視頻解析上表現出色，還在圖像生成方面展現了驚人的一致性。

【AiBase提要:】
?? 谷歌AI Studio現在支持直接解析YouTube視頻鏈接，用戶可快速理解視頻內容。
??? Gemini2.0Flash exp在圖像生成方面表現卓越，角色在多張圖片中保持一致性。
? 更新標志著谷歌AI Studio從基礎模型向應用級工具的轉型，影響現有AI工具生態。
詳情鏈接:https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6、叫板Sora?潞晨科技開源視頻大模型Open-Sora2.0，降本提速

潞晨科技推出的Open-Sora2.0以其僅20萬美元的訓練成本和110億參數的強大性能，成功挑戰了OpenAI Sora等行業標桿。該模型在多個評測中表現優異，尤其在VBench中與OpenAI Sora的性能差距縮小至0.69%。

【AiBase提要:】
?? 成本低:Open-Sora2.0僅需20萬美元訓練成本，顯著低于行業標準。
?? 性能強:擁有110億參數，性能接近OpenAI Sora，VBench評測中表現優異。
?? 開源共享:全流程訓練代碼開源，推動視頻生成技術的共同發展。
詳情鏈接:https://github.com/hpcaitech/Open-Sora

7、阿里通義新視頻生成和編輯模型VACE 可控制運動軌跡、替換主體等

阿里通義Wan團隊推出了全新的VACE模型，旨在降低視頻制作的門檻并提升創作效率。VACE的按條件生成視頻功能讓用戶可以通過文字描述快速實現創意，仿佛擁有了一支夢幻攝制組。此外，VACE還具備多種強大的編輯功能，如物體運動軌跡控制、視頻主體替換、風格遷移和視頻畫面智能擴展等。

【AiBase提要:】
?? VACE模型通過文字描述快速生成視頻，提升創作效率。
?? 支持物體運動軌跡控制和視頻主體替換，靈活多變。
??? 具備視頻畫面智能擴展和風格遷移功能，豐富創作表現。
詳情鏈接:https://arxiv.org/pdf/2503.07598

8、理想汽車AI助手理想同學網頁版上線:接入DeepSeek R1滿血版

理想汽車正式推出其人工智能助手理想同學網頁版，標志著其在智能服務領域的進一步擴展。該助手接入了DeepSeek R1V3671B滿血版，提供強大的問答能力和跨場景服務協同。用戶可以在不同模型之間切換，支持長文本輸入及圖像問答功能，提升了交互體驗。

【AiBase提要:】
?? 理想同學網頁版現已上線，用戶可在電腦端使用，拓展智能服務生態。
?? 接入DeepSeek R1V3671B滿血版，支持模型切換和深度思考功能，提升問答能力。
??? 支持千字長文本輸入和圖像問答，提供更強的用戶交互體驗。

9、谷歌Gemini2.0Flash放出原生多模態圖像生成功能:支持多輪對話式實時編輯

谷歌最新推出的Gemini2.0Flash在AI圖像生成領域引入了原生圖像生成技術，顯著提升了生成效率和準確性。與以往依賴于大型語言模型的方式不同，Gemini2.0Flash實現了圖像生成與文本理解的直接集成，使得創作過程更加流暢。

【AiBase提要:】
?? 原生圖像生成:Gemini2.0Flash將圖像生成功能直接集成，避免了信息失真，提高了生成效率和準確性。
??? 實時編輯:支持多輪對話式編輯，用戶可以用自然語言提出修改意見，AI能夠即時響應并調整圖像。
?? 企業應用:為營銷團隊和開發者提供強大工具，快速生成內容，降低設計成本，提高工作效率。

10、Remade AI 開源8款 Wan2.1特效 LoRA，掀起 AI 視頻創作新熱潮

Remade AI 在 Hugging Face 平臺推出了8款基于 Wan2.1模型的開源特效 LoRA，吸引了科技界的廣泛關注。這些特效模塊不僅能夠將靜態圖像轉化為動態視頻，還為 AI 視頻生成帶來了新的創意可能性。

【AiBase提要:】
??8款新特效 LoRA 包括擠壓、蛋糕化、膨脹等，豐富了 AI 視頻創作的可能性。
?? Wan2.1模型以其高效性和多功能性，成為視頻生成領域的頂尖選擇。
?? Remade AI 邀請全球用戶提出定制需求，承諾持續開源更多特效模塊。

11、AI對口型革命性突破:Captions新模型Mirage打造超真實UGC視頻

Captions公司推出的全新AI模型Mirage，標志著視頻生成技術的重大突破。該模型能夠實時生成UGC風格視頻，面部表情與肢體語言的真實度超越以往技術，簡化了視頻制作流程，尤其對廣告和內容創作者而言，將成本和時間大幅縮減。

【AiBase提要:】
?? Mirage模型能夠實時生成UGC視頻，無需依賴預錄素材或傳統工具。
?? 生成的角色面部表情與肢體語言真實度極高，難以分辨真假。
?? 支持29種語言生成視頻，極大簡化視頻制作流程，降低成本與時間。
詳情鏈接:https://www.captions.ai/mirage

12、谷歌推機器人控制模型Gemini Robotics，讓機器人像人類一樣思考行動

谷歌的Gemini Robotics是一個革命性的機器人控制模型，旨在將人工智能的智慧注入機器人，使其在物理世界中更智能地行動?；贕emini2.0模型，Gemini Robotics具備強大的多模態理解能力，能夠理解文本、圖像、音頻和視頻，并具備出色的泛化能力，能快速適應新環境和指令。

【AiBase提要:】
?? Gemini Robotics基于Gemini2.0模型，具備強大的多模態理解能力，能夠處理文本、圖像、音頻和視頻。
?? 該模型展現出卓越的泛化能力，能夠迅速適應新物體和環境，解決各種實際問題。
?? 谷歌在安全性方面采取了全面措施，確保機器人在執行任務時的安全性和可靠性。
詳情鏈接:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

13、智譜AI宣布再獲珠海5億元融資

珠海華發集團近期宣布向智譜公司投資5億元人民幣，旨在推動其GLM大模型的技術創新與生態發展。這一舉措標志著珠海國資正式加入智譜的投資陣容。智譜在融資方面表現優異，去年成功完成多輪融資，總額超過40億元，吸引了多家知名投資機構。

【AiBase提要:】
?? 珠海華發集團向智譜進行5億元戰略投資，支持其技術創新與生態發展。
?? 智譜在融資方面表現強勁，去年完成超過40億元的多輪融資，投資者涵蓋多個城市的國資力量。
?? 預計到2025年，智譜將推出全新開源大模型，推動AI行業的繁榮與發展。

（舉報）

相關推薦

關鍵詞：

2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

AI正從參數比拼轉向賦能實體經濟的“下半場”，行業重心轉向千行百業的規?；瘧寐涞?。華為云憑借基于CloudMatrix+AI Infra的智算云服務，成功入選“人工智能基礎與產業融合”示范案例TOP5，彰顯了中國式AI與產業融合發展新路徑。華為云堅持深入產業，解決行業難題，通過“車-網-云”協同的AI無人駕駛全棧方案，賦能礦山、水泥等行業實現降本增效。未來，華為云將繼續堅持“做難而正確的事”，推動AI真正深入行業場景，共同邁向新質生產力發展的下一程。

?新質生產力 ?AI產業融合 ?華為云
海爾智家超級智能體“智小能”實現全員全面AI化

海爾智家通過打造超級智能體“智小能”，構建數據驅動的智能化管理體系，實現全員全流程全面AI化。公司認為未來企業需要兩類AI人才：創造AI能力的技術人才和善用AI工具的業務人才。借助“智小能”，海爾智家加速AI普及，讓每位員工擁有個人智能體，伴隨其共同成長。實踐表明，AI已在研發、采購、制造、物流、辦公等多場景顯著提升效率，如研發信息提取效率提升90%，采購成本降低10%。全員全面AI化不僅是技術疊加，更是組織能力和人才生態的系統性重塑，形成人與AI協同進化的工作新模式，為企業在智能化浪潮中持續前行提供動力。

?數字化轉型 ?AI人才 ?超級智能體
“十五五”擘畫高質量發展，六聯智能聚力 AI 譜新篇

六聯智能在深圳舉辦18周年慶典，宣布全面布局AI賽道。公司從IDH代工成功轉型為全棧式AI服務商，提出2026年實現AI終端出貨1500萬臺、營收沖擊100億元的目標。通過硬件、軟件、生態協同，六聯智能展示了覆蓋AI PC、工作站、服務器的全棧解決方案，并與英特爾等伙伴深化合作，共同推動AI技術賦能千行百業，為中國制造向“中國智造”轉型提供實踐范例。

?人工智能 ?六聯智能 ?中國智造
宸境科技重磅發布具身智能新品牌及全棧技術矩陣，突破空間智能技術邊界

1月28日，許境科技在杭州發布具身智能新品牌“LooperRobotics”及全棧技術產品矩陣。該矩陣包括Insight全自主空間智能相機、TinyNav高性能導航算法庫和RoboSpatial空間編輯工具鏈，旨在通過軟硬件一體化創新，打造驅動通用機器人的標準化感知底座。此次發布標志著公司在關鍵感知硬件、底層算法及應用工具鏈領域取得重要突破，為機器人成為繼汽車、手機之后的物理任務基礎設施提供堅實支撐。

?具身智能 ?空間智能 ?機器人技術
宜信唐寧烏鎮倡議：設首席AI官讓人工智能更有溫度

在2025年世界互聯網大會烏鎮峰會上，宜信公司CEO唐寧前瞻性地呼吁企業設立“首席AI官”，以此推動人工智能從冰冷的效率工具，演進為富有人文溫度的協同伙伴。這一主張不僅呼應了峰會“共筑開放合作、安全普惠的數智未來”的主題，更為AI的發展路徑注入了“暖心”與“共情”的關鍵維度，描繪出一幅人機深度協作、效率與溫度并重的新圖景。在烏鎮峰會“前沿人工智能

?首席AI官 ?人工智能 ?人機協作
深耕AI+教育！簡知科技入選2025廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選薈

2025年12月24日，廣州舉辦人工智能算力應用及產業發展聯盟年度峰會。簡知科技憑借其在“人工智能+教育”領域的實踐成果，成功入選2025年廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選。這體現了政府和行業對其推動AI與教育場景融合、建設智能教育服務生態貢獻的肯定。其核心自研的“簡智AI大模型”已通過國家生成式人工智能服務備案，為教學流程管理、知識體系構建與個性化學習等關鍵環節提供技術支撐。公司將持續深化AI與教育全場景的融合應用，助力建設更加智能化、個性化的終身學習體系。

?人工智能 ?算力應用 ?產業發展
2025智能鎖年報發布：AI智能鎖元年開啟，德施曼穩坐線上銷額第一

近日，奧維云網與洛圖科技相繼發布2025年中國智能門鎖市場年度報告。報告指出，智能鎖行業正從規模擴張向價值提升轉型，回歸優質優價主賽道。行業領軍品牌德施曼以顯著優勢奪得線上市場銷售額第一，展現出強大的品牌韌性與市場穿透力。在2000元以上價格段，德施曼連續多年穩居銷量與銷售額雙料冠軍，其領先地位已形成極具含金量的“護城河”。頭部效應明顯，品牌格局重構。AI智能鎖成行業共識，德施曼領跑AI技術布局，其旗艦產品麒麟R9深度融合AI大模型，首創搭載AI智能管家Miya，引領行業從“被動開鎖”向“主動守護”的產業范式變革。

?智能門鎖 ?德施曼 ?線上市場
AI手機的終局，“讀屏”還是“對話”？

最近科技圈的兩場“AI秀”先后刷屏。在大洋彼岸，當地時間1月12日，蘋果和谷歌宣布合作，要給Siri用上谷歌的Gemini。但蘋果的做法，不是直接讓Gemini操作手機上的App，而是用戶說什么，Siri先理解意圖，然后去調用相應的應用。換句話說，AI只是個“調度員”。這套操作，很蘋果。另一邊，國內的情況就熱鬧得多。字節跳動的豆包AI手機一度刷屏，AI可以幫你打車、購物、訂

?AI手機 ?Siri ?Gemini
瀏覽器端語音交互指南：如何用低代碼快速集成AI語音智能體？

本文探討了AI時代語音交互技術的發展與應用。文章指出，AI正深刻改變生產生活方式，語音輸入需求快速增長，尤其在需要雙手作業的場景中，語音交互能提供無縫高效的工作流程。文章以活字格低代碼開發平臺為例，詳細介紹了如何在瀏覽器端實現實時語音交互，包括通過麥克風權限獲取、語音識別模型實時轉寫文本、并與AI大模型進行智能對話的完整方案。該方案不僅提升了交互效率和準確性，還保障了用戶隱私安全。最后，文章展望了語音交互在智能家居、醫療健康、教育等領域的廣泛應用前景，同時也指出了隱私保護、準確性提升和無障礙訪問等面臨的挑戰。

?人工智能 ?Web應用 ?語音輸入
春節十億紅包的背后：AI超級入口的豪賭

似乎是某種默契，AI將大廠的爭奪拉到了同一個水平起點上。馬年春節臨近，騰訊、百度、字節跳動、阿里巴巴四家大廠重啟了紅包大戰，金額從5億到10億不等，而將靶點也直接指向了AI。十年前，紅包是支付入口或電商導流的工具;如今，紅包成了爭奪AI助手“超級入口”的誘餌。騰訊元寶、百度文心、阿里千問、字節豆包的紅包活動，均綁定了AI交互行為:用戶需打開AI助手，

?AI紅包大戰 ?大廠AI爭奪 ?AI助手入口

今日大家都在搜的詞：

熱文

3 天
7天

AI日報：重磅！阿里新夸克升級為“AI框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

海爾智家超級智能體“智小能”實現全員全面AI化

“十五五”擘畫高質量發展，六聯智能聚力 AI 譜新篇

宸境科技重磅發布具身智能新品牌及全棧技術矩陣，突破空間智能技術邊界

宜信唐寧烏鎮倡議：設首席AI官讓人工智能更有溫度

深耕AI+教育！簡知科技入選2025廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選薈

2025智能鎖年報發布：AI智能鎖元年開啟，德施曼穩坐線上銷額第一

AI手機的終局，“讀屏”還是“對話”？

瀏覽器端語音交互指南：如何用低代碼快速集成AI語音智能體？

春節十億紅包的背后：AI超級入口的豪賭

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

余承東公布問界M6實車外觀預計將于今年春季發布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

iQOO 15 Ultra今日發布主打極致性能

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

余承東公布問界M6實車外觀預計將于今年春季發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

站長商機

AI日報：重磅！阿里新夸克升級為“AI框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

今日大家都在搜的詞：

熱文

站長商機

AI日報：重磅！阿里新夸克升級為“AI框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0