日本在线A一区视频高清视频,亚洲日本中文字幕天堂网,亚洲中文字幕无码久久2020,日本伦理在线一区二区,97在线观看永久免费视频下载 ,国产三级做爰在线播放,被两个19厘米粗大空少双龙,色天天综合网色鬼综合
首頁 > 原創 > 關鍵詞  > AI技術最新資訊  > 正文

AI日報:重磅!阿里新夸克升級為“AI框”;谷歌開源多模態模型Gemma-3;潞晨科技開源視頻大模型Open-Sora 2.0

2025-03-13 15:34 · 稿源:站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、了解創新AI產品應用。

新鮮AI產品點擊了解:https://top.aibase.com/

1、阿里巴巴推出AI旗艦應用“新夸克” 全面升級為“AI超級框”

阿里巴巴于3月13日推出了其全新升級的AI旗艦應用——新夸克。這款應用基于阿里通義的先進推理與多模態大模型,整合了多種AI功能,旨在為用戶提供無縫的智能體驗。新夸克不僅能夠進行智能對話,還具備深度思考和執行能力,能夠滿足用戶在多個場景下的需求。

【AiBase提要:】

?? 新夸克整合了AI對話、深度思考、深度搜索等多種功能,提供一站式服務。

?? 通過智能中樞系統,新夸克能夠自動識別用戶指令并進行深度執行。

?? 阿里巴巴計劃將通義系列模型的最新成果快速接入新夸克,以增強其功能。

2、谷歌開源新一代多模態模型 Gemma-3:性能卓越、成本降低10倍

谷歌最新發布的多模態大模型Gemma-3以其低成本和高性能引起了廣泛關注。該模型支持多種參數規模,最大可達270億參數,且僅需一張H100顯卡進行高效推理,算力需求顯著降低。Gemma-3在對話模型評比中表現優異,支持長文本處理和多模態數據,展現出強大的語言處理能力和創新的架構設計,是當前算力要求最低的高性能模型之一。

image.png

【AiBase提要:】

?? Gemma-3是谷歌最新開源的多模態大模型,參數范圍從10億到270億,且算力需求降低10倍。

?? 模型采用創新的架構設計,有效處理長上下文和多模態數據,支持文本與圖像的同時處理。

?? Gemma-3支持140種語言的處理能力,經過訓練優化后在多項任務中表現優異,展現了強大的綜合能力。

詳情鏈接:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3、百度文心快碼推出Comate Zulu版本 并正式開放公測

百度旗下的文心快碼推出了Comate Zulu版本,標志著在智能編程領域的一次重大突破。該版本通過結合文心大模型的強大能力和豐富的編程大數據,為開發者提供了更高效的編程體驗。用戶可以通過自然語言與系統進行交流,快速搭建項目和理解代碼邏輯,大幅提升開發效率。公測活動將持續至3月28日,開發者可以在主流IDE中體驗這一創新功能。

image.png

【AiBase提要:】

??? 通過全自然語言實現需求,無需編寫代碼即可自動搭建項目,支持口語交流和圖片展示。

?? 快速理解代碼庫的業務邏輯,提供架構圖梳理和智能啟發思路,幫助開發者迅速上手新項目。

?? 自動搭建開發環境,支持依賴自動安裝和服務自啟動,實現從需求到代碼的端到端生成。

詳情鏈接:https://comate.baidu.com

4、字節Trae接入硅基流動SiliconCloud 支持DeepSeek多款模型API

硅基流動平臺與字節跳動推出的AI IDE——Trae正式接入,提升了開發者的編程體驗。用戶可以通過簡單的步驟接入多款編碼模型,包括DeepSeek-R1、V3等,滿足不同需求。平臺還提供免費的API服務,助力開發者實現更高效的開發過程。未來,硅基流動將繼續擴展模型種類和合作應用,致力于為開發者提供更穩定的服務。

image.png

【AiBase提要:】

?? Trae接入硅基流動,提供多種高效編碼模型,提升編程體驗。

?? 用戶可通過簡單步驟添加模型,獲取API密鑰。

?? 硅基流動致力于提供穩定的API服務,未來將擴展模型種類。

5、王炸更新!谷歌AI Studio再進化:YouTube視頻秒懂,AI作畫還能保持角色統一

谷歌AI Studio的最新升級引發了科技圈的轟動,用戶現在可以直接通過YouTube鏈接理解視頻內容,無需下載和上傳。Gemini2.0Flash Experimental模型不僅在視頻解析上表現出色,還在圖像生成方面展現了驚人的一致性。

image.png

【AiBase提要:】

?? 谷歌AI Studio現在支持直接解析YouTube視頻鏈接,用戶可快速理解視頻內容。

??? Gemini2.0Flash exp在圖像生成方面表現卓越,角色在多張圖片中保持一致性。

? 更新標志著谷歌AI Studio從基礎模型向應用級工具的轉型,影響現有AI工具生態。

詳情鏈接:https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6、叫板Sora?潞晨科技開源視頻大模型Open-Sora2.0,降本提速

潞晨科技推出的Open-Sora2.0以其僅20萬美元的訓練成本和110億參數的強大性能,成功挑戰了OpenAI Sora等行業標桿。該模型在多個評測中表現優異,尤其在VBench中與OpenAI Sora的性能差距縮小至0.69%。

image.png

【AiBase提要:】

?? 成本低:Open-Sora2.0僅需20萬美元訓練成本,顯著低于行業標準。

?? 性能強:擁有110億參數,性能接近OpenAI Sora,VBench評測中表現優異。

?? 開源共享:全流程訓練代碼開源,推動視頻生成技術的共同發展。

詳情鏈接:https://github.com/hpcaitech/Open-Sora

7、阿里通義新視頻生成和編輯模型VACE 可控制運動軌跡、替換主體等

阿里通義Wan團隊推出了全新的VACE模型,旨在降低視頻制作的門檻并提升創作效率。VACE的按條件生成視頻功能讓用戶可以通過文字描述快速實現創意,仿佛擁有了一支夢幻攝制組。此外,VACE還具備多種強大的編輯功能,如物體運動軌跡控制、視頻主體替換、風格遷移和視頻畫面智能擴展等。

【AiBase提要:】

?? VACE模型通過文字描述快速生成視頻,提升創作效率。

?? 支持物體運動軌跡控制和視頻主體替換,靈活多變。

??? 具備視頻畫面智能擴展和風格遷移功能,豐富創作表現。

詳情鏈接:https://arxiv.org/pdf/2503.07598

8、理想汽車AI助手理想同學網頁版上線:接入DeepSeek R1滿血版

理想汽車正式推出其人工智能助手理想同學網頁版,標志著其在智能服務領域的進一步擴展。該助手接入了DeepSeek R1V3671B滿血版,提供強大的問答能力和跨場景服務協同。用戶可以在不同模型之間切換,支持長文本輸入及圖像問答功能,提升了交互體驗。

image.png

【AiBase提要:】

?? 理想同學網頁版現已上線,用戶可在電腦端使用,拓展智能服務生態。

?? 接入DeepSeek R1V3671B滿血版,支持模型切換和深度思考功能,提升問答能力。

??? 支持千字長文本輸入和圖像問答,提供更強的用戶交互體驗。

9、谷歌Gemini2.0Flash放出原生多模態圖像生成功能:支持多輪對話式實時編輯

谷歌最新推出的Gemini2.0Flash在AI圖像生成領域引入了原生圖像生成技術,顯著提升了生成效率和準確性。與以往依賴于大型語言模型的方式不同,Gemini2.0Flash實現了圖像生成與文本理解的直接集成,使得創作過程更加流暢。

image.png

【AiBase提要:】

?? 原生圖像生成:Gemini2.0Flash將圖像生成功能直接集成,避免了信息失真,提高了生成效率和準確性。

??? 實時編輯:支持多輪對話式編輯,用戶可以用自然語言提出修改意見,AI能夠即時響應并調整圖像。

?? 企業應用:為營銷團隊和開發者提供強大工具,快速生成內容,降低設計成本,提高工作效率。

10、Remade AI 開源8款 Wan2.1特效 LoRA,掀起 AI 視頻創作新熱潮

Remade AI 在 Hugging Face 平臺推出了8款基于 Wan2.1模型的開源特效 LoRA,吸引了科技界的廣泛關注。這些特效模塊不僅能夠將靜態圖像轉化為動態視頻,還為 AI 視頻生成帶來了新的創意可能性。

image.png

【AiBase提要:】

??8款新特效 LoRA 包括擠壓、蛋糕化、膨脹等,豐富了 AI 視頻創作的可能性。

?? Wan2.1模型以其高效性和多功能性,成為視頻生成領域的頂尖選擇。

?? Remade AI 邀請全球用戶提出定制需求,承諾持續開源更多特效模塊。

11、AI對口型革命性突破:Captions新模型Mirage打造超真實UGC視頻

Captions公司推出的全新AI模型Mirage,標志著視頻生成技術的重大突破。該模型能夠實時生成UGC風格視頻,面部表情與肢體語言的真實度超越以往技術,簡化了視頻制作流程,尤其對廣告和內容創作者而言,將成本和時間大幅縮減。

image.png

【AiBase提要:】

?? Mirage模型能夠實時生成UGC視頻,無需依賴預錄素材或傳統工具。

?? 生成的角色面部表情與肢體語言真實度極高,難以分辨真假。

?? 支持29種語言生成視頻,極大簡化視頻制作流程,降低成本與時間。

詳情鏈接:https://www.captions.ai/mirage

12、谷歌推機器人控制模型Gemini Robotics,讓機器人像人類一樣思考行動

谷歌的Gemini Robotics是一個革命性的機器人控制模型,旨在將人工智能的智慧注入機器人,使其在物理世界中更智能地行動?;贕emini2.0模型,Gemini Robotics具備強大的多模態理解能力,能夠理解文本、圖像、音頻和視頻,并具備出色的泛化能力,能快速適應新環境和指令。

【AiBase提要:】

?? Gemini Robotics基于Gemini2.0模型,具備強大的多模態理解能力,能夠處理文本、圖像、音頻和視頻。

?? 該模型展現出卓越的泛化能力,能夠迅速適應新物體和環境,解決各種實際問題。

?? 谷歌在安全性方面采取了全面措施,確保機器人在執行任務時的安全性和可靠性。

詳情鏈接:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

13、智譜AI宣布再獲珠海5億元融資

珠海華發集團近期宣布向智譜公司投資5億元人民幣,旨在推動其GLM大模型的技術創新與生態發展。這一舉措標志著珠海國資正式加入智譜的投資陣容。智譜在融資方面表現優異,去年成功完成多輪融資,總額超過40億元,吸引了多家知名投資機構。

【AiBase提要:】

?? 珠海華發集團向智譜進行5億元戰略投資,支持其技術創新與生態發展。

?? 智譜在融資方面表現強勁,去年完成超過40億元的多輪融資,投資者涵蓋多個城市的國資力量。

?? 預計到2025年,智譜將推出全新開源大模型,推動AI行業的繁榮與發展。

舉報

  • 相關推薦
  • 2025新質生產力示范案例發布 華為云CloudMatrix AI Infra榮獲人工智能TOP案例

    AI正從參數比拼轉向賦能實體經濟的“下半場”,行業重心轉向千行百業的規?;瘧寐涞?。華為云憑借基于CloudMatrix+AI Infra的智算云服務,成功入選“人工智能基礎與產業融合”示范案例TOP5,彰顯了中國式AI與產業融合發展新路徑。華為云堅持深入產業,解決行業難題,通過“車-網-云”協同的AI無人駕駛全棧方案,賦能礦山、水泥等行業實現降本增效。未來,華為云將繼續堅持“做難而正確的事”,推動AI真正深入行業場景,共同邁向新質生產力發展的下一程。

  • 海爾智家超級智能體“智小能”實現全員全面AI化

    海爾智家通過打造超級智能體“智小能”,構建數據驅動的智能化管理體系,實現全員全流程全面AI化。公司認為未來企業需要兩類AI人才:創造AI能力的技術人才和善用AI工具的業務人才。借助“智小能”,海爾智家加速AI普及,讓每位員工擁有個人智能體,伴隨其共同成長。實踐表明,AI已在研發、采購、制造、物流、辦公等多場景顯著提升效率,如研發信息提取效率提升90%,采購成本降低10%。全員全面AI化不僅是技術疊加,更是組織能力和人才生態的系統性重塑,形成人與AI協同進化的工作新模式,為企業在智能化浪潮中持續前行提供動力。

  • “十五五”擘畫高質量發展,六聯智能聚力 AI 譜新篇

    六聯智能在深圳舉辦18周年慶典,宣布全面布局AI賽道。公司從IDH代工成功轉型為全棧式AI服務商,提出2026年實現AI終端出貨1500萬臺、營收沖擊100億元的目標。通過硬件、軟件、生態協同,六聯智能展示了覆蓋AI PC、工作站、服務器的全棧解決方案,并與英特爾等伙伴深化合作,共同推動AI技術賦能千行百業,為中國制造向“中國智造”轉型提供實踐范例。

  • 宸境科技重磅發布具身智能新品牌及全棧技術矩陣,突破空間智能技術邊界

    1月28日,許境科技在杭州發布具身智能新品牌“LooperRobotics”及全棧技術產品矩陣。該矩陣包括Insight全自主空間智能相機、TinyNav高性能導航算法庫和RoboSpatial空間編輯工具鏈,旨在通過軟硬件一體化創新,打造驅動通用機器人的標準化感知底座。此次發布標志著公司在關鍵感知硬件、底層算法及應用工具鏈領域取得重要突破,為機器人成為繼汽車、手機之后的物理任務基礎設施提供堅實支撐。

  • 宜信唐寧烏鎮倡議:設首席AI官讓人工智能更有溫度

    在2025年世界互聯網大會烏鎮峰會上,宜信公司CEO唐寧前瞻性地呼吁企業設立“首席AI官”,以此推動人工智能從冰冷的效率工具,演進為富有人文溫度的協同伙伴。這一主張不僅呼應了峰會“共筑開放合作、安全普惠的數智未來”的主題,更為AI的發展路徑注入了“暖心”與“共情”的關鍵維度,描繪出一幅人機深度協作、效率與溫度并重的新圖景。在烏鎮峰會“前沿人工智能

  • 深耕AI+教育!簡知科技入選2025廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選薈

    2025年12月24日,廣州舉辦人工智能算力應用及產業發展聯盟年度峰會。簡知科技憑借其在“人工智能+教育”領域的實踐成果,成功入選2025年廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選。這體現了政府和行業對其推動AI與教育場景融合、建設智能教育服務生態貢獻的肯定。其核心自研的“簡智AI大模型”已通過國家生成式人工智能服務備案,為教學流程管理、知識體系構建與個性化學習等關鍵環節提供技術支撐。公司將持續深化AI與教育全場景的融合應用,助力建設更加智能化、個性化的終身學習體系。

  • 2025智能鎖年報發布:AI智能鎖元年開啟,德施曼穩坐線上銷額第一

    近日,奧維云網與洛圖科技相繼發布2025年中國智能門鎖市場年度報告。報告指出,智能鎖行業正從規模擴張向價值提升轉型,回歸優質優價主賽道。行業領軍品牌德施曼以顯著優勢奪得線上市場銷售額第一,展現出強大的品牌韌性與市場穿透力。在2000元以上價格段,德施曼連續多年穩居銷量與銷售額雙料冠軍,其領先地位已形成極具含金量的“護城河”。頭部效應明顯,品牌格局重構。AI智能鎖成行業共識,德施曼領跑AI技術布局,其旗艦產品麒麟R9深度融合AI大模型,首創搭載AI智能管家Miya,引領行業從“被動開鎖”向“主動守護”的產業范式變革。

  • AI手機的終局,“讀屏”還是“對話”?

    最近科技圈的兩場“AI秀”先后刷屏。 在大洋彼岸,當地時間1月12日,蘋果和谷歌宣布合作,要給Siri用上谷歌的Gemini。但蘋果的做法,不是直接讓Gemini操作手機上的App,而是用戶說什么,Siri先理解意圖,然后去調用相應的應用。換句話說,AI只是個“調度員”。這套操作,很蘋果。 另一邊,國內的情況就熱鬧得多。字節跳動的豆包AI手機一度刷屏,AI可以幫你打車、購物、訂

  • 瀏覽器端語音交互指南:如何用低代碼快速集成AI語音智能體?

    本文探討了AI時代語音交互技術的發展與應用。文章指出,AI正深刻改變生產生活方式,語音輸入需求快速增長,尤其在需要雙手作業的場景中,語音交互能提供無縫高效的工作流程。文章以活字格低代碼開發平臺為例,詳細介紹了如何在瀏覽器端實現實時語音交互,包括通過麥克風權限獲取、語音識別模型實時轉寫文本、并與AI大模型進行智能對話的完整方案。該方案不僅提升了交互效率和準確性,還保障了用戶隱私安全。最后,文章展望了語音交互在智能家居、醫療健康、教育等領域的廣泛應用前景,同時也指出了隱私保護、準確性提升和無障礙訪問等面臨的挑戰。

  • 春節十億紅包的背后:AI超級入口的豪賭

    似乎是某種默契,AI將大廠的爭奪拉到了同一個水平起點上。馬年春節臨近,騰訊、百度、字節跳動、阿里巴巴四家大廠重啟了紅包大戰,金額從5億到10億不等,而將靶點也直接指向了AI。 十年前,紅包是支付入口或電商導流的工具;如今,紅包成了爭奪AI助手“超級入口”的誘餌。騰訊元寶、百度文心、阿里千問、字節豆包的紅包活動,均綁定了AI交互行為:用戶需打開AI助手,

今日大家都在搜的詞: