11.11云上盛惠!海量產品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優惠,性能穩定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
騰訊云
12-20
阿里云發布多模態交互開發套件,集成通義千問、萬相、百聆三大模型,賦能智能硬件。騰訊混元推出開源3D角色動畫生成模型HY-Motion 1.0,助力游戲與動畫制作。智譜AI在港上市,募資43億港元,加速商業化落地。抖音在深圳南山設立第二總部,聚焦AI與泛視頻研發。OpenAI推出ChatGPT Health,強化健康數據管理與隱私保護。法拉第未來宣布進軍具身智能機器人領域,推動汽車與機器人業務協同。螞蟻阿福月活超3000萬,AI健康賽道進入中美競速新階段。MiroThinker 1.5以300億參數實現媲美萬億模型的性能,顯著降低推理成本。
本期AI日報聚焦多項AI領域進展:字節跳動推出StoryMem系統,提升AI生成視頻角色一致性28.7%;月之暗面計劃2026年推出多模態模型K2.1/K2.5;智能眼鏡Pickle 1實現“無限記憶”與主動交互;清華與OpenBMB開源音頻模型評測框架UltraEval-Audio;OpenAI押注語音交互,整合團隊重構音頻系統;開源工具Antigravity支持多賬號切換,突破AI使用限制;元象開源面向泛娛樂場景的大模型XVERSE-Ent;蘋果回應“國行版AI功能閹割”傳聞,提醒用戶勿通過第三方強行激活。
它石智航開源了全球首個大規模真實世界具身多模態數據集WIYH,填補了高質量、可泛化、大規模真實世界數據的空白。該數據集采用以人為中心的新范式,破解了數據采集成本高、仿真數據遷移難等痛點,為具身基座模型實現Scaling Law提供了關鍵語料。WIYH數據集具備真實可靠、豐富多元、全面多模態、規模化等特征,并擁有海量數據,覆蓋10余種核心場景全鏈路任務。它石還?
谷歌宣布,正與三星、Gentle Monster及Warby Parker等合作伙伴共同研發兩種類型的AI智能眼鏡,預計新產品將于2026年面市。 谷歌硬件負責人Payne表示,公司已從過往經歷中吸取教訓。新款眼鏡將深度集成其先進的Gemini大模型,在無需雙手操作的情況下,用戶可實現拍照、導航、接聽電話及識別眼前物體等功能,其定位與Meta和雷朋合作推出的智能眼鏡相似。 此次發布的產品線將分?
全球首個大一統多模態視頻創作工具“可靈O1”正式上線。它基于全新視頻圖像模型,以自然語言為語義骨架,融合視頻、圖片、主體等多模態描述,將生成和編輯任務整合于一個全能引擎中,為用戶提供從靈感到成品的閉環創作體驗。該模型打破傳統單一視頻生成任務邊界,支持參考生視頻、文生視頻、首尾幀生視頻、視頻內容增刪、風格重繪等多種任務,用戶無需在多個工具間跳轉即可一站式完成全流程創作。
可靈AI正式發布全新O1視頻大模型,被譽為全球首個統一多模態視頻大模型。該模型基于創新的多模態視覺語言交互架構,用戶可在單一輸入框內無縫融合文字、圖像、視頻等多種指令,實現跨模態內容的高效創作。其技術突破解決了傳統視頻生成工具功能割裂、操作復雜的痛點,并攻克了視頻中主體特征漂移的行業難題,支持長達310秒的自由生成時長。目前用戶可通過可靈App及官網體驗。
人工智能時代全球數據量激增,預計2028年將達393ZB,其中80%為非結構化數據。火山引擎推出多模態數據湖方案,以Lance存儲+Daft計算為核心,解決數據處理痛點:存儲層實現高壓縮比與靈活Schema,計算層通過延遲計算提升70%效率。該方案在智能駕駛等場景顯著優化性能,端到端處理時間縮短70%,資源利用率提升至95%以上。平臺還推出"算子廣場"降低開發門檻,并推出Data Agent實現自然語言交互的數據分析,推動企業構建以數據消費為導向的治理體系。
在36氪WISE2025大會上,小度科技CEO李瑩以“智能深潛,硬件開始覺醒”為主題,系統闡述了大模型時代智能硬件的演進方向。她強調,場景、AI與硬件的深度融合是破局關鍵,并以小度AI眼鏡Pro為例,展示了“第一視角智能”的創新突破,具備智能構圖、防抖、降噪等功能,實現無縫交互體驗。同時,小度智能攝像機開創“上帝視角智能”,支持AI隨心看護和智能尋物。這些產品背后是全新“超能小度”AI助手,通過多模態交互實現從“能聽會說”到“能看會想”的質變。小度宣布為已售設備免費升級,彰顯AI普惠決心。小度AI眼鏡Pro獲“WISE2025年度焦點產品獎”,印證行業對其創新高度認可。
在2025年第八屆智能輔助駕駛大會上,火山引擎數據產品解決方案專家分享了基于多模態數據湖構建的數據基座,旨在解決智能網聯汽車行業面臨的海量多模態數據處理難題。該方案通過優化存儲與計算架構,助力企業將百PB級異構數據轉化為驅動算法迭代與業務增長的核心資產。方案采用開放架構,聚焦開箱即用、開源兼容、輕量運維等六大維度,引入Lance數據湖格式提升存儲效率,整合Spark/Flink與Ray等框架優化計算性能。實踐案例顯示,在輔助駕駛項目中,訓練卡利用率從40%提升至85%以上,云端存儲成本降低20%,整體技術降本達20%。未來,方案將持續強化多模態數據基座性能,推動智能駕駛技術向更高階演進。
2025年11月15日,Billus AI在高交會首發多模態大模型Billus0.57EDIT及“超級員工智能體”初階版,依托自研生存式大模型與AI Agent技術,打破創意領域垂直局限,構建覆蓋文創、時尚、藝術等全場景智能創作生態。該模型通過自然語言指令直達創意成果,實現從平面圖到施工圖的全流程高效生成。同時,Billus AI同步打造“創意設計超級員工+產業鏈智能體”體系,探索生成式創意與供應鏈智能推薦的新商業路徑,助力行業從“經驗驅動”向“數據智能”躍遷。