多模態檢索

阿里云發布多模態交互開發套件，集成通義千問、萬相、百聆三大模型，賦能智能硬件。騰訊混元推出開源3D角色動畫生成模型HY-Motion 1.0，助力游戲與動畫制作。智譜AI在港上市，募資43億港元，加速商業化落地。抖音在深圳南山設立第二總部，聚焦AI與泛視頻研發。OpenAI推出ChatGPT Health，強化健康數據管理與隱私保護。法拉第未來宣布進軍具身智能機器人領域，推動汽車與機器人業務協同。螞蟻阿福月活超3000萬，AI健康賽道進入中美競速新階段。MiroThinker 1.5以300億參數實現媲美萬億模型的性能，顯著降低推理成本。...

特別聲明：本頁面標簽名稱與頁面內容，系網站系統為資訊內容分類自動生成，僅提供資訊內容索引使用，旨在方便用戶索引相關資訊報道。如標簽名稱涉及商標信息，請訪問商標品牌官方了解詳情，請勿以本站標簽頁面內容為參考信息，本站與可能出現的商標名稱信息不存在任何關聯關系，對本頁面內容所引致的錯誤、不確或遺漏，概不負任何法律責任。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內容可能涉嫌侵犯其知識產權或存在不實內容時，可及時向站長之家提出書面權利通知或不實情況說明，并提權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯系地址）。本網站在收到上述反饋文件后，將會依法依規核實信息，第一時間溝通刪除相關內容或斷開相關鏈接。

與“多模態檢索”的相關熱搜詞：

相關“多模態檢索” 的資訊10篇

【騰訊云】11.11云上盛惠！云服務器首年1.8折起，買1年送3個月！

11.11云上盛惠！海量產品 · 輕松上云！云服務器首年1.8折起，買1年送3個月！超值優惠，性能穩定，讓您的云端之旅更加暢享。快來騰訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產品組合購
去看看

爆款產品組合購低至1元

騰訊云x NVIDIA加速計劃
去看看

騰訊云x NVIDIA加速計劃最高獲贈10萬元扶持基金

2核2G云服務器
去看看

2核2G云服務器 112元/1年

查看更多相關信息>>

騰訊云 12-20

廣告
薦 AI日報：阿里云推多模態交互開發套件；智譜AI港股首日上市；混元發布 HY-Motion1.0開源3D 角色動畫生成模型

阿里云發布多模態交互開發套件，集成通義千問、萬相、百聆三大模型，賦能智能硬件。騰訊混元推出開源3D角色動畫生成模型HY-Motion 1.0，助力游戲與動畫制作。智譜AI在港上市，募資43億港元，加速商業化落地。抖音在深圳南山設立第二總部，聚焦AI與泛視頻研發。OpenAI推出ChatGPT Health，強化健康數據管理與隱私保護。法拉第未來宣布進軍具身智能機器人領域，推動汽車與機器人業務協同。螞蟻阿福月活超3000萬，AI健康賽道進入中美競速新階段。MiroThinker 1.5以300億參數實現媲美萬億模型的性能，顯著降低推理成本。

AI開發套件多模態交互智能硬件
薦 AI日報：字節推StoryMem系統；月之暗面再推多模態新模型；AI眼鏡Pickle 1發布

本期AI日報聚焦多項AI領域進展：字節跳動推出StoryMem系統，提升AI生成視頻角色一致性28.7%；月之暗面計劃2026年推出多模態模型K2.1/K2.5；智能眼鏡Pickle 1實現“無限記憶”與主動交互；清華與OpenBMB開源音頻模型評測框架UltraEval-Audio；OpenAI押注語音交互，整合團隊重構音頻系統；開源工具Antigravity支持多賬號切換，突破AI使用限制；元象開源面向泛娛樂場景的大模型XVERSE-Ent；蘋果回應“國行版AI功能閹割”傳聞，提醒用戶勿通過第三方強行激活。

AI視頻生成角色一致性字節跳動
它石智航 WIYH 數據集正式開源：全球首個具身 VLTA 多模態數據，加速具身智能真實世界落地

它石智航開源了全球首個大規模真實世界具身多模態數據集WIYH，填補了高質量、可泛化、大規模真實世界數據的空白。該數據集采用以人為中心的新范式，破解了數據采集成本高、仿真數據遷移難等痛點，為具身基座模型實現Scaling Law提供了關鍵語料。WIYH數據集具備真實可靠、豐富多元、全面多模態、規模化等特征，并擁有海量數據，覆蓋10余種核心場景全鏈路任務。它石還?

具身智能多模態數據集 VLTA
谷歌AI眼鏡官宣明年問世：搭載Gemini多模態模型

谷歌宣布，正與三星、Gentle Monster及Warby Parker等合作伙伴共同研發兩種類型的AI智能眼鏡，預計新產品將于2026年面市。谷歌硬件負責人Payne表示，公司已從過往經歷中吸取教訓。新款眼鏡將深度集成其先進的Gemini大模型，在無需雙手操作的情況下，用戶可實現拍照、導航、接聽電話及識別眼前物體等功能，其定位與Meta和雷朋合作推出的智能眼鏡相似。此次發布的產品線將分?

AI智能眼鏡 Gemini大模型 AR導航
全球首個大一統多模態視頻模型可靈O1發布讓P視頻像P圖一樣簡單

全球首個大一統多模態視頻創作工具“可靈O1”正式上線。它基于全新視頻圖像模型，以自然語言為語義骨架，融合視頻、圖片、主體等多模態描述，將生成和編輯任務整合于一個全能引擎中，為用戶提供從靈感到成品的閉環創作體驗。該模型打破傳統單一視頻生成任務邊界，支持參考生視頻、文生視頻、首尾幀生視頻、視頻內容增刪、風格重繪等多種任務，用戶無需在多個工具間跳轉即可一站式完成全流程創作。
可靈AI O1正式上線：號稱全球首個統一多模態視頻大模型

可靈AI正式發布全新O1視頻大模型，被譽為全球首個統一多模態視頻大模型。該模型基于創新的多模態視覺語言交互架構，用戶可在單一輸入框內無縫融合文字、圖像、視頻等多種指令，實現跨模態內容的高效創作。其技術突破解決了傳統視頻生成工具功能割裂、操作復雜的痛點，并攻克了視頻中主體特征漂移的行業難題，支持長達310秒的自由生成時長。目前用戶可通過可靈App及官網體驗。

可靈AI O1視頻大模型多模態視頻
為AI Agent時代筑基，火山引擎多模態數據湖方案重塑數據處理范式

人工智能時代全球數據量激增，預計2028年將達393ZB，其中80%為非結構化數據。火山引擎推出多模態數據湖方案，以Lance存儲+Daft計算為核心，解決數據處理痛點：存儲層實現高壓縮比與靈活Schema，計算層通過延遲計算提升70%效率。該方案在智能駕駛等場景顯著優化性能，端到端處理時間縮短70%，資源利用率提升至95%以上。平臺還推出"算子廣場"降低開發門檻，并推出Data Agent實現自然語言交互的數據分析，推動企業構建以數據消費為導向的治理體系。

人工智能數據湖非結構化數據
小度AI眼鏡Pro獲評WISE2025年度焦點產品獎，多模態交互定義硬件新形態

在36氪WISE2025大會上，小度科技CEO李瑩以“智能深潛，硬件開始覺醒”為主題，系統闡述了大模型時代智能硬件的演進方向。她強調，場景、AI與硬件的深度融合是破局關鍵，并以小度AI眼鏡Pro為例，展示了“第一視角智能”的創新突破，具備智能構圖、防抖、降噪等功能，實現無縫交互體驗。同時，小度智能攝像機開創“上帝視角智能”，支持AI隨心看護和智能尋物。這些產品背后是全新“超能小度”AI助手，通過多模態交互實現從“能聽會說”到“能看會想”的質變。小度宣布為已售設備免費升級，彰顯AI普惠決心。小度AI眼鏡Pro獲“WISE2025年度焦點產品獎”，印證行業對其創新高度認可。
火山引擎多模態數據湖，破解智能駕駛數據處理瓶頸

在2025年第八屆智能輔助駕駛大會上，火山引擎數據產品解決方案專家分享了基于多模態數據湖構建的數據基座，旨在解決智能網聯汽車行業面臨的海量多模態數據處理難題。該方案通過優化存儲與計算架構，助力企業將百PB級異構數據轉化為驅動算法迭代與業務增長的核心資產。方案采用開放架構，聚焦開箱即用、開源兼容、輕量運維等六大維度，引入Lance數據湖格式提升存儲效率，整合Spark/Flink與Ray等框架優化計算性能。實踐案例顯示，在輔助駕駛項目中，訓練卡利用率從40%提升至85%以上，云端存儲成本降低20%，整體技術降本達20%。未來，方案將持續強化多模態數據基座性能，推動智能駕駛技術向更高階演進。

智能輔助駕駛多模態數據湖數據基座
Billus AI高交會全球首發多模態大模型以AI Agent重構創意產業文明進化路徑

2025年11月15日，Billus AI在高交會首發多模態大模型Billus0.57EDIT及“超級員工智能體”初階版，依托自研生存式大模型與AI Agent技術，打破創意領域垂直局限，構建覆蓋文創、時尚、藝術等全場景智能創作生態。該模型通過自然語言指令直達創意成果，實現從平面圖到施工圖的全流程高效生成。同時，Billus AI同步打造“創意設計超級員工+產業鏈智能體”體系，探索生成式創意與供應鏈智能推薦的新商業路徑，助力行業從“經驗驅動”向“數據智能”躍遷。

高交會 Billus畢魯斯多模態大模型

熱文

3 天
7天

多模態檢索

與“多模態檢索”的相關熱搜詞：

相關“多模態檢索” 的資訊10篇

【騰訊云】11.11云上盛惠！云服務器首年1.8折起，買1年送3個月！

薦 AI日報：阿里云推多模態交互開發套件；智譜AI港股首日上市；混元發布 HY-Motion1.0開源3D 角色動畫生成模型

薦 AI日報：字節推StoryMem系統；月之暗面再推多模態新模型；AI眼鏡Pickle 1發布

它石智航 WIYH 數據集正式開源：全球首個具身 VLTA 多模態數據，加速具身智能真實世界落地

谷歌AI眼鏡官宣明年問世：搭載Gemini多模態模型

全球首個大一統多模態視頻模型可靈O1發布讓P視頻像P圖一樣簡單

可靈AI O1正式上線：號稱全球首個統一多模態視頻大模型

為AI Agent時代筑基，火山引擎多模態數據湖方案重塑數據處理范式

小度AI眼鏡Pro獲評WISE2025年度焦點產品獎，多模態交互定義硬件新形態

火山引擎多模態數據湖，破解智能駕駛數據處理瓶頸

Billus AI高交會全球首發多模態大模型以AI Agent重構創意產業文明進化路徑

熱文

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

2026支付寶集福正式開啟今年支持掃馬得福玩法

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

新款聯想拯救者Y700平板官宣3月發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

余承東公布問界M6實車外觀預計將于今年春季發布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：MiniMax Music 2.5 發布；螞蟻靈波開源世界模型LingBo

AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內測截圖

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

特斯拉ModelS和ModelX項目將終止工廠將轉型生產機器人

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

REDMI Turbo 5系列今晚發布：開售即可享國補

奔馳140歲生日小米汽車向奔馳致敬雷軍：致敬行業先行者

支付寶「碰紅包卡」上線碰一下即可發/領紅包

站長商機