AI日報：騰訊混元推3D生成大模型Hunyuan3D-PolyGen；釘釘AI表格重磅來襲；阿里推多模態大語言模型HumanOmniV2

2025-07-08 16:26 · 稿源：aibase

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們為你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、了解創新AI產品應用。

新鮮AI產品點擊了解:https://top.aibase.com/

1、騰訊混元推出業界首個美術級3D生成大模型Hunyuan3D-PolyGen

騰訊混元3D團隊推出的Hunyuan3D-PolyGen模型，通過創新的BPT技術和自回歸網格生成框架，解決了傳統3D生成算法中布線質量差、面數過高和后期編輯難的問題，顯著提升了美術師建模效率。

【AiBase提要:】
?? 實現上萬面復雜幾何模型的精準生成，提升建模效率超70%。
?? 采用‘網格序列化-自回歸建模-序列解碼’三步框架，壓縮單個面的表征Token數量74%。
?? 引入強化學習訓練框架，提升模型生成優質結果的概率40%以上。
體驗網址:3d.hunyuan.tencent.com

2、阿里HumanOmniV2震撼發布:多模態AI新王者，準確率飆升至69.33%

阿里巴巴集團推出的多模態大語言模型HumanOmniV2在AI領域引發廣泛關注。其強大的全局上下文理解能力和多模態推理能力顯著提升了復雜場景的理解能力，并在多個權威基準測試中表現出色，展現了其在日常對話、復雜場景感知和用戶意圖理解方面的優勢。

【AiBase提要:】
?? HumanOmniV2引入強制性上下文總結機制，提升多模態推理能力。
?? 在Daily-Omni、WorldSense和IntentBench等數據集上表現優異，準確率分別達到58.47%、47.1%和69.33%。
?? 支持多種語言輸入，增強國際化適用性，推動AI在教育、醫療、金融等領域的應用。
詳情鏈接:https://github.com/HumanMLLM/HumanOmniV2

3、釘釘AI表格重磅來襲:1小時處理1000個任務，零門檻搞定數據分析

釘釘AI表格的發布標志著企業辦公進入AI驅動的新時代，其智能化優勢體現在智能字段處理、零門檻數據分析和自動化流程創建三個方面，同時首創‘表格即文檔’功能，大幅提升數據處理效率和用戶體驗。

微信截圖_20250708113649.png

【AiBase提要:】
?? 智能字段處理:內置80多種字段模板，支持智能提取、分類和匹配信息。
?? 零門檻數據分析:自然語言描述需求，AI自動生成計算公式和圖表。
?? 自動化流程創建:設定觸發條件與執行動作，實現全天候智能協作。

4、百度AI團隊推出PaddleOCR3.1版關鍵能力支持MCP

百度AI團隊推出的PaddleOCR3.1版本在多語種識別、復雜文檔翻譯和大模型連接能力上實現了顯著升級，為開發者提供了更高效、精準的AI工具。

微信截圖_20250708091203.png

【AiBase提要:】
?? PP-OCRv5多語種模型支持37種語言，提升識別準確率超30%。
?? PP-DocTranslation翻譯產線可處理復雜文檔并實現專業術語精準翻譯。
?? MCP服務器功能簡化AI應用開發流程，支持標準化協議接入。
詳情鏈接:https://github.com/PaddlePaddle/PaddleOCR

5、微軟推出 Deep Research:自動化研究助力科研和商業分析

微軟推出了 Deep Research，這是一款支持 API 和 SDK 的智能體，能夠自動化研究流程，提高科研和分析效率。它適用于多個領域，如金融和醫療，并且其 API 已經開放，方便開發者集成到自己的應用中。

【AiBase提要:】
?? Deep Research 自動化研究流程，顯著提升科研和分析效率。
?? 支持多領域應用，金融和醫療報告生成同樣適用。
?? API 現已開放，開發者可將其能力集成到自有應用中。
詳情鏈接:https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUQ1VGQUEzRlBIMVU2UFlHSFpSNkpOR0paRSQlQCN0PWcu

6、DLoRAL:開源視頻高清化框架，香港理工與OPPO聯合打造

文章介紹了由香港理工大學與OPPO研究院聯合推出的開源框架DLoRAL，該框架基于擴散模型，實現一步生成高質量視頻，突破傳統視頻超分辨率方法的瓶頸。其雙LoRA架構和雙階段訓練策略顯著提升了視頻清晰度和流暢性，為視頻內容創作提供了高效工具。

【AiBase提要:】
?? DLoRAL采用雙LoRA架構，C-LoRA確保時間一致性，D-LoRA增強空間細節。
?? 雙階段訓練策略優化時間連貫性和高頻信息，提升畫面細節表現。
? 推理速度提升約10倍，性能超越傳統方法，助力視頻內容創作。

7、谷歌開源MCP Toolbox for Databases:10行代碼解鎖AI與數據庫的無限可能

文章介紹了谷歌推出的MCP Toolbox for Databases，該工具通過模型上下文協議（MCP）簡化了AI智能體與SQL數據庫的集成流程。它具備極簡集成、內置安全機制和廣泛的應用場景，為開發者提供了高效、可靠的解決方案。

【AiBase提要:】
?? 內置連接池管理和身份驗證機制，提升數據庫交互安全性。
?? 支持多種數據庫，如AlloyDB、Spanner、Cloud SQL等，滿足多樣化需求。
?? 開源特性，提供詳細安裝指南和示例代碼，便于快速上手使用。
詳情鏈接:https://github.com/googleapis/genai-toolbox

8、微軟 Win11即將推出 AI 動態壁紙功能，預覽版代碼已現

微軟在最新 Windows11預覽版中引入了 AI 動態壁紙功能的代碼，雖然該功能尚未激活，但其潛在的智能更新和時間響應機制引發了廣泛關注。這一功能可能為用戶帶來更加個性化和智能的桌面體驗，同時延續了微軟在視覺設計方面的探索。

【AiBase提要:】
?? 微軟 Win11新增 AI 動態壁紙功能，已在預覽版中添加代碼但尚未激活。
??? 用戶可選擇主題，系統將自動更新壁紙，可能包含時間響應機制。
?? 相關功能曾在其他設備和系統中探索，當前開發旨在提升 Windows11的視覺體驗。

（舉報）

相關推薦

關鍵詞：

MiroMind 破局：在大語言模型的夾縫中，陳天橋在造什么？

本文闡述了陳天橋創立的MiroMind在AI領域的獨特路徑。文章將當前主流AI分為“文科模型”（如OpenAI，側重語言生成與模擬）和“理科模型”（MiroMind追求的方向，強調因果推理與可驗證性）。MiroMind反對單純追求“行為主義”（圖靈測試）或“功能主義”（替代工作），提出構建“通用推理引擎”的新定位。其核心是放棄“全知全能”幻想，承認模型會出錯，通過引入“自我糾錯”機制和外部反饋閉環來生存。目標不是聊天機器人，而是“可審計、可驗證的通用問題求解器”，瞄準科研、工業等高容錯門檻的B端“深水區”。文章以BrowseComp案例說明，小參數模型通過Agent交互可戰勝更大模型，證明了推理能力可通過架構創新實現。最終，作者將理想的AGI比作一把精準剔除謬誤的“手術刀”，而非無所不知的“神”。

?Scale ?Law ?能力分級
薦AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內測截圖泄露；Clawd更名為OpenClaw

本期AI日報聚焦具身智能與AI應用新動態。螞蟻集團發布LingBot-VLA模型，實現雙手機器人通用操控；宇樹開源UnifoLM-VLA-0模型，為機器人注入物理常識。開源AI助手OpenClaw更名后受關注，強調隱私安全。商湯開源SenseNova-MARS模型，在多個榜單超越GPT-5.2。騰訊“元寶派”社交功能內測截圖泄露，整合微信與QQ好友，支持同步觀影聽歌。馬斯克計劃明年推出高度個性化AI生成游戲與影音內容。Anthropic因涉嫌大規模盜版遭音樂出版商起訴，索賠30億美元。字節與阿里在春節前后發布新一代大模型，爭奪云端主導權。

?人工智能 ?機器人技術 ?螞蟻集團
騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

騰訊混元圖像3.0圖生圖模型正式發布，支持圖片編輯與多圖融合功能，已在元寶同步上線。該模型基于混元圖像3.0原生多模態架構，采用混合專家（MoE）架構，總參數量達800億。通過指令微調和后訓練，模型能深度理解并處理用戶輸入的圖像和編輯指令，生成圖片一致性強、真實感佳、情緒表現力好，且速度顯著提升。功能上支持增刪改、風格變換、老照片修復、人物與文字修改等多種編輯能力，并能實現多圖融合，適用于表情包制作、虛擬人物合拍、社交分享、電商海報設計、游戲角色定制及創意圖片制作等多樣化操作。

?騰訊混元 ?混元圖像3.0 ?圖生圖模型
薦AI日報：混元圖像3.0圖生圖模型發布；開源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂奇AI眼鏡

本期AI日報聚焦多領域AI新動態：騰訊發布混元圖像3.0，實現語義驅動的精準修圖；開源AI助手Clawdbot單日獲9000星，具備物理級執行力；京東購物智能體JoyGlance登陸Rokid眼鏡，簡化購物流程；蘋果Siri將整合谷歌Gemini核心，預計2月發布；騰訊“元寶派”開啟內測，探索AI深度融入社交場景；百度文心助手推出5億現金紅包活動，結合春節習俗；中國團隊SeaArt用戶破5000萬，實現創意到變現閉環；上海交大發布光學垂直大模型Optics GPT，重塑光學研發模式。

?AI ?圖像編輯 ?語義理解
范式官宣2026戰略升維：以“AI Agent + 世界模型”為核構建“AI + X”產業新生態

1月30日，范式集團年會在北京舉行。創始人戴文淵正式宣布，集團已完成品牌體系與戰略架構的全面升級。范式確立了以“AI Agent + 世界模型”為核心的技術路線，開啟“AI + X”的產業新生態。自2014年成立以來，范式堅持“AI for Everyone”的使命，始終致力于將AI的紅利惠及每一個人，在金融、制造、能源等20多個領域積累了十多年的經驗。2025年，公司完成集團化轉型，在延續“

?范式集團 ?AI ?Agent
薦AI日報：騰訊混元圖像3.0正式開源；Clawdbot迫于壓力更名Moltbot；月之暗面發布 Kimi Code

本期AI日報聚焦多領域AI新動態：騰訊混元圖像3.0開源，成為全球最強開源圖生圖模型；月之暗面發布Kimi Code，推動國產AI編程工具進入新階段；開源項目Clawdbot因商標風險更名Moltbot，并遭詐騙者利用舊賬號發布虛假代幣；谷歌AI Plus計劃正式擴展至美國等35個市場，月費不足8美元；OpenAI發布基于GPT-5.2的科研協作平臺Prism；谷歌Aluminum OS界面首曝，深度融合Android與ChromeOS；Mistral AI發布終端編程助手Vibe 2.0，步入“子代理”時代；小米AI眼鏡深度集成支付寶，實現停車繳費與健康管理“無感交互”。

?AI ?開源 ?圖生圖
薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

這兩天，又有一款全新的AI模型出現了。雖說如今AI改變各行各業的事情早就屢見不鮮，在游戲業，很多崗位也或多或少已經用上了AI技術，但最近發布的這款AI模型，它真不一樣。這款AI模型名叫PixVerse R1，按官方說法，PixVerse R1是全球首個真正意義上的「實時生成世界模型（Real-time World Model）」。

?AI模型 ?游戲行業 ?實時生成
薦AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上傳圖片生應用

本期AI日報涵蓋多個熱點：阿里投入30億啟動“千問”項目，旨在重塑用戶消費習慣；快手開展“AI魔改”視頻專項治理，打擊惡意篡改經典作品行為；馬斯克旗下xAI發布視頻生成工具Grok Imagine 1.0，支持生成10秒720p高清視頻；靈光App升級，新增圖片生成應用并集成近20項API；微軟調整Win11 AI功能，簡化或刪除不受歡迎部分以提升體驗；東南大學發布全球首個混凝土科學大模型，推動工程材料智能化；階躍星辰發布開源基座模型Step 3.5 Flash，專為智能體場景打造；螞蟻集團推出“AI Credit”激勵方案，鼓勵全員AI化創新。

?AI ?阿里巴巴 ?通義千問
薦AI日報：MiniMax Music 2.5 發布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

本期AI日報聚焦多項AI技術突破：MiniMax Music 2.5發布，提升AI音樂可控性與真實度；螞蟻靈波開源世界模型LingBot-World，為具身智能等提供高保真數字環境；谷歌Gemini 3.5泄露，單次提示可生成三千行代碼；Kimi K2.5 Agent升級，高效處理Excel、Word等辦公文檔；蘑菇物聯“靈知”垂直大模型通過備案，專注工業輔助與能源領域；昆侖萬維SkyReels-V3開源，實現多模態視頻生成；昆侖天工發布音樂大模型Mureka V8，推動AI音樂邁向“可發布”級別；三星宣布下一代AR眼鏡將于2026年發布，主打多模態AI體驗。

?AI音樂 ?MiniMax ?Music
飛書釘釘AI硬件爭奪戰：錄音背后的入口之爭

在釘釘推出DingTalk A1的5個月后，飛書也“殺”入了AI錄音設備的戰場。 1月19日，安克創新與飛書聯合做了一款AI錄音設備，即AI錄音豆，由安克創新做硬件，飛書則提供軟件和AI服務，產品售價899元。事實上，自釘釘創始人陳航（花名）無招回歸釘釘以來，雙方的競爭日趨激烈，從產品功能迭代，到相互爭奪客戶，打得不可開交。而現如今，雙方再次將競爭升級，將協同辦公

?AI錄音設備 ?協同辦公 ?釘釘

今日大家都在搜的詞：

熱文

3 天
7天

AI日報：騰訊混元推3D生成大模型Hunyuan3D-PolyGen；釘釘AI表格重磅來襲；阿里推多模態大語言模型HumanOmniV2

MiroMind 破局：在大語言模型的夾縫中，陳天橋在造什么？

薦AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內測截圖泄露；Clawd更名為OpenClaw

騰訊混元圖像3.0圖生圖模型發布已在元寶同步上線

薦AI日報：混元圖像3.0圖生圖模型發布；開源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂奇AI眼鏡

范式官宣2026戰略升維：以“AI Agent + 世界模型”為核構建“AI + X”產業新生態

薦AI日報：騰訊混元圖像3.0正式開源；Clawdbot迫于壓力更名Moltbot；月之暗面發布 Kimi Code

薦實時生成開放世界：新AI模型貼臉開大，游戲研發慌不慌？

薦AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上傳圖片生應用

薦AI日報：MiniMax Music 2.5 發布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

飛書釘釘AI硬件爭奪戰：錄音背后的入口之爭

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

余承東公布問界M6實車外觀預計將于今年春季發布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

iQOO 15 Ultra今日發布主打極致性能

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集?？魈扉_啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

余承東公布問界M6實車外觀預計將于今年春季發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

站長商機

AI日報：騰訊混元推3D生成大模型Hunyuan3D-PolyGen；釘釘AI表格重磅來襲；阿里推多模態大語言模型HumanOmniV2

今日大家都在搜的詞：

熱文

站長商機

AI日報：騰訊混元推3D生成大模型Hunyuan3D-PolyGen；釘釘AI表格重磅來襲；阿里推多模態大語言模型HumanOmniV2