AI日?qǐng)?bào)：騰訊重磅發(fā)布混元圖像3.0；快手發(fā)布KAT系列Agentic Coding大模型；蘋(píng)果悄然研發(fā)ChatGPT式應(yīng)用

2025-09-28 16:20 · 稿源：站長(zhǎng)之家

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解：https://app.aibase.com/zh

1、快手發(fā)布KAT系列Agentic Coding大模型代碼表現(xiàn)出色

快手旗下的 Kwaipilot 團(tuán)隊(duì)發(fā)布了兩款革命性的大模型 —— KAT 系列中的 KAT-Dev-32B 和 KAT-Coder。這兩款模型在 Code Intelligence 領(lǐng)域表現(xiàn)出色，分別針對(duì)不同的用戶需求和應(yīng)用場(chǎng)景。KAT-Dev-32B 在 SWE-Bench Verified 測(cè)試中解決率達(dá)到了62.4%，而 KAT-Coder 的解決率則高達(dá)73.4%。

【AiBase提要:】
?? KAT-Dev-32B 是一個(gè)開(kāi)源的32億參數(shù)模型，解決率達(dá)到了62.4%。
?? KAT-Coder 作為閉源旗艦?zāi)Ｐ停鉀Q率高達(dá)73.4%，表現(xiàn)卓越。
?? KAT-Dev-32B 已在 Hugging Face 平臺(tái)上線，KAT-Coder 可通過(guò) StreamLake 平臺(tái)獲取 API 調(diào)用。
詳情鏈接:https://kwaipilot.github.io/KAT-Coder/

2、騰訊重磅發(fā)布 “混元圖像 3.0”，開(kāi)創(chuàng)多模態(tài)圖像生成新時(shí)代

騰訊重磅發(fā)布“混元圖像3.0”，標(biāo)志著其在多模態(tài)圖像生成領(lǐng)域的重大突破，為人工智能生成內(nèi)容（AIGC）技術(shù)的發(fā)展注入了新的活力。

【AiBase提要:】
?? 混元圖像3.0是首個(gè)開(kāi)源的工業(yè)級(jí)多模態(tài)生圖模型，具備強(qiáng)大的語(yǔ)義解析能力。
?? 3.0版本在2.0基礎(chǔ)上進(jìn)一步增強(qiáng)了模型的復(fù)雜性與表現(xiàn)力，實(shí)現(xiàn)毫秒級(jí)響應(yīng)速度和超寫(xiě)實(shí)圖像質(zhì)量。
?? 騰訊混元系列已形成完整的AIGC技術(shù)矩陣，涵蓋3D生成、定制化圖像生成等工具，推動(dòng)行業(yè)創(chuàng)新。

3、蘋(píng)果悄然研發(fā)ChatGPT式應(yīng)用，Siri即將重大改版

蘋(píng)果公司正在研發(fā)一款類似 ChatGPT 的 iPhone 應(yīng)用，用于測(cè)試 Siri 的重大改版。該應(yīng)用將提升 Siri 在個(gè)人數(shù)據(jù)搜索和操作方面的效率，同時(shí)增強(qiáng)其語(yǔ)音識(shí)別和理解能力，為用戶提供更智能、人性化的服務(wù)。

【AiBase提要:】
?? Siri 將通過(guò)新應(yīng)用提升搜索和操作能力，如查找歌曲和編輯照片。
?? 蘋(píng)果正在開(kāi)發(fā)類似 ChatGPT 的應(yīng)用，用于測(cè)試 Siri 的全新功能。
?? 未來(lái) Siri 的語(yǔ)音識(shí)別和理解能力將顯著提升，提供更自然的對(duì)話體驗(yàn)。

4、谷歌更新Gemini 2.5 Flash Lite，成為最快的專有模型

谷歌對(duì)Gemini系列大型語(yǔ)言模型進(jìn)行了重要更新，尤其是Gemini2.5Flash和Flash Lite，強(qiáng)調(diào)了速度和效率的提升。這些改進(jìn)展示了谷歌在AI領(lǐng)域的持續(xù)進(jìn)步，并為開(kāi)發(fā)者提供了更多靈活性。

【AiBase提要:】
?? Gemini2.5Flash Lite 成為最快的專有模型，輸出速度達(dá)每秒887個(gè) token。
?? 新模型在輸出質(zhì)量和成本效率上顯著提升，尤其是 Flash Lite 減少了50% 的輸出 token。
??? Gemini Live 的更新增強(qiáng)了語(yǔ)音助手的功能，提高了函數(shù)調(diào)用的準(zhǔn)確性和自然對(duì)話的能力。

5、蘋(píng)果推出新圖像模型 Manzano 實(shí)現(xiàn)理解與生成雙重能力

蘋(píng)果公司推出的 Manzano 圖像模型能夠同時(shí)處理圖像理解和生成，解決了當(dāng)前開(kāi)源模型在兩者之間選擇的難題。該模型采用混合圖像標(biāo)記器，減少了沖突，并在文本密集型任務(wù)中表現(xiàn)出色。

【AiBase提要:】
?? Manzano 是一種新型圖像模型，能夠同時(shí)進(jìn)行圖像理解和生成。
?? 蘋(píng)果的研究顯示，Manzano 在處理復(fù)雜文本任務(wù)時(shí)表現(xiàn)優(yōu)異，接近商業(yè)系統(tǒng)的水平。
?? 該模型采用混合圖像標(biāo)記器，減少了圖像理解與生成之間的沖突。
詳情鏈接:https://arxiv.org/abs/2509.16197

6、YouTube Music測(cè)試AI音樂(lè)主播功能：提供曲目故事和粉絲趣聞，正面迎戰(zhàn)Spotify AI DJ

YouTube Music正在測(cè)試AI音樂(lè)主播功能，為用戶播放的音樂(lè)提供相關(guān)故事、粉絲趣聞和評(píng)論解說(shuō)。這一功能是對(duì)Spotify AI DJ的回應(yīng)，旨在提升用戶的沉浸式聽(tīng)覺(jué)體驗(yàn)。

【AiBase提要:】
?? YouTube Music推出AI音樂(lè)主播功能，為用戶提供音樂(lè)背后的故事和趣味內(nèi)容。
?? Spotify的AI DJ已提供語(yǔ)音評(píng)論，YouTube Music試圖通過(guò)類似功能進(jìn)行競(jìng)爭(zhēng)。
?? YouTube Labs向所有用戶開(kāi)放，但目前僅限部分美國(guó)用戶參與測(cè)試。

7、從粗糙幾何到逼真3D視頻：VideoFrom3D重塑圖形設(shè)計(jì)新紀(jì)元

文章介紹了VideoFrom3D框架，這是一種通過(guò)融合圖像和視頻擴(kuò)散模型來(lái)生成高度逼真且風(fēng)格一致的3D場(chǎng)景視頻的技術(shù)。該框架無(wú)需依賴昂貴的配對(duì)3D數(shù)據(jù)集，極大地簡(jiǎn)化了設(shè)計(jì)流程，提升了生成效率，并在復(fù)雜動(dòng)態(tài)場(chǎng)景下表現(xiàn)出色。

【AiBase提要:】
?? 稀疏錨視圖生成（SAG）模塊利用圖像擴(kuò)散模型，基于參考圖像和粗糙幾何，生成高質(zhì)量的跨視圖一致錨視圖。
?? 幾何引導(dǎo)生成插幀（GGI）模塊借助視頻擴(kuò)散模型，在錨視圖基礎(chǔ)上插值中間幀，實(shí)現(xiàn)流暢的運(yùn)動(dòng)和時(shí)間一致性。
?? VideoFrom3D無(wú)需依賴昂貴的配對(duì)3D數(shù)據(jù)集，極大簡(jiǎn)化了設(shè)計(jì)流程，讓設(shè)計(jì)師和開(kāi)發(fā)者能夠更高效地探索創(chuàng)意并快速產(chǎn)出高質(zhì)量成果。
詳情鏈接:https://kimgeonung.github.io/VideoFrom3D/

8、Moondream3.0發(fā)布，多項(xiàng)基準(zhǔn)測(cè)試超越了 GPT-5 等頂尖模型

Moondream3.0憑借其高效的混合專家架構(gòu)和輕量化設(shè)計(jì)，在視覺(jué)推理能力上表現(xiàn)出色。它在多個(gè)基準(zhǔn)測(cè)試中超越了GPT-5、Gemini和Claude4等頂級(jí)模型，展現(xiàn)了強(qiáng)大的性能。此外，該模型支持開(kāi)放詞匯物體檢測(cè)、結(jié)構(gòu)化輸出以及多場(chǎng)景應(yīng)用，如安防監(jiān)控、醫(yī)學(xué)影像和文檔處理。開(kāi)源特性使其易于部署和使用，適合邊緣計(jì)算環(huán)境。

【AiBase提要:】
?? Moondream3.0采用高效混合專家架構(gòu)，僅激活2億參數(shù)，實(shí)現(xiàn)輕量化設(shè)計(jì)。
?? 支持開(kāi)放詞匯物體檢測(cè)和結(jié)構(gòu)化輸出，適用于多種復(fù)雜場(chǎng)景。
?? 開(kāi)源設(shè)計(jì)，適合邊緣計(jì)算，開(kāi)發(fā)者可輕松解鎖其強(qiáng)大功能。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦AI日?qǐng)?bào)：阿里千問(wèn)砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上傳圖片生應(yīng)用

本期AI日?qǐng)?bào)涵蓋多個(gè)熱點(diǎn)：阿里投入30億啟動(dòng)“千問(wèn)”項(xiàng)目，旨在重塑用戶消費(fèi)習(xí)慣；快手開(kāi)展“AI魔改”視頻專項(xiàng)治理，打擊惡意篡改經(jīng)典作品行為；馬斯克旗下xAI發(fā)布視頻生成工具Grok Imagine 1.0，支持生成10秒720p高清視頻；靈光App升級(jí)，新增圖片生成應(yīng)用并集成近20項(xiàng)API；微軟調(diào)整Win11 AI功能，簡(jiǎn)化或刪除不受歡迎部分以提升體驗(yàn)；東南大學(xué)發(fā)布全球首個(gè)混凝土科學(xué)大模型，推動(dòng)工程材料智能化；階躍星辰發(fā)布開(kāi)源基座模型Step 3.5 Flash，專為智能體場(chǎng)景打造；螞蟻集團(tuán)推出“AI Credit”激勵(lì)方案，鼓勵(lì)全員AI化創(chuàng)新。

?AI ?阿里巴巴 ?通義千問(wèn)
薦AI日?qǐng)?bào)：宇樹(shù)開(kāi)源UnifoLM-VLA-0大模型；騰訊“元寶派”內(nèi)測(cè)截圖泄露；Clawd更名為OpenClaw

本期AI日?qǐng)?bào)聚焦具身智能與AI應(yīng)用新動(dòng)態(tài)。螞蟻集團(tuán)發(fā)布LingBot-VLA模型，實(shí)現(xiàn)雙手機(jī)器人通用操控；宇樹(shù)開(kāi)源UnifoLM-VLA-0模型，為機(jī)器人注入物理常識(shí)。開(kāi)源AI助手OpenClaw更名后受關(guān)注，強(qiáng)調(diào)隱私安全。商湯開(kāi)源SenseNova-MARS模型，在多個(gè)榜單超越GPT-5.2。騰訊“元寶派”社交功能內(nèi)測(cè)截圖泄露，整合微信與QQ好友，支持同步觀影聽(tīng)歌。馬斯克計(jì)劃明年推出高度個(gè)性化AI生成游戲與影音內(nèi)容。Anthropic因涉嫌大規(guī)模盜版遭音樂(lè)出版商起訴，索賠30億美元。字節(jié)與阿里在春節(jié)前后發(fā)布新一代大模型，爭(zhēng)奪云端主導(dǎo)權(quán)。

?人工智能 ?機(jī)器人技術(shù) ?螞蟻集團(tuán)
薦大模型六小龍告別青春期

?不到一個(gè)月的時(shí)間，大模型六小龍中的五家都集中進(jìn)行了新一輪的戰(zhàn)略表態(tài)。月之暗面今天發(fā)布了新模型Kimi2.5，其創(chuàng)始人楊植麟在2025年12月31日發(fā)布了一封全員信，公開(kāi)公司完成新一輪5億美元融資，并表示會(huì)讓Kimi成為一個(gè)「與眾不同」和「不被定義」的大語(yǔ)言模型。1月26日，階躍星辰公布了超50億B+輪融資，并宣布前曠視科技創(chuàng)始人印奇出任公司董事長(zhǎng)，明確押注AI與智能?

?大模型 ?戰(zhàn)略表態(tài) ?融資
薦花3000元讓AI改口，大模型的盡頭是廣告？

大模型界的翹楚OpenAI，面對(duì)每年數(shù)十億美元的研發(fā)成本，正迎來(lái)一個(gè)艱難的決定:其員工正在琢磨如何讓 ChatGPT 在用戶提出相關(guān)問(wèn)題時(shí)，優(yōu)先顯示贊助內(nèi)容。也就是說(shuō)，當(dāng)用戶讓大模型推薦一家眼鏡店、一款工業(yè)傳感器、一家民宿時(shí)，很可能大模型給出的是企業(yè)的軟廣。但大模型本身可能并不知道答案被“精心設(shè)計(jì)”過(guò)，它依然兢兢業(yè)業(yè)，會(huì)根據(jù)各個(gè)指標(biāo)篩選出你想要的產(chǎn)品?

?文章搜索 ?核心標(biāo)簽 ?OpenAI
快手聯(lián)合歐萊雅打造《最美回家路》，讓團(tuán)圓不止一種模樣

快手與巴黎歐萊雅合作，發(fā)起“回家故事”征集和“春運(yùn)送團(tuán)圓”活動(dòng)，以“有家就是團(tuán)圓年”為主題，通過(guò)真實(shí)情感連接用戶。活動(dòng)選中在北京打拼20年的張紅冉，因工作無(wú)法返鄉(xiāng)，品牌邀請(qǐng)楊迪作為“團(tuán)圓護(hù)送官”，幫助她接父母來(lái)京過(guò)年。楊迪的暖心陪伴化解了張紅冉的愧疚與不安，一家人在北京團(tuán)聚，貼福字、備年貨，溫馨過(guò)年。活動(dòng)通過(guò)真實(shí)故事傳遞品牌溫度，強(qiáng)調(diào)“有家人在的地方就是家”，引發(fā)情感共鳴，讓春節(jié)團(tuán)圓更有儀式感。

?春運(yùn) ?回家 ?團(tuán)圓
薦AI日?qǐng)?bào)：天貓上線AI假圖識(shí)別模型；百川發(fā)布醫(yī)學(xué)模型Baichuan-M3 Plus；Remotion Skills開(kāi)啟一句話做大片時(shí)代

本期AI日?qǐng)?bào)聚焦多領(lǐng)域AI新進(jìn)展：淘寶天貓上線AI假圖識(shí)別模型，打擊惡意售后；Inworld推出低延遲多語(yǔ)言TTS-1.5，革新游戲?qū)υ掦w驗(yàn)；百川智能發(fā)布醫(yī)療大模型Baichuan-M3+Plus，醫(yī)學(xué)幻覺(jué)率降至2.6%；Remotion Skills實(shí)現(xiàn)自然語(yǔ)言生成專業(yè)視頻動(dòng)畫(huà)；蘋(píng)果內(nèi)部AI工具Enchanté和Enterprise Assistant曝光，提升辦公效率；YouTube計(jì)劃推出“AI個(gè)人形象”功能，變革短視頻創(chuàng)作；微軟為Windows 11記事本與畫(huà)圖注入AI新能力；蘋(píng)果擬將Siri重塑為類ChatGPT聊天機(jī)器人，代號(hào)“Campos”。

?AI ?電商 ?假圖識(shí)別
薦AI日?qǐng)?bào)：混元圖像3.0圖生圖模型發(fā)布；開(kāi)源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂(lè)奇AI眼鏡

本期AI日?qǐng)?bào)聚焦多領(lǐng)域AI新動(dòng)態(tài)：騰訊發(fā)布混元圖像3.0，實(shí)現(xiàn)語(yǔ)義驅(qū)動(dòng)的精準(zhǔn)修圖；開(kāi)源AI助手Clawdbot單日獲9000星，具備物理級(jí)執(zhí)行力；京東購(gòu)物智能體JoyGlance登陸Rokid眼鏡，簡(jiǎn)化購(gòu)物流程；蘋(píng)果Siri將整合谷歌Gemini核心，預(yù)計(jì)2月發(fā)布；騰訊“元寶派”開(kāi)啟內(nèi)測(cè)，探索AI深度融入社交場(chǎng)景；百度文心助手推出5億現(xiàn)金紅包活動(dòng)，結(jié)合春節(jié)習(xí)俗；中國(guó)團(tuán)隊(duì)SeaArt用戶破5000萬(wàn)，實(shí)現(xiàn)創(chuàng)意到變現(xiàn)閉環(huán)；上海交大發(fā)布光學(xué)垂直大模型Optics GPT，重塑光學(xué)研發(fā)模式。

?AI ?圖像編輯 ?語(yǔ)義理解
薦實(shí)時(shí)生成開(kāi)放世界：新AI模型貼臉開(kāi)大，游戲研發(fā)慌不慌？

這兩天，又有一款全新的AI模型出現(xiàn)了。雖說(shuō)如今AI改變各行各業(yè)的事情早就屢見(jiàn)不鮮，在游戲業(yè)，很多崗位也或多或少已經(jīng)用上了AI技術(shù)，但最近發(fā)布的這款A(yù)I模型，它真不一樣。這款A(yù)I模型名叫PixVerse R1，按官方說(shuō)法，PixVerse R1是全球首個(gè)真正意義上的「實(shí)時(shí)生成世界模型（Real-time World Model）」。

?AI模型 ?游戲行業(yè) ?實(shí)時(shí)生成
瀏覽器端語(yǔ)音交互指南：如何用低代碼快速集成AI語(yǔ)音智能體？

本文探討了AI時(shí)代語(yǔ)音交互技術(shù)的發(fā)展與應(yīng)用。文章指出，AI正深刻改變生產(chǎn)生活方式，語(yǔ)音輸入需求快速增長(zhǎng)，尤其在需要雙手作業(yè)的場(chǎng)景中，語(yǔ)音交互能提供無(wú)縫高效的工作流程。文章以活字格低代碼開(kāi)發(fā)平臺(tái)為例，詳細(xì)介紹了如何在瀏覽器端實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音交互，包括通過(guò)麥克風(fēng)權(quán)限獲取、語(yǔ)音識(shí)別模型實(shí)時(shí)轉(zhuǎn)寫(xiě)文本、并與AI大模型進(jìn)行智能對(duì)話的完整方案。該方案不僅提升了交互效率和準(zhǔn)確性，還保障了用戶隱私安全。最后，文章展望了語(yǔ)音交互在智能家居、醫(yī)療健康、教育等領(lǐng)域的廣泛應(yīng)用前景，同時(shí)也指出了隱私保護(hù)、準(zhǔn)確性提升和無(wú)障礙訪問(wèn)等面臨的挑戰(zhàn)。

?人工智能 ?Web應(yīng)用 ?語(yǔ)音輸入
20+大模型與70+智能體調(diào)度！李未可AI眼鏡定義群體智能新范式

文章以丹尼爾·卡尼曼的“快與慢”思維系統(tǒng)理論為引，介紹了李未可AI智能眼鏡如何將AI融入人類最自然的“看、聽(tīng)、說(shuō)”交互中。該產(chǎn)品通過(guò)“超能李未可”系統(tǒng)，結(jié)合自研大模型與多智能體協(xié)同的“群體智能”模式，實(shí)現(xiàn)了從快速直覺(jué)響應(yīng)到深度理性思考的無(wú)縫銜接。它能高效處理實(shí)時(shí)翻譯、信息查詢等日常任務(wù)，并在需要時(shí)啟動(dòng)多專家智能體進(jìn)行復(fù)雜規(guī)劃與創(chuàng)意生成，致力于成為用戶隨身、隨思、隨需的“第二大腦”，讓技術(shù)回歸增強(qiáng)人類感知與創(chuàng)造能力的本質(zhì)。

?行為經(jīng)濟(jì)學(xué) ?思考的快與慢 ?人工智能交互設(shè)計(jì)

AI日?qǐng)?bào)：騰訊重磅發(fā)布混元圖像3.0；快手發(fā)布KAT系列Agentic Coding大模型；蘋(píng)果悄然研發(fā)ChatGPT式應(yīng)用

薦AI日?qǐng)?bào)：阿里千問(wèn)砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上傳圖片生應(yīng)用

薦AI日?qǐng)?bào)：宇樹(shù)開(kāi)源UnifoLM-VLA-0大模型；騰訊“元寶派”內(nèi)測(cè)截圖泄露；Clawd更名為OpenClaw

薦大模型六小龍告別青春期

薦花3000元讓AI改口，大模型的盡頭是廣告？

快手聯(lián)合歐萊雅打造《最美回家路》，讓團(tuán)圓不止一種模樣

薦AI日?qǐng)?bào)：天貓上線AI假圖識(shí)別模型；百川發(fā)布醫(yī)學(xué)模型Baichuan-M3 Plus；Remotion Skills開(kāi)啟一句話做大片時(shí)代

薦AI日?qǐng)?bào)：混元圖像3.0圖生圖模型發(fā)布；開(kāi)源AI助手Clawdbot一夜爆火；京東JoyGlance正式登陸樂(lè)奇AI眼鏡

薦實(shí)時(shí)生成開(kāi)放世界：新AI模型貼臉開(kāi)大，游戲研發(fā)慌不慌？

瀏覽器端語(yǔ)音交互指南：如何用低代碼快速集成AI語(yǔ)音智能體？

20+大模型與70+智能體調(diào)度！李未可AI眼鏡定義群體智能新范式

今日大家都在搜的詞：

熱文

2026支付寶集福正式開(kāi)啟今年支持掃馬得福玩法

AI日?qǐng)?bào)：OpenAI推出macOS版Codex應(yīng)用；智譜發(fā)布0.9B輕量級(jí)GLM-

余承東公布問(wèn)界M6實(shí)車(chē)外觀預(yù)計(jì)將于今年春季發(fā)布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

AI日?qǐng)?bào)：支付寶首次上線AI眼鏡掃福；昆侖萬(wàn)維發(fā)布天工Skywork桌

iQOO 15 Ultra今日發(fā)布主打極致性能

REDMI Turbo 5 Max上線開(kāi)售16GB+1TB版本首銷價(jià)3399元

2026支付寶集福正式開(kāi)啟今年支持掃馬得福玩法

2026支付寶集福卡明天開(kāi)啟：19套主題每套1.68元紅包

AI日?qǐng)?bào)：阿里千問(wèn)砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場(chǎng)》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預(yù)計(jì)2月13日左右到店

AI日?qǐng)?bào)：OpenAI推出macOS版Codex應(yīng)用；智譜發(fā)布0.9B輕量級(jí)GLM-

新款聯(lián)想拯救者Y700平板官宣3月發(fā)布

騰訊回應(yīng)元寶崩了：目前已經(jīng)恢復(fù) 10億紅包活動(dòng)太火爆

余承東公布問(wèn)界M6實(shí)車(chē)外觀預(yù)計(jì)將于今年春季發(fā)布

華為FreeClip 2耳夾耳機(jī)推出冰莓紫、玫瑰金兩款新配色

站長(zhǎng)商機(jī)