歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://app.aibase.com/zh
1、MiniMax海螺AI首尾幀功能在網(wǎng)頁版和APP雙端正式上線
海螺AI推出的首尾幀功能在網(wǎng)頁版和APP雙端正式上線,并開放僅尾幀玩法。該技術(shù)通過更強的指令理解、更絲滑的動態(tài)效果和更大膽的想象力,全面提升行業(yè)首尾幀能力的上限。

【AiBase提要:】
?? 最強復(fù)雜指令遵循能力,精確理解和執(zhí)行每一個細(xì)節(jié)
?? 極限復(fù)雜物理動態(tài)生成,如打斗、體操等高能動作的絲滑連招
?? 超預(yù)期想象力功能,實現(xiàn)首尾幀跨度大或缺乏指令時的超綱發(fā)揮
2、元石科技發(fā)布問小白5,挑戰(zhàn) GPT-5,國產(chǎn)AI新標(biāo)桿來襲
元石科技最新推出的旗艦產(chǎn)品問小白5在多項性能測試中接近GPT-5,標(biāo)志著國產(chǎn)大模型技術(shù)的重要突破。該系統(tǒng)具備動態(tài)思維模式,適用于多個領(lǐng)域,并在STEM能力、前沿知識和代碼編程等方面表現(xiàn)出色。

【AiBase提要:】
? 問小白5在多項性能測試中接近GPT-5,成為國產(chǎn)AI的新標(biāo)桿。
?? 具備動態(tài)思維模式,智能判斷何時快速響應(yīng)或深入思考。
?? 在STEM能力、前沿知識和代碼編程方面表現(xiàn)優(yōu)異,綜合評分超越同類產(chǎn)品。
3、OpenAI 發(fā)布全新語音模型 GPT-Realtime,專為語音AI Agent設(shè)計
OpenAI 發(fā)布了全新的語音模型 GPT-Realtime,該模型專為語音 AI Agent 設(shè)計,能夠生成自然流暢的語音,并支持圖像輸入和多語言切換。其在推理能力和指令遵循準(zhǔn)確率方面有顯著提升,同時提供了強大的安全防護功能,適用于多個行業(yè)領(lǐng)域。

【AiBase提要:】
??? GPT-Realtime 是 OpenAI 發(fā)布的多模態(tài)語音模型,專為語音 AI Agent 設(shè)計。
?? 該模型具備推理和指令遵循能力,提升了語音交互的智能化水平。
?? Realtime API 配備了安全防護措施,保障用戶隱私與數(shù)據(jù)安全。
4、告別繁瑣!谷歌Gemini AI讓表格處理變得輕松無比
谷歌引入Gemini AI助手,使Google Sheets的數(shù)據(jù)處理更加智能和高效,提升了用戶的使用體驗。

【AiBase提要:】
?? 谷歌Gemini AI助手為Google Sheets帶來智能化的數(shù)據(jù)處理功能。
?? 新增的“轉(zhuǎn)換為表格”功能能自動分析并整理數(shù)據(jù),提升工作效率。
?? 用戶可自定義公式表達(dá)式,適應(yīng)數(shù)據(jù)變化,無需手動調(diào)整公式。
5、AI配音革命來了!騰訊黑科技讓機器秒變金牌說書人,一句話生成好萊塢級音效
文章介紹了騰訊ARC實驗室推出的AudioStory技術(shù),該技術(shù)能夠根據(jù)文字描述生成高質(zhì)量的音頻內(nèi)容,具有強大的敘事能力。它通過分而治之策略和解耦式連接機制,實現(xiàn)了復(fù)雜的音頻生成任務(wù)。

【AiBase提要:】
? AudioStory技術(shù)能根據(jù)文字描述生成電影級音頻內(nèi)容。
?? 采用分而治之策略,將復(fù)雜故事拆解為有序音頻事件。
?? 解耦式連接機制確保了音頻質(zhì)感與語義的精準(zhǔn)匹配。
詳情鏈接:https://arxiv.org/pdf/2508.20088
6、百度未來五年計劃培養(yǎng) 1000 萬 AI 人才
文章介紹了百度在未來五年內(nèi)計劃培養(yǎng)1000萬AI人才,同時展示了其在人工智能領(lǐng)域的持續(xù)投入和創(chuàng)新成果。此外,文章還提到百度的AI新業(yè)務(wù)收入表現(xiàn)亮眼,顯示出其在市場中的競爭力。
【AiBase提要:】
?? 百度計劃在未來五年內(nèi)再培養(yǎng)1000萬AI人才,推動行業(yè)發(fā)展。
?? 百度2025年第二季度財報顯示AI新業(yè)務(wù)收入突破100億元,同比增長34%。
?? 人才培養(yǎng)將通過高校合作、企業(yè)培訓(xùn)和在線教育等多種方式進行。
7、反作弊AI導(dǎo)師橫空出世!MathGPT.ai在美國30所高校試點成功,今秋將大規(guī)模推廣
MathGPT.ai通過蘇格拉底式教學(xué)法和教師主導(dǎo)的控制機制,重新定義了AI在數(shù)學(xué)教育中的角色。該平臺不僅提供反作弊導(dǎo)師服務(wù),還支持大學(xué)水平的數(shù)學(xué)課程,并與主流學(xué)習(xí)管理系統(tǒng)集成,確保無障礙訪問。

【AiBase提要:】
?? MathGPT.ai采用蘇格拉底式提問技術(shù),鼓勵學(xué)生批判性思考而非直接獲取答案。
?? 教師可控制學(xué)生使用AI工具的方式,包括指定AI是否提供輔導(dǎo)支持。
?? 平臺已與Canvas、Blackboard和Brightspace集成,并兼容屏幕閱讀器,提升無障礙訪問體驗。
8、蘋果Xcode重磅集成Claude Sonnet4:iOS開發(fā)迎來AI革命時代
蘋果在Xcode26Beta7中正式集成Claude Sonnet4AI模型,為iOS開發(fā)者帶來智能編程體驗。該模型能夠生成高質(zhì)量代碼、定位錯誤并自動修復(fù),同時新增的inline playgrounds功能讓開發(fā)者可以直接在代碼行運行和測試代碼,提升開發(fā)效率。

【AiBase提要:】
?? 集成Claude Sonnet4AI模型,提升代碼生成與錯誤修復(fù)能力。
?? 新增inline playgrounds功能,支持實時運行代碼示例。
?? 基于Apple官方擴展接口實現(xiàn),確保功能穩(wěn)定性和安全性。
9、微軟推首款自家研發(fā)AI模型MAI-Voice-1和MAI-1-preview,與OpenAI競爭
微軟推出了其首款自主研發(fā)的AI模型MAI-Voice-1和MAI-1-preview,這標(biāo)志著微軟在人工智能領(lǐng)域的重要進展,并增強了其與OpenAI的競爭實力。MAI-Voice-1能夠快速生成音頻,已被應(yīng)用于Copilot Daily等功能;而MAI-1-preview則專注于日常查詢幫助,未來將用于Copilot AI助手的文本處理。

【AiBase提要:】
??? MAI-Voice-1可以快速生成音頻,已應(yīng)用于 Copilot Daily 等多個功能。
?? MAI-1-preview 將用于 Copilot AI 助手的文本處理,標(biāo)志著微軟在消費級 AI 領(lǐng)域的新進展。
?? 微軟推出 MAI-Voice-1和 MAI-1-preview 兩款自家開發(fā)的 AI 模型,提升與 OpenAI 的競爭力。
詳情鏈接:https://microsoft.ai/news/two-new-in-house-models/
10、xAI隆重推出Grok Code Fast1:快速、經(jīng)濟的高效代理編碼模型
xAI推出了Grok Code Fast1,這是一款專為軟件開發(fā)設(shè)計的快速且經(jīng)濟高效的大型語言模型。該模型在推理能力和代碼生成性能方面表現(xiàn)出色,并已在多個主流智能編程平臺上免費開放使用。
【AiBase提要:】
?? Grok Code Fast1采用了全新輕量化模型架構(gòu),提升了服務(wù)速度和緩存命中率。
?? 支持GitHub Copilot、Cursor等多平臺,提供免費試用以吸引開發(fā)者體驗。
?? 定價策略具有競爭力,每百萬輸入令牌0.20美元,輸出令牌1.50美元,適合預(yù)算有限的開發(fā)者。
詳情鏈接:https://x.ai/news/grok-code-fast-1
11、SuperCLUE多模態(tài)視覺8月評測榜:Gemini-2.5-Pro位居第一
在8月28日發(fā)布的中文多模態(tài)視覺語言模型測評基準(zhǔn)(SuperCLUE-VLM)榜單中,Gemini-2.5-Pro以74.99分位列第一,OpenAI的GPT-5(high)以68.59分排名第二。該榜單圍繞基礎(chǔ)認(rèn)知、視覺推理和視覺應(yīng)用三大維度構(gòu)建評測體系,旨在為多模態(tài)視覺語言模型提供客觀、公正的評估標(biāo)準(zhǔn)。

【AiBase提要:】
?? Gemini-2.5-Pro在SuperCLUE-VLM榜單中以74.99分位居第一,展現(xiàn)強大的多模態(tài)能力。
?? 評測涵蓋15個多模態(tài)模型,包括Claude-Opus-4.1、GPT-5(high)等國內(nèi)外主流模型。
?? 百度ERNIE-4.5-Turbo-VL與其他國內(nèi)模型并列,顯示出強勁的市場競爭力。
12、9月1日AI內(nèi)容標(biāo)識新規(guī)!不合規(guī)直接承擔(dān)法律風(fēng)險,從業(yè)者速看避雷指南
文章詳細(xì)介紹了《人工智能生成合成內(nèi)容標(biāo)識方法》國家標(biāo)準(zhǔn)GB45438-2025的實施背景和核心要求。該標(biāo)準(zhǔn)對AI生成內(nèi)容的標(biāo)識方式、責(zé)任主體認(rèn)定及違規(guī)后果進行了明確規(guī)定,強調(diào)了AI內(nèi)容治理的重要性。
【AiBase提要:】
?? 顯式標(biāo)識要求AI生成內(nèi)容在文本、圖片、視頻等不同形式中明確標(biāo)注AI屬性。
?? 隱式標(biāo)識通過文件元數(shù)據(jù)嵌入AIGC標(biāo)識符,確保內(nèi)容來源可追溯。
?? 違規(guī)后果嚴(yán)重,包括限流、整改、下架以及法律風(fēng)險,企業(yè)需立即進行合規(guī)準(zhǔn)備。
(舉報)
