AI日報：海螺AI首尾幀功能上線；元石科技發(fā)布問小白5；OpenAI發(fā)布全新語音模型GPT-Realtime

2025-08-29 15:35 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點擊了解：https://app.aibase.com/zh

1、MiniMax海螺AI首尾幀功能在網(wǎng)頁版和APP雙端正式上線

海螺AI推出的首尾幀功能在網(wǎng)頁版和APP雙端正式上線，并開放僅尾幀玩法。該技術(shù)通過更強的指令理解、更絲滑的動態(tài)效果和更大膽的想象力，全面提升行業(yè)首尾幀能力的上限。

【AiBase提要:】
?? 最強復(fù)雜指令遵循能力，精確理解和執(zhí)行每一個細(xì)節(jié)
?? 極限復(fù)雜物理動態(tài)生成，如打斗、體操等高能動作的絲滑連招
?? 超預(yù)期想象力功能，實現(xiàn)首尾幀跨度大或缺乏指令時的超綱發(fā)揮

2、元石科技發(fā)布問小白5，挑戰(zhàn) GPT-5，國產(chǎn)AI新標(biāo)桿來襲

元石科技最新推出的旗艦產(chǎn)品問小白5在多項性能測試中接近GPT-5，標(biāo)志著國產(chǎn)大模型技術(shù)的重要突破。該系統(tǒng)具備動態(tài)思維模式，適用于多個領(lǐng)域，并在STEM能力、前沿知識和代碼編程等方面表現(xiàn)出色。

【AiBase提要:】
? 問小白5在多項性能測試中接近GPT-5，成為國產(chǎn)AI的新標(biāo)桿。
?? 具備動態(tài)思維模式，智能判斷何時快速響應(yīng)或深入思考。
?? 在STEM能力、前沿知識和代碼編程方面表現(xiàn)優(yōu)異，綜合評分超越同類產(chǎn)品。

3、OpenAI 發(fā)布全新語音模型 GPT-Realtime，專為語音AI Agent設(shè)計

OpenAI 發(fā)布了全新的語音模型 GPT-Realtime，該模型專為語音 AI Agent 設(shè)計，能夠生成自然流暢的語音，并支持圖像輸入和多語言切換。其在推理能力和指令遵循準(zhǔn)確率方面有顯著提升，同時提供了強大的安全防護功能，適用于多個行業(yè)領(lǐng)域。

【AiBase提要:】
??? GPT-Realtime 是 OpenAI 發(fā)布的多模態(tài)語音模型，專為語音 AI Agent 設(shè)計。
?? 該模型具備推理和指令遵循能力，提升了語音交互的智能化水平。
?? Realtime API 配備了安全防護措施，保障用戶隱私與數(shù)據(jù)安全。

4、告別繁瑣！谷歌Gemini AI讓表格處理變得輕松無比

谷歌引入Gemini AI助手，使Google Sheets的數(shù)據(jù)處理更加智能和高效，提升了用戶的使用體驗。

【AiBase提要:】
?? 谷歌Gemini AI助手為Google Sheets帶來智能化的數(shù)據(jù)處理功能。
?? 新增的“轉(zhuǎn)換為表格”功能能自動分析并整理數(shù)據(jù)，提升工作效率。
?? 用戶可自定義公式表達(dá)式，適應(yīng)數(shù)據(jù)變化，無需手動調(diào)整公式。

5、AI配音革命來了！騰訊黑科技讓機器秒變金牌說書人，一句話生成好萊塢級音效

文章介紹了騰訊ARC實驗室推出的AudioStory技術(shù)，該技術(shù)能夠根據(jù)文字描述生成高質(zhì)量的音頻內(nèi)容，具有強大的敘事能力。它通過分而治之策略和解耦式連接機制，實現(xiàn)了復(fù)雜的音頻生成任務(wù)。

【AiBase提要:】
? AudioStory技術(shù)能根據(jù)文字描述生成電影級音頻內(nèi)容。
?? 采用分而治之策略，將復(fù)雜故事拆解為有序音頻事件。
?? 解耦式連接機制確保了音頻質(zhì)感與語義的精準(zhǔn)匹配。
詳情鏈接:https://arxiv.org/pdf/2508.20088

6、百度未來五年計劃培養(yǎng) 1000 萬 AI 人才

文章介紹了百度在未來五年內(nèi)計劃培養(yǎng)1000萬AI人才，同時展示了其在人工智能領(lǐng)域的持續(xù)投入和創(chuàng)新成果。此外，文章還提到百度的AI新業(yè)務(wù)收入表現(xiàn)亮眼，顯示出其在市場中的競爭力。

【AiBase提要:】
?? 百度計劃在未來五年內(nèi)再培養(yǎng)1000萬AI人才，推動行業(yè)發(fā)展。
?? 百度2025年第二季度財報顯示AI新業(yè)務(wù)收入突破100億元，同比增長34%。
?? 人才培養(yǎng)將通過高校合作、企業(yè)培訓(xùn)和在線教育等多種方式進行。

7、反作弊AI導(dǎo)師橫空出世！MathGPT.ai在美國30所高校試點成功，今秋將大規(guī)模推廣

MathGPT.ai通過蘇格拉底式教學(xué)法和教師主導(dǎo)的控制機制，重新定義了AI在數(shù)學(xué)教育中的角色。該平臺不僅提供反作弊導(dǎo)師服務(wù)，還支持大學(xué)水平的數(shù)學(xué)課程，并與主流學(xué)習(xí)管理系統(tǒng)集成，確保無障礙訪問。

【AiBase提要:】
?? MathGPT.ai采用蘇格拉底式提問技術(shù)，鼓勵學(xué)生批判性思考而非直接獲取答案。
?? 教師可控制學(xué)生使用AI工具的方式，包括指定AI是否提供輔導(dǎo)支持。
?? 平臺已與Canvas、Blackboard和Brightspace集成，并兼容屏幕閱讀器，提升無障礙訪問體驗。

8、蘋果Xcode重磅集成Claude Sonnet4:iOS開發(fā)迎來AI革命時代

蘋果在Xcode26Beta7中正式集成Claude Sonnet4AI模型，為iOS開發(fā)者帶來智能編程體驗。該模型能夠生成高質(zhì)量代碼、定位錯誤并自動修復(fù)，同時新增的inline playgrounds功能讓開發(fā)者可以直接在代碼行運行和測試代碼，提升開發(fā)效率。

【AiBase提要:】
?? 集成Claude Sonnet4AI模型，提升代碼生成與錯誤修復(fù)能力。
?? 新增inline playgrounds功能，支持實時運行代碼示例。
?? 基于Apple官方擴展接口實現(xiàn)，確保功能穩(wěn)定性和安全性。

9、微軟推首款自家研發(fā)AI模型MAI-Voice-1和MAI-1-preview，與OpenAI競爭

微軟推出了其首款自主研發(fā)的AI模型MAI-Voice-1和MAI-1-preview，這標(biāo)志著微軟在人工智能領(lǐng)域的重要進展，并增強了其與OpenAI的競爭實力。MAI-Voice-1能夠快速生成音頻，已被應(yīng)用于Copilot Daily等功能；而MAI-1-preview則專注于日常查詢幫助，未來將用于Copilot AI助手的文本處理。

【AiBase提要:】
??? MAI-Voice-1可以快速生成音頻，已應(yīng)用于 Copilot Daily 等多個功能。
?? MAI-1-preview 將用于 Copilot AI 助手的文本處理，標(biāo)志著微軟在消費級 AI 領(lǐng)域的新進展。
?? 微軟推出 MAI-Voice-1和 MAI-1-preview 兩款自家開發(fā)的 AI 模型，提升與 OpenAI 的競爭力。
詳情鏈接:https://microsoft.ai/news/two-new-in-house-models/

10、xAI隆重推出Grok Code Fast1:快速、經(jīng)濟的高效代理編碼模型

xAI推出了Grok Code Fast1，這是一款專為軟件開發(fā)設(shè)計的快速且經(jīng)濟高效的大型語言模型。該模型在推理能力和代碼生成性能方面表現(xiàn)出色，并已在多個主流智能編程平臺上免費開放使用。

【AiBase提要:】
?? Grok Code Fast1采用了全新輕量化模型架構(gòu)，提升了服務(wù)速度和緩存命中率。
?? 支持GitHub Copilot、Cursor等多平臺，提供免費試用以吸引開發(fā)者體驗。
?? 定價策略具有競爭力，每百萬輸入令牌0.20美元，輸出令牌1.50美元，適合預(yù)算有限的開發(fā)者。
詳情鏈接:https://x.ai/news/grok-code-fast-1

11、SuperCLUE多模態(tài)視覺8月評測榜：Gemini-2.5-Pro位居第一

在8月28日發(fā)布的中文多模態(tài)視覺語言模型測評基準(zhǔn)（SuperCLUE-VLM）榜單中，Gemini-2.5-Pro以74.99分位列第一，OpenAI的GPT-5(high)以68.59分排名第二。該榜單圍繞基礎(chǔ)認(rèn)知、視覺推理和視覺應(yīng)用三大維度構(gòu)建評測體系，旨在為多模態(tài)視覺語言模型提供客觀、公正的評估標(biāo)準(zhǔn)。

【AiBase提要:】
?? Gemini-2.5-Pro在SuperCLUE-VLM榜單中以74.99分位居第一，展現(xiàn)強大的多模態(tài)能力。
?? 評測涵蓋15個多模態(tài)模型，包括Claude-Opus-4.1、GPT-5(high)等國內(nèi)外主流模型。
?? 百度ERNIE-4.5-Turbo-VL與其他國內(nèi)模型并列，顯示出強勁的市場競爭力。

12、9月1日AI內(nèi)容標(biāo)識新規(guī)！不合規(guī)直接承擔(dān)法律風(fēng)險，從業(yè)者速看避雷指南

文章詳細(xì)介紹了《人工智能生成合成內(nèi)容標(biāo)識方法》國家標(biāo)準(zhǔn)GB45438-2025的實施背景和核心要求。該標(biāo)準(zhǔn)對AI生成內(nèi)容的標(biāo)識方式、責(zé)任主體認(rèn)定及違規(guī)后果進行了明確規(guī)定，強調(diào)了AI內(nèi)容治理的重要性。

【AiBase提要:】
?? 顯式標(biāo)識要求AI生成內(nèi)容在文本、圖片、視頻等不同形式中明確標(biāo)注AI屬性。
?? 隱式標(biāo)識通過文件元數(shù)據(jù)嵌入AIGC標(biāo)識符，確保內(nèi)容來源可追溯。
?? 違規(guī)后果嚴(yán)重，包括限流、整改、下架以及法律風(fēng)險，企業(yè)需立即進行合規(guī)準(zhǔn)備。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

2025新質(zhì)生產(chǎn)力示范案例發(fā)布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

AI正從參數(shù)比拼轉(zhuǎn)向賦能實體經(jīng)濟的“下半場”，行業(yè)重心轉(zhuǎn)向千行百業(yè)的規(guī)?；瘧?yīng)用落地。華為云憑借基于CloudMatrix+AI Infra的智算云服務(wù)，成功入選“人工智能基礎(chǔ)與產(chǎn)業(yè)融合”示范案例TOP5，彰顯了中國式AI與產(chǎn)業(yè)融合發(fā)展新路徑。華為云堅持深入產(chǎn)業(yè)，解決行業(yè)難題，通過“車-網(wǎng)-云”協(xié)同的AI無人駕駛?cè)珬７桨?，賦能礦山、水泥等行業(yè)實現(xiàn)降本增效。未來，華為云將繼續(xù)堅持“做難而正確的事”，推動AI真正深入行業(yè)場景，共同邁向新質(zhì)生產(chǎn)力發(fā)展的下一程。

?新質(zhì)生產(chǎn)力 ?AI產(chǎn)業(yè)融合 ?華為云
AI營銷觀察：深挖AIRO和GEO的技術(shù)邏輯和應(yīng)用區(qū)別

隨著AI月活用戶近4億，AI數(shù)字化營銷浪潮持續(xù)推進，AIRO（AI結(jié)果優(yōu)化）與GEO（生成引擎優(yōu)化）兩大技術(shù)迅速崛起，成為AI營銷領(lǐng)域的核心競爭點。然而，行業(yè)長期存在概念混淆、邊界模糊的問題，不少企業(yè)與從業(yè)者難以精準(zhǔn)區(qū)分二者的技術(shù)邏輯與應(yīng)用場景，甚至出現(xiàn)“同質(zhì)化競爭”與“誤用技術(shù)導(dǎo)致合規(guī)風(fēng)險”的情況。本文從核心定位、技術(shù)路徑、合規(guī)邊界、優(yōu)化效果等六大維度，全面拆解AIRO與GEO的技術(shù)差異，幫助行業(yè)從業(yè)者真正搞懂“兩者到底不一樣在哪里”，為技術(shù)選型與合規(guī)應(yīng)用提供客觀參考。

?AIRO ?GEO ?數(shù)字化營銷
三星電視以全鏈路技術(shù)生態(tài) 推動高端化趨勢下的畫質(zhì)革新與體驗普及

在科技迭代與消費升級的雙重驅(qū)動下，全球電視市場正邁向高端化、大屏化和智能體驗為核心的新階段。三星憑借在顯示領(lǐng)域的深耕，通過Micro RGB、OLED及Mini LED三大技術(shù)路線，重新定義電視在家居場景中的角色。Micro RGB以卓越畫質(zhì)突破虛實邊界，OLED融合頂級畫質(zhì)與消費級體驗，Mini LED則借助量子點技術(shù)實現(xiàn)高端視覺普及。三星以顯示技術(shù)為核心，構(gòu)建層次清晰、互為支撐的完整產(chǎn)品矩陣，悄然定義未來十年家庭娛樂形態(tài)。

?高端電視 ?大屏化 ?智能體驗
宸境科技重磅發(fā)布具身智能新品牌及全棧技術(shù)矩陣，突破空間智能技術(shù)邊界

1月28日，許境科技在杭州發(fā)布具身智能新品牌“LooperRobotics”及全棧技術(shù)產(chǎn)品矩陣。該矩陣包括Insight全自主空間智能相機、TinyNav高性能導(dǎo)航算法庫和RoboSpatial空間編輯工具鏈，旨在通過軟硬件一體化創(chuàng)新，打造驅(qū)動通用機器人的標(biāo)準(zhǔn)化感知底座。此次發(fā)布標(biāo)志著公司在關(guān)鍵感知硬件、底層算法及應(yīng)用工具鏈領(lǐng)域取得重要突破，為機器人成為繼汽車、手機之后的物理任務(wù)基礎(chǔ)設(shè)施提供堅實支撐。

?具身智能 ?空間智能 ?機器人技術(shù)
移動技術(shù)持續(xù)創(chuàng)新三星與運動員及粉絲共赴2026年冬奧時刻

三星作為奧運會及殘奧會全球合作伙伴，將在2026年米蘭-科爾蒂納冬奧會及冬殘奧會期間，通過創(chuàng)新移動技術(shù)與Galaxy AI，為賽事提供全方位支持。具體措施包括：利用Galaxy S25 Ultra等設(shè)備捕捉動態(tài)視角，豐富開幕式直播內(nèi)容；為志愿者配備搭載AI“同傳”功能的設(shè)備，實現(xiàn)跨語言高效溝通；在短道速滑等賽場部署三星顯示器，滿足賽事運營需求；設(shè)立Galaxy充電站，確保觀眾設(shè)備續(xù)航；開設(shè)三星體驗館，打造互動交流空間。這些舉措旨在拉近運動員、觀眾與賽事的距離，呈現(xiàn)更緊密的互聯(lián)互通，重塑奧運體驗。

?冬奧會 ?三星電子 ?Galaxy
宜信唐寧烏鎮(zhèn)倡議：設(shè)首席AI官讓人工智能更有溫度

在2025年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上，宜信公司CEO唐寧前瞻性地呼吁企業(yè)設(shè)立“首席AI官”，以此推動人工智能從冰冷的效率工具，演進為富有人文溫度的協(xié)同伙伴。這一主張不僅呼應(yīng)了峰會“共筑開放合作、安全普惠的數(shù)智未來”的主題，更為AI的發(fā)展路徑注入了“暖心”與“共情”的關(guān)鍵維度，描繪出一幅人機深度協(xié)作、效率與溫度并重的新圖景。在烏鎮(zhèn)峰會“前沿人工智能

?首席AI官 ?人工智能 ?人機協(xié)作
阿布扎比技術(shù)創(chuàng)新研究所與世界經(jīng)濟論壇啟動阿布扎比前沿技術(shù)中心

阿布扎比技術(shù)創(chuàng)新研究所（TII）與世界經(jīng)濟論壇（WEF）合作，成立阿布扎比前沿技術(shù)中心，成為WEF第四次工業(yè)革命中心（C4IR）全球網(wǎng)絡(luò)的新成員。該中心旨在引領(lǐng)前沿技術(shù)研發(fā)突破，推動量子計算、機器人、AI等新興技術(shù)的全球研究與合作，促進創(chuàng)新從實驗室走向?qū)嶋H部署。通過整合研究能力、政策領(lǐng)導(dǎo)力和全球合作，中心將強化阿聯(lián)酋作為全球科技創(chuàng)新中心的地位，并推動負(fù)責(zé)任的技術(shù)治理與可持續(xù)發(fā)展。

?阿布扎比技術(shù)創(chuàng)新研究所 ?世界經(jīng)濟論壇 ?第四次工業(yè)革命
深耕AI+教育！簡知科技入選2025廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選薈

2025年12月24日，廣州舉辦人工智能算力應(yīng)用及產(chǎn)業(yè)發(fā)展聯(lián)盟年度峰會。簡知科技憑借其在“人工智能+教育”領(lǐng)域的實踐成果，成功入選2025年廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選。這體現(xiàn)了政府和行業(yè)對其推動AI與教育場景融合、建設(shè)智能教育服務(wù)生態(tài)貢獻的肯定。其核心自研的“簡智AI大模型”已通過國家生成式人工智能服務(wù)備案，為教學(xué)流程管理、知識體系構(gòu)建與個性化學(xué)習(xí)等關(guān)鍵環(huán)節(jié)提供技術(shù)支撐。公司將持續(xù)深化AI與教育全場景的融合應(yīng)用，助力建設(shè)更加智能化、個性化的終身學(xué)習(xí)體系。

?人工智能 ?算力應(yīng)用 ?產(chǎn)業(yè)發(fā)展
“光+AI”融合創(chuàng)新中科搖櫓船攻克智能駕駛感知核心技術(shù)

中科搖櫓船通過“光+AI”平臺，攻克智能駕駛感知關(guān)鍵技術(shù)，自主研發(fā)“空間智能相機”。該相機融合激光雷達(dá)、視覺相機和毫米波雷達(dá)優(yōu)勢于單一傳感器，實現(xiàn)全場景、全識別、全測量與深度重建能力，能精準(zhǔn)識別200米內(nèi)小目標(biāo)。其底層技術(shù)平臺擴展性強，可廣泛應(yīng)用于具身智能、高速監(jiān)測、區(qū)域安防及災(zāi)害預(yù)警等領(lǐng)域。

?智能駕駛 ?空間智能相機 ?光+AI
名片全能王母公司合合信息發(fā)布多領(lǐng)域創(chuàng)新產(chǎn)品，探索AI商業(yè)化新路徑

隨著人工智能產(chǎn)業(yè)邁入“落地為王”的深水區(qū)，技術(shù)與垂直場景的深度融合成為行業(yè)破局關(guān)鍵。近日，上海合合信息科技股份有限公司集中發(fā)布系列基于多模態(tài)大模型的創(chuàng)新產(chǎn)品，覆蓋AI教育、健康管理、AI基礎(chǔ)設(shè)施及AI智能體應(yīng)用等領(lǐng)域，以文本智能技術(shù)為核心，構(gòu)建全場景AI解決方案，為行業(yè)商業(yè)化落地提供新范式。在C端場景布局中，合合信息實現(xiàn)文檔服務(wù)、教育、健康領(lǐng)?

?人工智能 ?多模態(tài)大模型 ?AI教育

AI日報：海螺AI首尾幀功能上線；元石科技發(fā)布問小白5；OpenAI發(fā)布全新語音模型GPT-Realtime

2025新質(zhì)生產(chǎn)力示范案例發(fā)布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

AI營銷觀察：深挖AIRO和GEO的技術(shù)邏輯和應(yīng)用區(qū)別

三星電視以全鏈路技術(shù)生態(tài) 推動高端化趨勢下的畫質(zhì)革新與體驗普及

宸境科技重磅發(fā)布具身智能新品牌及全棧技術(shù)矩陣，突破空間智能技術(shù)邊界

移動技術(shù)持續(xù)創(chuàng)新三星與運動員及粉絲共赴2026年冬奧時刻

宜信唐寧烏鎮(zhèn)倡議：設(shè)首席AI官讓人工智能更有溫度

阿布扎比技術(shù)創(chuàng)新研究所與世界經(jīng)濟論壇啟動阿布扎比前沿技術(shù)中心

深耕AI+教育！簡知科技入選2025廣州市“人工智能+教育”典型案例及“人工智能+”百家案例精選薈

“光+AI”融合創(chuàng)新中科搖櫓船攻克智能駕駛感知核心技術(shù)

名片全能王母公司合合信息發(fā)布多領(lǐng)域創(chuàng)新產(chǎn)品，探索AI商業(yè)化新路徑

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應(yīng)用；智譜發(fā)布0.9B輕量級GLM-

余承東公布問界M6實車外觀預(yù)計將于今年春季發(fā)布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發(fā)布天工Skywork桌

iQOO 15 Ultra今日發(fā)布主打極致性能

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預(yù)計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應(yīng)用；智譜發(fā)布0.9B輕量級GLM-

新款聯(lián)想拯救者Y700平板官宣3月發(fā)布

騰訊回應(yīng)元寶崩了：目前已經(jīng)恢復(fù) 10億紅包活動太火爆

余承東公布問界M6實車外觀預(yù)計將于今年春季發(fā)布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

站長商機

AI日報：海螺AI首尾幀功能上線；元石科技發(fā)布問小白5；OpenAI發(fā)布全新語音模型GPT-Realtime

今日大家都在搜的詞：

熱文

站長商機

AI日報：海螺AI首尾幀功能上線；元石科技發(fā)布問小白5；OpenAI發(fā)布全新語音模型GPT-Realtime