歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、了解創新AI產品應用。
新鮮AI產品點擊了解:https://top.aibase.com/
騰訊混元宣布推出五個全新開源3D生成模型,基于Hunyuan3D-2.0,具備更快的生成速度和更豐富的細節。Turbo系列模型利用FlashVDM框架實現生成加速,縮短至30秒內完成。升級后的3D AI創作引擎支持多視圖輸入,用戶可通過上傳少量圖片快速生成高質量3D模型,降低制作成本。新模型廣泛應用于UGC、商品素材合成和游戲資產生成,滿足游戲3D資產標準。

【AiBase提要:】
? Turbo系列模型通過FlashVDM框架實現數十倍加速,生成時間縮短至30秒。
??? Hunyuan3D-2-MV模型能更好地捕捉細節,生成符合用戶預期的3D資產。
??? 升級后的引擎支持多視圖輸入,用戶只需上傳2-4張圖片即可快速生成高質量3D模型。
2、Anthropic發布MCP傳輸機制重大升級:告別長連接,迎接更靈活的Streamable HTTP
Anthropic對Model Context Protocol(MCP)進行了重大更新,推出了Streamable HTTP傳輸方式,取代了傳統的HTTP+SSE方案。這一創新解決了MCP遠程傳輸的關鍵限制,提升了靈活性和兼容性。新機制允許客戶端與服務器之間更高效的雙向通信,支持無狀態服務器運行,簡化了部署流程,并提高了系統的可擴展性。
【AiBase提要:】
?? 移除專用的/sse端點,所有消息通過統一的/message端點傳輸,簡化了通信流程。
?? 服務器可動態將HTTP請求升級為SSE流,支持靈活的雙向通信,解決了SSE的單向限制。
?? 新方案兼容性大幅提升,適用于各種網絡基礎設施,支持無狀態模式,降低了資源消耗。
詳情鏈接:https://github.com/modelcontextprotocol/specification/pull/206
3、生數科技Vidu將打造首部海外AI原創科幻動漫劇集
生數科技有限公司與Aura Productions達成戰略合作,計劃推出首部海外AI原創科幻動漫劇集。這一合作標志著AI技術在動漫制作中的應用,開啟了動漫行業新的篇章。雙方將共同制作50集短篇科幻動漫系列,利用Vidu的先進視頻生成技術,提升制作效率和質量,預示著未來動漫創作將更加智能化和高效化。

【AiBase提要:】
?? 合作推出50集短篇科幻動漫系列,計劃在全球主流社交媒體平臺發布。
?? Vidu的多主體一致性功能確保角色與場景的無縫融合,實現高質量動畫敘事。
?? Vidu2.0版本大幅提升視頻生成效率,能在10秒內快速生成高質量視頻。
4、谷歌云重磅推出高清語音模型 Chirp3,支持248種聲音
谷歌云在倫敦的DeepMind總部推出了高清語音模型Chirp3,旨在為開發者提供強大的語音合成工具。該模型支持248種不同的聲音和31種語言,能夠幫助開發者創建智能語音助手、有聲讀物和視頻配音等應用。為了確保負責任的使用,谷歌限制了語音克隆功能的訪問權限,并重申了對數據隱私的承諾。

【AiBase提要:】
?? 谷歌云推出Chirp3語音模型,支持248種聲音和31種語言,助力開發者構建智能應用。
?? 谷歌限制語音克隆功能的訪問權限,以確保倫理AI的實踐和防止濫用。
?? 谷歌發起計劃提升英國AI技能,并向初創企業提供云基礎設施支持,促進創新。
詳情鏈接:https://cloud.google.com/text-to-speech/docs/chirp3-hd
5、馬斯克xAI收購視頻生成初創公司Hotshot,AI視頻領域競爭再升級
埃隆·馬斯克旗下的xAI公司收購了視頻生成AI初創公司Hotshot,標志著其在多模態AI技術領域的進一步擴展。Hotshot以其獨特的技術優勢和強大的算力支持,致力于提升視頻生成能力。
【AiBase提要:】
?? Hotshot專注于AI視頻生成,利用600萬個視頻片段進行訓練,提升了模型理解視頻內容的能力。
?? 收購后,Hotshot將繼續擴大視頻生成器的開發,利用xAI的Colossus超級計算機的強大算力。
?? 此次收購標志著馬斯克在AI技術領域的進一步布局,預示著AI視頻生成技術將迎來新一輪的突破。
6、Roblox開源Cube3D:首個基礎AI模型實現3D對象生成
Roblox近日推出并開源了Cube3D,這是其首個用于生成3D對象的基礎AI模型,旨在提升3D創作效率。該模型通過創新的訓練方法,將3D對象標記化,能夠快速生成完整的3D形狀。未來,Cube3D將發展為一個多模態模型,支持多種輸入類型,包括文本、圖像和視頻,進一步增強與Roblox現有AI創作工具的整合。

【AiBase提要:】
??? Cube3D是Roblox首個開源的3D對象生成AI模型,旨在提高開發者的創作效率。
?? 該模型通過創新的訓練方法,能夠將3D對象標記化并預測下一個形狀,快速構建完整的3D對象。
?? Roblox計劃將Cube3D發展為多模態模型,未來將支持文本、圖像和視頻輸入,增強創作工具的功能。
7、Zoom AI助手AI Companion功能升級
Zoom公司最近宣布了其AI助手Zoom AI Companion的新一輪功能升級,標志著這一工具的演變,旨在提升用戶在視頻會議中的互動體驗和工作效率。新功能包括自動識別和完成待辦事項的Zoom Tasks、轉錄線下對話的新語音錄音器、以及定制AI助手等,預計將顯著增強用戶的生產力和協作能力。

【AiBase提要:】
?? Zoom Tasks功能可以自動識別會議中的待辦事項并完成相關任務。
??? 新語音錄音器能夠轉錄線下對話并提供實時會議筆記。
?? 定制AI助手功能將于4月推出,用戶可根據需求定制功能。
8、128K超長記憶!Mistral最新開源模型Mistral Small3.1登場,參數方面優于 GPT-4o Mini
Mistral AI發布了開源模型Mistral Small3.1,憑借240億參數的設計,其性能可與谷歌和OpenAI的產品相媲美。該模型在文本處理和多模態理解上有顯著提升,支持128k tokens的上下文窗口,處理速度達到每秒150個tokens。

【AiBase提要:】
?? Mistral Small3.1具備240億參數,性能媲美谷歌和OpenAI的同類產品,推動AI市場競爭。
?? 該模型支持128k tokens的上下文窗口,處理速度高達每秒150個tokens,適用于長文檔和快速響應場景。
?? Mistral采取開源策略,發布Apache2.0許可證,強調歐洲數字主權,吸引全球開發者參與創新。
詳情鏈接:https://top.aibase.com/tool/mistral-small-3-1
9、誰說視頻只能“一鏡到底”?字節創新技術LCT,讓AI像導演一樣拍攝電影大片!
長上下文調整(LCT)技術的出現,極大提升了AI生成視頻的敘事能力,使其能夠像電影導演一樣自由切換鏡頭,構建更連貫的故事場景。通過引入全注意力機制、交錯的3D位置嵌入和異步噪聲策略,LCT解決了多鏡頭生成中的視覺一致性和時間動態問題。
【AiBase提要:】
?? LCT技術使AI視頻生成模型能夠執導多鏡頭敘事視頻,提升敘事能力。
?? 通過全注意力機制和交錯的3D位置嵌入,LCT確保視覺一致性和時間動態。
?? LCT支持自回歸鏡頭擴展,便于長視頻創作和交互式修改。
詳情鏈接:https://top.aibase.com/tool/zhangshangxiawentiaoyoulct
10、32B參數的“逆襲”!OLMo232B橫空出世,叫板GPT-3.5Turbo
OLMo232B是艾倫人工智能研究所發布的最新大型語言模型,憑借320億參數和完全開源的特性,挑戰了許多專有模型。通過精細的訓練過程,OLMo232B在多項基準測試中超越了GPT-3.5Turbo和GPT-4o mini,展現出卓越的性能和更高的訓練效率。

【AiBase提要:】
?? OLMo232B是完全開源的語言模型,公開了所有數據、代碼和訓練過程,促進全球研究合作。
?? 該模型擁有320億參數,在多項基準測試中超越了GPT-3.5Turbo,證明了開源模型的強大實力。
? OLMo232B在訓練效率上表現優異,僅使用三分之一的計算資源,展現出高效的AI開發潛力。
詳情鏈接:https://github.com/allenai/OLMo-core
(舉報)
