AI視野：Stability.ai開源SDXL Turbo；Pika Labs1.0版發布；字節跳動ChitChop在海外上線；Keras3.0正式發布；法院判決AI生成圖片具備版權

2023-11-29 15:39 · 稿源：站長之家

??????AI應用

Stability.ai發布開源文生圖模型SDXL Turbo

文生成圖AI平臺Stability.ai發布開源SDXL Turbo，圖像生成實時響應，僅需1秒。SDXL Turbo基于全新對抗擴散蒸餾技術（ADD），將生成步驟減至1-4步，保持高質量。性能測試顯示，SDXL Turbo在1步驟擊敗LCM-XL的4步驟和SDXL的50步驟。雖有局限，只能用于學術研究，生成512x512固定像素圖片，但技術突破可助中小企業低成本應用。

開源地址:https://github.com/Stability-AI/generative-models

在線體驗地址:https://clipdrop.co/stable-diffusion-turbo

論文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf

【AiBase提要:】
?? SDXL Turbo發布:Stability.ai宣布開源SDXL Turbo，實現文生成圖實時響應，1秒生成圖片。
?? 技術突破:基于對抗擴散蒸餾技術，SDXL Turbo將生成步驟從50減至1-4步，保持高圖像質量。
?? 應用范圍:雖局限于學術研究，SDXL Turbo技術突破可助中小企業以低成本進行圖像生成應用。

Pika Labs1.0版發布

AI初創公司Pika Labs正式發布了其令人印象深刻的AI視頻生成器的1.0版本，為視頻創作帶來了全新的體驗。

Pika Labs體驗網址:https://top.aibase.com/tool/pika-labs

【AiBase提要:】
Pika Labs發布1.0版AI視頻生成器，支持多種風格視頻創作。
Pika Labs成功融資5500萬美元，由知名投資者領投。
Pika Labs1.0支持用戶上傳視頻二次生成和編輯，而且還能局部編輯視頻內容

字節跳動ChitChop在海外上線

字節跳動推出的大模型產品“ChitChop”在海外上線，由POLIGON開發和運營，提供多達200+的智能機器人服務，支持創作、工作、AI畫畫、娛樂、AI學習和生活等六大場景，具備語音輸入和文件分析功能。

微信截圖_20231129152102.png

【AiBase提要:】
?? ChitChop是字節跳動的人工智能助理工具，提供200+智能機器人服務。
??? 產品支持創作、工作、AI畫畫、娛樂、AI學習和生活等六大場景。
??? ChitChop具備語音輸入功能，能自動識別語音內容，并可進行文件分析和討論。

??????AI新鮮事

OpenAI介入調查:GPT-4在編寫代碼上偷懶

GPT-4最新版本因偷懶不愿編寫完整代碼，用戶抱怨頻出，引起廣泛關注和調查。

【AiBase提要:】
?? GPT-4最新版本存在編寫代碼懶惰的問題，用戶反映在實際需求中難以得到滿足。
?? 用戶反饋GPT-4在解釋問題上花費過多時間，而不提供實際可運行代碼，引發不滿。
?? OpenAI已介入調查，并表示將借助用戶提供的例子加以改進。

法院判決AI生成圖片具備版權

北京互聯網法院首次就AI生成圖片領域著作權侵權案作出一審判決，認定AI生成的圖片具備獨創性和智力投入，應受著作權法保護，為該領域著作權保護樹立了重要判例。

【AiBase提要:】
??法院首次確認AI生成圖片具備獨創性和智力投入，應受著作權法保護。
??在創作過程中，法院強調智力投入主要來自人而非人工智能模型。
???判決對涉案圖片的智力成果、獨創性、作品性質及著作權歸屬等進行詳細解釋，對AI生成圖片領域著作權保護具有重要意義。

vivo S18系列將首批搭載藍心AI大模型

vivo宣布S18系列將成為首批采用AI大模型技術的手機，搭載自研藍心大模型，參數量級涵蓋十億、百億、千億。S18將采用驍龍7Gen3處理器，而S18Pro升級為天璣9200處理器。

【AiBase提要:】
?? 技術領先: vivo S18系列引領潮流，首批搭載覆蓋十億至千億參數級別的藍心AI大模型技術。
?? 卓越配置: S18搭載驍龍7Gen3處理器，曲面屏、超光感人像鏡頭，而S18Pro升級至天璣9200，支持Wi-Fi7等先進配置。
?? 全面布局: vivo不僅在硬件上創新，還推出了藍心小V助理和藍心千詢APP，拓展了基于AI大模型的應用場景。

谷歌搜索展示AI生成圖片替代了真實照片

最新報道指出，谷歌搜索結果中以色列傳奇歌手卡瑪卡維沃·奧萊的照片實際上是由人工智能生成的，引發了對搜索準確性的擔憂。

【AiBase提要:】
?? 谷歌搜索顯示卡瑪卡維沃·奧萊的照片實為AI生成，替代了真實照片。
?? 谷歌表示正在改進Knowledge Panels，但對問題尚未解決。
?? 網頁指責Google對AI生成的虛假信息回應不足，呼吁公司解決問題。

亞馬遜宣布推出新的人工智能芯片Trainium2

亞馬遜AWS推出新的人工智能芯片「Trainium2」，旨在構建和運行AI應用程序，同時深化與英偉達的合作，提供對Nvidia最新芯片的訪問。

【AiBase提要:】
?? 雙管齊下策略: 亞馬遜計劃推出Trainium2人工智能芯片，同時提供對Nvidia最新芯片的訪問，以滿足不斷增長的AI應用需求。
?? 性能提升: Trainium2芯片將使AI模型性能提高四倍，為公司如OpenAI、Databricks等提供更強大的訓練工具。
?? 多元選擇: 亞馬遜強調其云計算服務AWS的多元選擇，包括Graviton4處理器和Nvidia GPU，以滿足客戶對成本效益高的云服務的需求。

一男子用AI工具洗稿競爭對手文章 “竊取”數百萬的頁面瀏覽量

人工智能生成工具在SEO領域引發爭議，Content Growth創始人通過AI文本生成器成功竊取360萬流量，引發用戶質疑和道德擔憂。

【AiBase提要:】
?? 互聯網時代，強大的文本生成器如ChatGPT顛覆傳統SEO，引發人工智能生成內容浪潮。
?? Content Growth創始人通過AI文本生成器實施SEO“搶劫”，引發用戶強烈憤怒和道德質疑。
?? 使用Byword等人工智能生成器清洗現有內容，可能欺騙搜索引擎，呼吁對人工智能內容進行監管和審查。

麻省理工學院推GenSim項目:利用大語言模型編寫機器人新任務

麻省理工學院的“GenSim”項目利用大型語言模型如GPT-4，通過自動生成新任務或詳細說明所需行為的每個步驟，擴大了機器人可以接受培訓的仿真任務范圍，為機器人學習提供更廣泛的模擬任務。

【AiBase提要:】
?? MIT CSAIL的“GenSim”項目通過大型語言模型生成新任務或詳細說明機器人行為步驟，拓展了機器人在仿真任務中的培訓范圍。
?? GenSim系統具有目標導向和探索兩種模式，利用LLM生成任務描述和行為代碼，成功訓練機械臂執行新任務，如高速放置彩色積木。
?? 經過人類預訓練后，GenSim自動生成了100種新行為，相比手動編寫任務的基準測試，展示了在構思新型機器人活動方面的潛力。

亞馬遜推出AI聊天機器人Amazon Q

亞馬遜在re:Invent大會上發布了面向AWS客戶的AI聊天機器人「Amazon Q」，可提供廣泛的解決方案和操作建議，涵蓋業務智能、編程和配置等多個領域。

【AiBase提要:】
?? Amazon Q是面向AWS客戶的聊天機器人，起始價格每用戶每年20美元，能回答廣泛問題。
?? 可連接到各應用程序，學習企業各方面信息，生成內容，提供可視化選項。
?? 重視隱私，Q僅返回用戶有權查看信息，管理員可控制和過濾答案。

????????大模型動態

北大提出Chat-UniVi視覺語言大模型

Chat-UniVi是由北大和中山大學研究者提出的統一視覺語言大模型，在短短三天訓練內獲得130億參數，通過動態視覺token和密度峰聚類算法實現統一視覺表征，在多任務中表現卓越。

項目地址:https://github.com/PKU-YuanGroup/Chat-UniVi

【AiBase提要:】
?? 模型簡介: Chat-UniVi是北大和中山大學研究者提出的視覺語言大模型，僅需三天訓練即可獲得130億參數，實現統一的視覺表征。
?? 核心方法: 采用動態視覺token和密度峰聚類算法，大幅減少視覺token數量，提高模型性能，在多任務中超越其他大型模型。
?? 實驗成果: Chat-UniVi在圖片、視頻理解以及問答任務中表現卓越，使用更少的視覺token達到與其他大模型相媲美的性能水平，并開源了代碼、數據集和模型權重。

新加坡國立大學開源多模態語言模型 NExT-GPT

新加坡國立大學發布的開源多模態語言模型 NExT-GPT，通過處理文本、圖像、視頻和音頻等多樣化輸入，推動了多媒體人工智能應用的發展，為開發者提供強大支持。

【AiBase提要:】
?? 多模態能力: NExT-GPT 提供強大的多模態語言模型，能處理文本、圖像、視頻和音頻，拓展了人工智能應用領域。
?? 架構與訓練: 采用三層架構，包括線性投影、Vicuna LLM 核心和模態特定的轉換層，通過 MosIT 技術進行中間層訓練，降低訓練成本。
?? 開源貢獻: NExT-GPT 的開源使研究者和開發者能夠創建能夠無縫集成文本、圖像、視頻和音頻的應用，為多媒體人工智能應用提供了重要貢獻。

研究人員發布Starling-7B:基于AI反饋的大語言模型

UC伯克利發布基于AI反饋強化學習的Starling-7B大語言模型，采用RLAIF技術，在性能上媲美GPT-3.5，通過基準測試表現出色，邁向更人性化的應用。

項目網址:https://huggingface.co/berkeley-nest/Starling-LM-7B-alpha

【AiBase提要:】
?? RLAIF技術介紹: Starling-7B采用了基于AI反饋的強化學習，通過優化Openchat3.5和Mistral-7B而成。
?? 性能卓越: 在基準測試中，Starling-7B表現出色，對比其他模型性能提升引人矚目。
?? 邁向人性化: RLAIF主要改善了模型的實用性和安全性，未來計劃引入高質量的人工反饋數據，更好地滿足人類需求。

?????????聚焦開發者

Keras3.0正式發布

Keras3.0發布，全面支持TensorFlow、JAX和PyTorch，進行了全新的大模型訓練和部署功能引入，保持高度向后兼容性，為深度學習開發者提供更多選擇和工具。

【AiBase提要:】
?? 全面支持多框架: Keras3.0全面支持TensorFlow、JAX和PyTorch，使用戶可以選擇在不同框架上運行Keras工作流。
?? 大模型訓練和部署: 引入新的大模型訓練和部署功能，支持各種預訓練模型，保持高度向后兼容性，平滑過渡。
?? 跨框架數據pipeline: Keras3.0支持跨框架數據pipeline，包括分布式API，提高在大規模數據并行和模型并行方面的效率。

中國團隊開源大規模高質量圖文數據集ShareGPT4V

中國團隊開源了基于GPT4-Vision構建的圖文數據集ShareGPT4V，訓練了7B模型，涵蓋120萬條多樣性豐富的圖像-文本描述數據，在多模態性能上超越同級別模型，為多模態研究和應用提供了新的基石。

【AiBase提要:】
?? 數據集概要: ShareGPT4V基于GPT4-Vision構建，包含120萬條圖像-文本描述數據，涵蓋世界知識、對象屬性、空間關系、藝術評價等多方面。
?? 性能突破: 中國團隊的7B模型在多模態基準測試上表現優異，超越同級別模型，為多模態研究和應用提供有力支持。
??開源資源: 該數據集已開源，論文地址為
https://arxiv.org/abs/2311.12793，項目地址為https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

上海AI實驗室、Meta聯合開發開源模型可為人體生成3D空間音頻

上海AI實驗室與Meta合作推出的開源模型利用頭戴式麥克風和人體姿態信息，成功生成人體的3D空間音頻，為虛擬環境提供關鍵支持。

項目地址:https://github.com/facebookresearch/SoundingBodies

【AiBase提要:】
?? 技術突破: 上海AI實驗室與Meta的開源模型通過多模態融合，解決了音源位置未知和麥克風距離音源較遠等難題，成功實現了人體的3D空間音頻生成。
?? 局限性挑戰: 雖然取得了技術進展，但該模型僅適用于渲染人體音，難以處理非自由音場傳播環境，且計算量較大，難以在資源受限的設備上部署。
?? 開源模型鏈接: 項目地址為 https://github.com/facebookresearch/SoundingBodies，為虛擬現實領域的發展提供了新的可能性，但仍需進一步優化和拓展。

Real-ESRGAN-Video:將視頻清晰度提升至2K或4K

Real-ESRGAN-Video技術讓用戶輕松將視頻清晰度提升至2K或4K，通過簡化上傳和選擇清晰度的步驟，提供多種模型處理模式，特別適用于動畫視頻。測試結果顯示對相對清晰的視頻效果顯著，為提升視頻素材清晰度帶來新可能。

【AiBase提要:】
?? 清晰度提升: Real-ESRGAN-Video技術簡化步驟，讓用戶輕松將視頻清晰度提升至2K或4K。
?? 多模型支持: 提供多種處理模式，標準模型適用于大多數視頻，動畫專用模型更擅長處理動畫線條和顏色。
?? 測試驗證: 測試結果顯示在相對清晰的視頻上，提升效果顯著，尤其對動畫視頻的效果提升更為明顯。

（舉報）

相關推薦

關鍵詞：

SDXL

華為云TaurusDB以“存算分離”實現數據庫架構躍遷

在數字化轉型浪潮中，數據成為企業核心資產，數據庫選擇直接關系系統穩定性、擴展性與成本效率。華為云推出云原生數據庫TaurusDB，完全兼容MySQL生態，支持計算存儲分離架構，顯著提升性能并降低成本。其具備極致彈性、Serverless架構及HTAP混合負載能力，有效應對高并發與動態業務需求。結合企業級GaussDB，華為以“雙引擎”戰略為企業提供數據庫現代化升級的確定選擇。

?數字化轉型 ?數據庫 ?云原生
中國存儲品牌江波龍，以mSSD夯實端側AI存儲技術底座

中國存儲品牌江波龍推出行業首款集成封裝mSSD（Micro SSD），采用Wafer級系統級封裝技術，將控制器、NAND Flash等元件集成于單一封裝體內，體積僅20×30×2.0mm、重2.2g。該產品以高性能、高可靠、更靈活的特性重塑傳統SSD形態，順序讀取速度達7400MB/s，4K隨機讀取達1000K IOPS，并具備寬溫域運行與抗震動能力。mSSD已滲透至PC筆電、游戲掌機、無人機、VR設備及端側AI等領域，成為連接存儲硬件與多元應用場景的關鍵紐帶，為終端設備輕量化、高性能與低功耗需求提供創新解決方案。

?數字化 ?智能化 ?存儲介質
憶聯發布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

在AI與云計算驅動的數據洪流時代，企業存儲系統面臨前所未有的效率與成本壓力。憶聯正式推出SATA SSD新品UM311d，旨在以更優性能與更佳成本效率，助力企業夯實數據基石。UM311d支持SATA III接口，容量覆蓋480GB至3.84TB，順序讀寫速度高達560/535MB/s，隨機讀寫性能達99K/48K IOPS。相比前代產品，其隨機IOPS最高提升14%，關鍵時延最大降低35%，能顯著優化虛擬機、分布式存儲及溫冷數據池等企業場景的數據存取體驗。產品采用2.5英寸標準形態，無需改造即可兼容主流服務器與存儲陣列，并通過大規模樣本驗證、深度可靠性驗證及廣泛兼容性驗證，確保性能穩定與數據安全。UM311d致力于從技術驅動降本與性能轉化增效兩個層面優化企業總擁有成本（TCO），成為應對規模化部署挑戰的優選方案，為各類關鍵業務提供高效、穩定的數據支撐。

?企業存儲 ?SATA ?SSD
實測靠譜！SD卡誤格式化數據恢復流程拆解，從原理到恢復一步不差

本文詳細解析了SD卡誤格式化問題及數據恢復方法。SD卡格式化分為快速和完全兩種，前者僅刪除文件索引，數據可恢復；后者覆蓋數據，恢復難度大。誤格式化后應立即停止使用，避免新數據覆蓋。推薦使用易我數據恢復軟件，通過掃描、預覽、保存三步即可高效找回照片、視頻等文件。同時，定期備份、正確操作、選擇優質存儲設備是預防數據丟失的關鍵。

?SD卡格式化 ?數據恢復 ?存儲介質
新SDXL蒸餾模型SDXL Flash 速度相對LCM更慢些圖像質量更好

SDXLFlash是一個由SDXL團隊與ProjectFluently合作推出的新型快速高質量文本到圖像轉換模型。盡管相對于LCM、Turbo和Lightning模型，SDXLFlash的速度稍慢，但在圖像質量上表現更佳。SDXLFlash的推出為需要在速度和質量之間取得平衡的圖像生成任務提供了新的選擇，特別是對于那些追求高質量輸出的用戶和應用場景。

?SDXL ?AI頭條
SDXL模型精選微調模型合集SDXL fine-tunes 覆蓋各種風格可直接用于開發

Replicate上的“SDXLfine-tunes”收藏包含了一系列基于SDXL模型的精選微調模型，這些模型專為生成特定視覺風格和主題的高質量圖像設計。這些微調模型利用了大型生成模型SDXL的強大功能，通過針對特定內容進行優化和調整，為用戶提供了豐富的視覺創作工具。還有galleri5/icons模型，這是一個SDXL微調模型，專門用于生成光滑的圖標和扁平的波普構成主義圖形，帶有粗邊緣，基于Bing

?SDXL模型 ?AI頭條
特斯拉FSD停售上熱搜馬斯克：2月14日之后僅提供月度訂閱

今日，馬斯克通過社交平臺發文宣布，特斯拉將于2月14日之后停止銷售其全自動駕駛軟件FSD，未來該服務將僅以月度訂閱的方式提供給用戶。這一決策標志著特斯拉在FSD的商業模式上進行了徹底調整，從以往允許用戶一次性購買轉變為純訂閱制。

?特斯拉 ?FSD ?自動駕駛
深入解析SDXL潛在空間以及如何改善其生成圖像的方法

HuggingFace社區成員TimothyAlexisVass撰寫了一篇名為《ExplainingtheSDXLlatentspace》的文章，重點解釋了SDXL潛在空間的特性以及如何改善其生成圖像的方法。SDXL潛在空間的結構包括四個通道，分別對應圖像的亮度、青/紅、綠/紫、以及圖案/結構。這為提高SDXL生成圖像質量提供了一種新的思路。

?SDXL
Animagine XL 3.1發布：一個開源的SDXL動漫模型

AnimagineXL3.1，一款全新的開源動漫主題文本到圖像模型，已經正式發布。該版本在原有的基礎上進行了一系列的升級和優化，使其對廣泛的動漫作品和風格的理解更加深入，覆蓋了從古老到現代的各種藝術風格。這些圖像覆蓋了廣泛的動漫角色、風格和主題，為模型提供了一個深厚的知識基礎。

?Animagine ?SDXL ?AI頭條
SDXL推精簡版本SSD-1B 推理速度提升60%

SegmindStableDiffusion1B是一款先進的文本生成圖像AI模型，致力于提供高效、高速的圖像生成能力。這個模型是穩定擴散XL的精簡版本，體積縮小了50%，但在保持高質量文本生成圖像功能的同時，速度提高了60%。偏見和限制分析:研究人員和開發人員可以使用該模型來探究其局限性和偏見，有助于更好地理解生成模型的行為。

?SDXL

今日大家都在搜的詞：

熱文

3 天
7天

AI視野：Stability.ai開源SDXL Turbo；Pika Labs1.0版發布；字節跳動ChitChop在海外上線；Keras3.0正式發布；法院判決AI生成圖片具備版權

華為云TaurusDB以“存算分離”實現數據庫架構躍遷

中國存儲品牌江波龍，以mSSD夯實端側AI存儲技術底座

憶聯發布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

實測靠譜！SD卡誤格式化數據恢復流程拆解，從原理到恢復一步不差

新SDXL蒸餾模型SDXL Flash 速度相對LCM更慢些圖像質量更好

SDXL模型精選微調模型合集SDXL fine-tunes 覆蓋各種風格可直接用于開發

特斯拉FSD停售上熱搜馬斯克：2月14日之后僅提供月度訂閱

深入解析SDXL潛在空間以及如何改善其生成圖像的方法

Animagine XL 3.1發布：一個開源的SDXL動漫模型

SDXL推精簡版本SSD-1B 推理速度提升60%

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

余承東公布問界M6實車外觀預計將于今年春季發布

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

iQOO 15 Ultra今日發布主打極致性能

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

余承東公布問界M6實車外觀預計將于今年春季發布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

站長商機