智譜發(fā)布0.9B 輕量級 GLM-OCR:性能登頂，千次處理僅需0.1元

2026-02-03 08:58 · 來源： AIbase基地

智譜今日正式發(fā)布并開源了專業(yè)級 OCR 模型 GLM-OCR。該模型以0.9B 的輕量化尺寸實現(xiàn)了跨級性能突破，在多項權(quán)威基準測試中登頂，旨在解決復雜文檔解析中的真實業(yè)務痛點。

核心性能:小尺寸下的 SOTA 表現(xiàn)

盡管參數(shù)規(guī)模僅為0.9B，但 GLM-OCR 的表現(xiàn)驚人。在權(quán)威文檔解析榜單 OmniDocBench V1.5 中，它以 94.6分的高分奪冠，其性能已逼近通用大模型 Gemini-3-Pro。無論是在文本識別、數(shù)學公式推導、復雜表格解析，還是關(guān)鍵信息抽取（KIE）方面，均取得了 SOTA(業(yè)內(nèi)最頂尖)表現(xiàn)。

場景突破:直擊復雜文檔痛點

GLM-OCR 針對六大高難業(yè)務場景進行了專項優(yōu)化，表現(xiàn)穩(wěn)健:

復雜表格: 支持合并單元格與多層表頭，可直接輸出標準 HTML 代碼。
結(jié)構(gòu)化提取: 智能識別卡證票據(jù)，輸出標準 JSON 格式。
手寫體與代碼: 完美兼容教育科研中的手寫公式及程序員的代碼截圖。
特殊標識: 具備極高的印章識別與多語言混排處理能力。

極致效率:推理更快，成本更低

在效率與成本控制上，GLM-OCR 展現(xiàn)了極強的商業(yè)競爭力:

極速推理: PDF 處理吞吐量達 1.86頁/秒，顯著優(yōu)于同類模型;支持 vLLM、Ollama 等主流部署方式。
極致性價比: API 價格低至 0.2元/百萬 Tokens。相比傳統(tǒng) OCR 方案，成本僅為其1/10，處理一千張 A4掃描件僅需約0.5元。

技術(shù)揭秘:多模態(tài)架構(gòu)與強化學習

GLM-OCR 繼承自 GLM-V 系列架構(gòu)，集成自研 CogViT 視覺編碼器。通過引入**多 Tokens 預測損失（MTP）**與全任務強化學習，模型在復雜版面下的泛化能力顯著提升。其獨特的4倍下采樣策略與 SwiGLU 機制，確保了視覺信息與語言解碼器的高效融合。

目前，GLM-OCR 已在GitHub和Hugging Face同步開源，智譜開放平臺也已上線相關(guān) API 及優(yōu)惠包。

相關(guān)推薦

薦AI日報：OpenAI推出macOS版Codex應用；智譜發(fā)布0.9B輕量級GLM-OCR；火狐Firefox 148瀏覽器即將上線

本期AI日報涵蓋多項AI領(lǐng)域動態(tài)：Adobe Firefly為訂閱用戶提供無限AI生成支持；OpenAI推出macOS版Codex應用，整合智能體化開發(fā)邏輯；智譜發(fā)布輕量級GLM-OCR模型，性能突出且成本低；火狐瀏覽器引入AI控制面板，支持一鍵屏蔽AI功能；騰訊回應紅包刷屏質(zhì)疑，強調(diào)為無門檻福利；港股大模型概念股走強；百度、小米等聯(lián)手加持國家具身智能平臺，完成超7億融資；AI在“人類終極考試”中表現(xiàn)不佳，揭示其能力或被高估。

?AI ?Adobe ?Firefly
為國產(chǎn)模型和國產(chǎn)芯片造“橋”：昇騰平臺上的DeepSeek-OCR-2遷移實錄

文章講述了使用智子芯元KernelCAT工具，將DeepSeek-OCR-2模型高效遷移至華為昇騰Atlas A2國產(chǎn)芯片的過程。傳統(tǒng)遷移需人工處理代碼依賴、環(huán)境配置和算子優(yōu)化，耗時費力。而KernelCAT作為AI Agent，能自動分析代碼、適配環(huán)境、生成補丁，并將通用計算邏輯替換為針對國產(chǎn)硬件的優(yōu)化實現(xiàn)，最終將推理速度從15 tokens/s大幅提升至550.45 tokens/s，加速超35倍。這展現(xiàn)了未來開發(fā)范式：人類定義目標，AI自主解決路徑，讓開發(fā)者從底層適配的繁瑣工作中解放出來。

?國產(chǎn)芯片適配 ?模型遷移 ?CUDA依賴
輕量無界！Jabra Evolve3 辦公娛樂雙場景耳麥

Jabra推出全新Evolve3系列耳機，采用無麥克風桿設(shè)計，搭載AI驅(qū)動的Jabra ClearVoice技術(shù)，結(jié)合深度神經(jīng)網(wǎng)絡(luò)（DNN）與自適應主動降噪（ANC），實現(xiàn)專業(yè)級語音清晰度。該系列提供頭戴式（Evolve385）與貼耳式（Evolve375）兩種型號，支持語音交互AI助手、快速充電（10分鐘提供10小時續(xù)航），并獲得主流通信平臺認證。產(chǎn)品兼顧工作與生活場景，旨在打造專業(yè)性能與時尚外觀兼具的跨界?

?深度學習技術(shù) ?自適應降噪 ?空間音效
行業(yè)首部冷凍性能團體標準發(fā)布，容聲冰箱“大冰象”詮釋何為“凍得快、裝得多”

1月24日，容聲冰箱發(fā)布“大冰象”新品，并同步推出《家用和類似用途制冷器具冷凍性能評價規(guī)范》團體標準。該標準首次構(gòu)建了覆蓋“空間效率”與“制冷性能”兩大維度的六項綜合評價模型，以直觀的百分制評分與等級劃分，為消費者提供清晰選購標尺。容聲以“大冰象”為實踐范本，通過領(lǐng)先的13.5kg/12h冷凍能力和-36℃深冷技術(shù)，生動詮釋了行業(yè)技術(shù)引領(lǐng)者如何將創(chuàng)新沉淀為惠及全產(chǎn)業(yè)與消費者的公共標準。

?容聲冰箱 ?冷凍性能 ?行業(yè)標準
iQOO 15 Ultra官宣2月4日發(fā)布主打極致性能

今日，iQOO官方正式宣布，iQOO15Ultra將于2月4日19:00發(fā)布。與市面上其他主打影像功能的Ultra機型不同，iQOO15Ultra另辟蹊徑，將性能和游戲體驗推向極致，成為首款以性能為核心賣點的Ultra機型。性能方面，iQOO15Ultra將搭載高通第五代驍龍8至尊版旗艦芯片，并配備主動散熱風扇，確保性能得到充分釋放。據(jù)官方透露，該機跑分高達451萬分，一舉打破行業(yè)最高記錄，展現(xiàn)出強大的性?

?iQOO15Ultra ?性能旗艦 ?游戲手機
存儲領(lǐng)域再迎突破！綠算發(fā)布FPGA NVMe RAID加速卡，重新定義高性能存儲

綠算技術(shù)發(fā)布FPGA NVMe RAID加速卡，突破傳統(tǒng)RAID性能瓶頸。該產(chǎn)品基于自主LightBoat2300 FPGA平臺，采用并行硬件架構(gòu)，實現(xiàn)IO命令解析、校驗運算硬件加速，CPU占用率降至零。實測8塊NVMe SSD組RAID5，讀寫帶寬達傳統(tǒng)方案3-4倍，延遲僅增約8微秒。支持多種RAID級別，單卡最大支持16塊NVMe SSD，后續(xù)可升級至24甚至32塊。產(chǎn)品適用于數(shù)據(jù)中心、云計算、金融科技等領(lǐng)域，提供極速安全存儲體驗，標志著國內(nèi)存儲加速領(lǐng)域邁入全新階段。

?FPGA ?NVMe ?RAID
光影織就家居新境，雷曼Micro LED巨幕墻讓客廳變身生活美學主場

雷曼光電1月21日發(fā)布兩款Micro LED巨幕墻新品LV135Max與LV163Max，將135英寸以上超大尺寸巨幕引入高端家居。產(chǎn)品擁有800nits高亮度和120%廣色域，呈現(xiàn)細膩光影畫面，并具備虛擬現(xiàn)實功能，可一鍵切換全球景致。獨創(chuàng)PSE節(jié)能冷屏技術(shù)控制表面溫度，低藍光設(shè)計保護眼部舒適。簡約外觀適配多種家裝風格，售價僅為行業(yè)同類產(chǎn)品1/3，惠及更多高凈值家庭。新品重新定義客廳價值，以極致畫質(zhì)、多元場景與貼心設(shè)計，將科技與溫情融入家居。

?家庭巨幕 ?顯示技術(shù) ?家居美學
報告點名認證！銷售易AI CRM助力伊頓電氣服務效率提升40%

近日，國家工業(yè)信息安全發(fā)展研究中心發(fā)布《2024–2025年中國智能體應用研究報告》。報告以嚴苛的應用導向為標準，重點關(guān)注智能體是否嵌入真實業(yè)務流程并創(chuàng)造持續(xù)價值。在此標準下，銷售易與伊頓電氣圍繞AI CRM智能體的深度實踐作為行業(yè)典范入選，標志著AI CRM正從技術(shù)演示邁向大規(guī)模應用的關(guān)鍵階段。據(jù)悉，銷售易為伊頓電氣量身打造的客服智能體解決方案，精準聚焦工

?智能體應用 ?AI ?CRM
憶聯(lián)發(fā)布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

在AI與云計算驅(qū)動的數(shù)據(jù)洪流時代，企業(yè)存儲系統(tǒng)面臨前所未有的效率與成本壓力。憶聯(lián)正式推出SATA SSD新品UM311d，旨在以更優(yōu)性能與更佳成本效率，助力企業(yè)夯實數(shù)據(jù)基石。UM311d支持SATA III接口，容量覆蓋480GB至3.84TB，順序讀寫速度高達560/535MB/s，隨機讀寫性能達99K/48K IOPS。相比前代產(chǎn)品，其隨機IOPS最高提升14%，關(guān)鍵時延最大降低35%，能顯著優(yōu)化虛擬機、分布式存儲及溫冷數(shù)據(jù)池等企業(yè)場景的數(shù)據(jù)存取體驗。產(chǎn)品采用2.5英寸標準形態(tài)，無需改造即可兼容主流服務器與存儲陣列，并通過大規(guī)模樣本驗證、深度可靠性驗證及廣泛兼容性驗證，確保性能穩(wěn)定與數(shù)據(jù)安全。UM311d致力于從技術(shù)驅(qū)動降本與性能轉(zhuǎn)化增效兩個層面優(yōu)化企業(yè)總擁有成本（TCO），成為應對規(guī)模化部署挑戰(zhàn)的優(yōu)選方案，為各類關(guān)鍵業(yè)務提供高效、穩(wěn)定的數(shù)據(jù)支撐。

?企業(yè)存儲 ?SATA ?SSD
價值129999元！京東京造100g黃金手機殼今天拍賣：1元起拍

近日，京東京造推出的黃金手機殼備受關(guān)注，今天官方直接上線了一場拍賣，起拍價僅1元，拍賣價值129999元的100g黃金手機殼。打開京東APP，搜索京東拍賣”即可進入活動頁，參與拍賣。

?黃金手機殼 ?京東京造 ?京東拍賣

智譜發(fā)布0.9B 輕量級 GLM-OCR:性能登頂，千次處理僅需0.1元

核心性能:小尺寸下的 SOTA 表現(xiàn)

場景突破:直擊復雜文檔痛點

極致效率:推理更快，成本更低

技術(shù)揭秘:多模態(tài)架構(gòu)與強化學習

薦AI日報：OpenAI推出macOS版Codex應用；智譜發(fā)布0.9B輕量級GLM-OCR；火狐Firefox 148瀏覽器即將上線

為國產(chǎn)模型和國產(chǎn)芯片造“橋”：昇騰平臺上的DeepSeek-OCR-2遷移實錄

輕量無界！Jabra Evolve3 辦公娛樂雙場景耳麥

行業(yè)首部冷凍性能團體標準發(fā)布，容聲冰箱“大冰象”詮釋何為“凍得快、裝得多”

iQOO 15 Ultra官宣2月4日發(fā)布主打極致性能

存儲領(lǐng)域再迎突破！綠算發(fā)布FPGA NVMe RAID加速卡，重新定義高性能存儲

光影織就家居新境，雷曼Micro LED巨幕墻讓客廳變身生活美學主場

報告點名認證！銷售易AI CRM助力伊頓電氣服務效率提升40%

憶聯(lián)發(fā)布新款SATA SSD UM311d：以卓越性能與更低TCO，從容應對海量存儲需求

價值129999元！京東京造100g黃金手機殼今天拍賣：1元起拍

今日大家都在搜的詞：

熱文

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：阿里千問砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

騰訊回應元寶崩了：目前已經(jīng)恢復 10億紅包活動太火爆

新款聯(lián)想拯救者Y700平板官宣3月發(fā)布

余承東公布問界M6實車外觀預計將于今年春季發(fā)布

華為FreeClip 2耳夾耳機推出冰莓紫、玫瑰金兩款新配色

AI日報：OpenAI推出macOS版Codex應用；智譜發(fā)布0.9B輕量級GLM-

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：MiniMax Music 2.5 發(fā)布；螞蟻靈波開源世界模型LingBo

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內(nèi)測截圖

AI日報：阿里千問砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

特斯拉ModelS和ModelX項目將終止工廠將轉(zhuǎn)型生產(chǎn)機器人

REDMI Turbo 5系列今晚發(fā)布：開售即可享國補

支付寶「碰紅包卡」上線碰一下即可發(fā)/領(lǐng)紅包

站長商機