?DeepSeek 發(fā)布 OCR 2：視覺 Token 消耗銳減 80%，文檔解析力超越 Gemini 3 Pro

2026-02-02 17:23 · 來源： AIbase基地

中國 AI 領(lǐng)軍企業(yè) DeepSeek 近日發(fā)布了全新的視覺編碼器 DeepSeek OCR2，在文檔處理和圖像識別領(lǐng)域?qū)崿F(xiàn)重大突破。該模型通過模擬人類視覺的靈活掃描模式，徹底顛覆了傳統(tǒng)視覺模型平鋪直敘的處理邏輯。

DeepSeek 研究人員指出，人類眼睛在觀察物體時會根據(jù)內(nèi)容進(jìn)行靈活聚焦。為了實(shí)現(xiàn)這一特性，DeepSeek OCR2引入了全新的架構(gòu)，棄用了傳統(tǒng)的 CLIP 組件，轉(zhuǎn)而采用輕量級語言模型架構(gòu)。該架構(gòu)利用“因果流 Token”對視覺信息進(jìn)行重新排列和上下文整合，使 AI 能夠像人類一樣，根據(jù)內(nèi)容的意義而非固定的網(wǎng)格順序來“觀察”世界。

這種創(chuàng)新的處理方式不僅提升了理解力，更極大地優(yōu)化了效率。在相同的圖像處理任務(wù)中，DeepSeek OCR2僅需256到1，120個 Token，相比同類系統(tǒng)通常消耗的6，000個以上 Token，其視覺 Token 消耗量銳減了80% 以上。這種極高的壓縮率使得模型在處理長文檔時具有巨大的成本和速度優(yōu)勢。

在權(quán)威的 OmniDocBench 基準(zhǔn)測試中，該模型以91.09% 的高分刷新紀(jì)錄，在文檔解析性能上全面超越了 Gemini3Pro。目前，DeepSeek 已將該模型的代碼和權(quán)重向公眾開放。研究團(tuán)隊(duì)認(rèn)為，這種架構(gòu)是邁向統(tǒng)一多模態(tài)處理的重要一步，未來有望在同一框架下實(shí)現(xiàn)文本、語音和圖像的深度融合理解。

劃重點(diǎn):

?? 能效巔峰:DeepSeek OCR2將單張圖像的視覺 Token 需求大幅降低，相比同類系統(tǒng)減少了約80% 的資源消耗。
?? 性能超越:在 OmniDocBench 測試中，該模型在文檔解析和識別閱讀順序方面表現(xiàn)卓越，準(zhǔn)確率超越了 Gemini3Pro。
?? 架構(gòu)創(chuàng)新:通過引入“因果流 Token”重組視覺信息，模型實(shí)現(xiàn)了從機(jī)械掃描到理解內(nèi)容邏輯的跨越。

相關(guān)推薦

薦AI日報(bào)：MiniMax Music 2.5 發(fā)布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

本期AI日報(bào)聚焦多項(xiàng)AI技術(shù)突破：MiniMax Music 2.5發(fā)布，提升AI音樂可控性與真實(shí)度；螞蟻靈波開源世界模型LingBot-World，為具身智能等提供高保真數(shù)字環(huán)境；谷歌Gemini 3.5泄露，單次提示可生成三千行代碼；Kimi K2.5 Agent升級，高效處理Excel、Word等辦公文檔；蘑菇物聯(lián)“靈知”垂直大模型通過備案，專注工業(yè)輔助與能源領(lǐng)域；昆侖萬維SkyReels-V3開源，實(shí)現(xiàn)多模態(tài)視頻生成；昆侖天工發(fā)布音樂大模型Mureka V8，推動AI音樂邁向“可發(fā)布”級別；三星宣布下一代AR眼鏡將于2026年發(fā)布，主打多模態(tài)AI體驗(yàn)。

?AI音樂 ?MiniMax ?Music
2026 品牌新戰(zhàn)場：如何用GEO品牌監(jiān)控工具讓 DeepSeek 們愛上你的品牌？

面對 2026 年這場席卷全球的 AI 搜索浪潮，許多品牌公關(guān)（PR）和市場總監(jiān)（CMO）正陷入一種集體焦慮：明明在搜索引擎里排名第一，為什么用戶去問 DeepSeek、豆包或文心一言時，AI 卻對你的品牌只字不提？或者更糟——AI 正在熱情地推薦你的競爭對手。歡迎來到 GEO（Generative Engine Optimization，生成式引擎優(yōu)化）時代。如果你還在執(zhí)著于傳統(tǒng)的 SEO，那就像是在自動駕駛時代研究?

?AI搜索 ?品牌公關(guān) ?市場總監(jiān)
螞蟻阿福PC端升級：面向醫(yī)生群體上線DeepSearch功能

螞蟻阿福近日宣布完成PC端升級，正式上線DeepSearch功能。該功能面向醫(yī)生、醫(yī)學(xué)生及基層醫(yī)療工作者等專業(yè)人士免費(fèi)開放，旨在提供高效、專業(yè)的醫(yī)學(xué)信息支持與服務(wù)。升級后的PC端在信息采納上嚴(yán)格遵循證據(jù)等級，對數(shù)據(jù)進(jìn)行了分層篩選，目前已收錄超過3600萬篇高質(zhì)量醫(yī)學(xué)文獻(xiàn)。內(nèi)容既涵蓋國際權(quán)威資源，也整合了如中華醫(yī)學(xué)會等機(jī)構(gòu)發(fā)布的本土最新指南與共識，兼顧全?

?醫(yī)學(xué)信息 ?DeepSearch ?PC端升級
RGB-Mini LED vs SQD-Mini LED 終極對比：拋開營銷談技術(shù)，誰更值得選？

文章對比了RGB-Mini LED與SQD-Mini LED兩種技術(shù)路線。RGB方案采用無機(jī)材料，壽命長、穩(wěn)定性高，可實(shí)現(xiàn)三維光色同步控制，從根源杜絕串色，畫質(zhì)精準(zhǔn)耐用。SQD方案依賴量子點(diǎn)材料，易老化衰減，僅支持二維控光，存在串色、偏色等先天短板。選購時應(yīng)認(rèn)準(zhǔn)真RGB技術(shù)，避免偽RGB陷阱。追求長期高畫質(zhì)用戶首選RGB-Mini LED，短期低預(yù)算場景可酌情考慮SQD方案。

?Mini ?LED電視 ?RGB-Mini
超越OLED！海信RGB-Mini LED電視成2026年高端首選

2026年，全球高端電視市場迎來技術(shù)變革。海信開創(chuàng)的RGB-Mini LED技術(shù)挑戰(zhàn)OLED的高端地位，在CES 2026上獲得全球顯示巨頭跟進(jìn)，成為公認(rèn)的新一代顯示技術(shù)。該技術(shù)通過三原色直出實(shí)現(xiàn)超高色域，配合黑曜屏Ultra顯著提升暗室畫質(zhì)，黑色表現(xiàn)深邃，峰值亮度超越OLED，且避免了OLED的燒屏隱患。海信RGB-Mini LED電視還具備高刷新率，堪稱“最強(qiáng)游戲搭檔”。憑借畫質(zhì)、壽命、能耗等全面優(yōu)勢，RGB-Mini LED已實(shí)現(xiàn)對傳統(tǒng)顯示技術(shù)的超越，成為高端電視首選。

?高端電視 ?RGB-Mini ?LED
RGB-MiniLed電視如何重新定義客廳視覺中心？

文章探討了電視消費(fèi)觀念的變遷，從過去關(guān)注收視率、頻道，轉(zhuǎn)向如今重視幀率、沉浸感和家庭影院的“平權(quán)”。以海信E8S+Pro為代表的RGB-MiniLed電視，憑借原生4K 170Hz、動態(tài)330Hz高刷、0延遲技術(shù)及信芯H7芯片，成為爭奪客廳“視覺權(quán)力”的核心武器，為玩家提供競技優(yōu)勢。其RGB三原色自發(fā)光芯片配合9360分區(qū)，實(shí)現(xiàn)“光色同控”，呈現(xiàn)深邃黑色與6200nits耀眼亮度，滿足影迷對色彩與細(xì)節(jié)的苛刻要求。搭載的4.2.2巨浪全屏聲場，降低了構(gòu)建家庭影院門檻，實(shí)現(xiàn)音畫合一。文章指出，在快速迭代的消費(fèi)電子行業(yè)，觸及技術(shù)本質(zhì)、擁有頂級硬件底座和AI進(jìn)化能力的產(chǎn)品才值得長期持有，海信E8S+Pro正是這樣一款成熟的高性價比投資之選。

?電視 ?幀率 ?沉浸感
DeepGEO上線GEO品牌診斷功能，六大模塊為企業(yè)品牌精準(zhǔn)“把脈”

國內(nèi)領(lǐng)先的智能數(shù)據(jù)平臺DeepGEO推出“GEO品牌診斷”新功能，通過六大模塊為企業(yè)提供從用戶洞察、基礎(chǔ)建設(shè)評估、效果追蹤到競爭分析、輿情監(jiān)控及優(yōu)化建議的全方位數(shù)字化評估，助力品牌科學(xué)決策與精準(zhǔn)管理，實(shí)現(xiàn)價值持續(xù)增長。

?品牌智能數(shù)據(jù) ?GEO品牌診斷 ?品牌建設(shè)
華為FreeClip 2耳夾耳機(jī)推出冰莓紫、玫瑰金兩款新配色

華為FreeClip 2耳夾耳機(jī)今日發(fā)布兩款新配色——冰莓紫與玫瑰金，至此共有五款配色可選。核心搭載第三代自研低功耗芯片，首次引入NPU+AI處理器，算力提升高達(dá)10倍。配備自研超澎湃雙擎單元，響度與低頻動力均提升100%，支持L2HC音頻編碼。設(shè)計(jì)上采用全新親膚液態(tài)材質(zhì)，柔軟度提升25%，云感C形橋設(shè)計(jì)更貼合，單耳僅重5.1克，支持左右耳道自適應(yīng)及IP57防塵抗水。智能方面支持鴻蒙AI耳邊助手，具備多項(xiàng)實(shí)用功能。續(xù)航方面，單次續(xù)航9小時，搭配充電倉總續(xù)航達(dá)38小時，支持快充。

?華為FreeClip2 ?耳夾耳機(jī) ?冰莓紫
新款RGB-Mini LED哪款值得買？牢記兩大準(zhǔn)則，推薦4款暢銷機(jī)型

臨近春節(jié)，許多消費(fèi)者計(jì)劃升級高端電視。RGB-Mini LED技術(shù)憑借高色域、高亮度等優(yōu)勢進(jìn)入爆發(fā)期。選購時需注意行業(yè)標(biāo)準(zhǔn)，確保產(chǎn)品具備“RGB真彩背光+光色同控算法”。海信作為該技術(shù)引領(lǐng)者，旗下UX、U7S Pro、E8S Pro、E8S等機(jī)型覆蓋不同需求，是可靠選擇。

?RGB-Mini ?LED電視 ?高端電視選購
新款RGB-Mini LED哪款值得買？這4款閉眼入

文章指出，RGB-Mini LED技術(shù)憑借其“畫質(zhì)、能耗、健康”三位一體的綜合優(yōu)勢，已成為2026年全球高端電視市場的首選。中國品牌在該領(lǐng)域處于絕對領(lǐng)先地位，海信作為技術(shù)開創(chuàng)者和引領(lǐng)者，其產(chǎn)品矩陣覆蓋超旗艦、影像旗艦和影游旗艦三大類，滿足不同高端觀影需求。消費(fèi)者選購時需依據(jù)行業(yè)白皮書標(biāo)準(zhǔn)，辨別真假RGB-Mini LED產(chǎn)品，避免被簡化方案誤導(dǎo)。

?RGB-Mini ?LED ?高端電視市場

?DeepSeek 發(fā)布 OCR 2：視覺 Token 消耗銳減 80%，文檔解析力超越 Gemini 3 Pro

薦AI日報(bào)：MiniMax Music 2.5 發(fā)布；螞蟻靈波開源世界模型LingBot-World；谷歌 Gemini 3.5 泄露

2026 品牌新戰(zhàn)場：如何用GEO品牌監(jiān)控工具讓 DeepSeek 們愛上你的品牌？

螞蟻阿福PC端升級：面向醫(yī)生群體上線DeepSearch功能

RGB-Mini LED vs SQD-Mini LED 終極對比：拋開營銷談技術(shù)，誰更值得選？

超越OLED！海信RGB-Mini LED電視成2026年高端首選

RGB-MiniLed電視如何重新定義客廳視覺中心？

DeepGEO上線GEO品牌診斷功能，六大模塊為企業(yè)品牌精準(zhǔn)“把脈”

華為FreeClip 2耳夾耳機(jī)推出冰莓紫、玫瑰金兩款新配色

新款RGB-Mini LED哪款值得買？牢記兩大準(zhǔn)則，推薦4款暢銷機(jī)型

新款RGB-Mini LED哪款值得買？這4款閉眼入

今日大家都在搜的詞：

熱文

2026支付寶集?？魈扉_啟：19套主題每套1.68元紅包

AI日報(bào)：阿里千問砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預(yù)計(jì)2月13日左右到店

新款聯(lián)想拯救者Y700平板官宣3月發(fā)布

騰訊回應(yīng)元寶崩了：目前已經(jīng)恢復(fù) 10億紅包活動太火爆

華為FreeClip 2耳夾耳機(jī)推出冰莓紫、玫瑰金兩款新配色

余承東公布問界M6實(shí)車外觀預(yù)計(jì)將于今年春季發(fā)布

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報(bào)：MiniMax Music 2.5 發(fā)布；螞蟻靈波開源世界模型LingBo

AI日報(bào)：宇樹開源UnifoLM-VLA-0大模型；騰訊“元寶派”內(nèi)測截圖

AI日報(bào)：阿里千問砸30億發(fā)紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經(jīng)典農(nóng)場》官宣2月6日上線

特斯拉ModelS和ModelX項(xiàng)目將終止工廠將轉(zhuǎn)型生產(chǎn)機(jī)器人

REDMI Turbo 5系列今晚發(fā)布：開售即可享國補(bǔ)

雷軍：第一代小米SU7已停售新款SU7預(yù)計(jì)2月13日左右到店

奔馳140歲生日小米汽車向奔馳致敬雷軍：致敬行業(yè)先行者

支付寶「碰紅包卡」上線碰一下即可發(fā)/領(lǐng)紅包

站長商機(jī)

?DeepSeek 發(fā)布 OCR 2：視覺 Token 消耗銳減 80%，文檔解析力超越 Gemini 3 Pro

今日大家都在搜的詞：

熱文

站長商機(jī)

?DeepSeek 發(fā)布 OCR 2：視覺 Token 消耗銳減 80%，文檔解析力超越 Gemini 3 Pro