云天勵飛公布大算力芯片戰略：目標把百萬 Tokens 推理成本降低 100 倍以上

2026-02-05 15:17 · 稿源：站長之家用戶

2月3日，云天勵飛正式舉辦“大算力芯片戰略前瞻會”，首次對外公布未來三年的大算力 AI 推理芯片戰略布局。

會上，云天勵飛提出“訓練追趕、推理超車”的戰略方向，并發布了基于“PD 分離”思路的芯片路線圖:力爭實現百萬 Tokens 推理成本降低100倍以上的目標，推動 AI 從技術嘗鮮走向普惠生產力。

云天勵飛董事長兼CEO陳寧博士發表演講

戰略方向:訓練追趕，推理超車

云天勵飛董事長兼 CEO 陳寧博士在會上指出，訓練芯片與推理芯片在算力需求上存在顯著差異。訓練芯片更側重“絕對值”，對算力規模、帶寬能力以及科學計算的復雜精度要求更高，且對成本相對不敏感;推理芯片的核心考量則在于成本、效率與市場經濟學，關鍵在于每一個 Token 背后的邊際成本與整體性價比。

陳寧表示，公司致力于持續降低百萬 Token 的成本，目標是通過下一代芯片實現“百萬 Tokens 一分錢”。未來三年，公司希望將成本進一步降至“百萬 Tokens0.1分錢”，以加速大模型應用的規模化落地。

對于未來五年的中國芯片產業發展，陳寧提出“訓練追趕、推理超車”的策略:在訓練芯片領域，目標是持續追趕，盡量保持差距不被拉大;而在推理芯片領域，依托中國豐富的應用場景、強大的基礎設施能力以及開源模型生態，有機會實現突破與超車。

云天勵飛董事長兼CEO陳寧博士發表演講

基于“PD分離”架構，三年規劃三代芯片

針對大模型時代云推理場景的需求，云天勵飛 CTO 李愛軍在會上介紹了公司的技術解構與路線圖。

他表示，云天勵飛將全力投入云推理場景的大算力芯片研發，基于對大模型推理計算特征的理解，按照“PD 分離”的系統架構規劃兩類大算力芯片:

P芯片（Prefill）:面向計算密集型需求設計，滿足 Prefill 階段的高算力要求;

D芯片（Decode）:面向訪存密集型需求設計，滿足 Decode 階段的高帶寬需求。

李愛軍介紹，公司在芯片微架構層面針對 Attention 及 AFN 等計算特點進行細粒度分析，并在底層實現針對性優化。在一個包含1024顆芯片的超節點內，P 芯片與 D 芯片可實現有效組合，以滿足大模型云推理的集群化部署需求。

云天勵飛CTO李愛軍介紹公司芯片產品規劃

未來三年，云天勵飛規劃了三代芯片產品:

今年（第一年）:打造第一代超節點 P 芯片，面向百萬級長上下文場景進行 Prefill 推理優化，算力水平對標 Hopper 架構;

明年（第二年）:研發第一代超節點 D 芯片，聚焦 Decode 推理的低時延目標，算力水平對標 Blackwell 架構;

2028年（第三年）:推出第二代超節點 D 芯片，面向毫秒級推理時延目標進一步優化，帶動 Prefill 與 Decode 性能提升，算力層面有望看齊下一代 Rubin 芯片。

云天勵飛高級副總裁、CFO兼董秘鄧浩然介紹公司資本、人才與產能情況

GPNPU架構的四大技術亮點

李愛軍表示，上述路線圖的核心支撐是云天勵飛的GPNPU架構。GPNPU 不僅是處理器架構，也體現了對大模型推理系統架構的整體理解，其主要技術亮點包括四個方面:

GPGPU級通用編程能力（CUDA兼容）:面向國內芯片“易用性”痛點，GPNPU 架構強調對主流 CUDA 等生態的兼容與遷移支持，以降低客戶模型部署與遷移門檻;

極致能效的NPU內核:圍繞推理效率與能效比進行深度優化，提升推理側性價比;

引入3D Memory結構:采用3D Memory 結構，以獲得更高帶寬與更低訪問時延，提升推理效率;

算力積木架構:公司延續過去五年在國產工藝上的探索，以“算力積木”架構定義下一代芯片的 Scale-up 超節點，以滿足萬億級乃至十萬億級 MoE 架構大模型的推理需求。

推理時代的競爭，本質是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩定、足夠易用，AI 才能從“看得見的能力”走向“用得起的生產力”。

未來，云天勵飛將以 GPNPU 架構為核心，大力推進云端大算力芯片，強化軟硬協同與存儲體系攻堅，力爭將百萬 Tokens 推理成本降低100倍以上，推動大模型從示范應用走向規模化交付。

（推廣）

特別聲明：以上內容(如有圖片或視頻亦包括在內)均為站長傳媒平臺用戶上傳并發布，本平臺僅提供信息存儲服務，對本頁面內容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內容可能涉嫌侵犯其知識產權或存在不實內容時，可及時向站長之家提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯系地址）。本網站在收到上述法律文件后，將會依法依規核實信息，溝通刪除相關內容或斷開相關鏈接。

相關推薦

關鍵詞：

硬科技突圍：一顆中國芯片，如何破解AI算力的“存儲墻”難題？

在全球AI算力競爭白熱化的今天，存儲瓶頸正嚴重制約大模型的實際性能。綠算技術公司推出了一款基于自主IP的NVMe-oF橋接芯片原型“擎翼”，旨在將GPU顯存中容量巨大的KV Cache卸載到由標準NVMe SSD構建的存儲池中，并保證訪問延遲低于20微秒。該芯片通過全硬件卸載和零拷貝傳輸，實現了高達489萬IOPS和21.8GB/s的順序讀取帶寬，功耗低于10瓦。這不僅大幅降低了擴展KV Cache至TB級的成本，也為AI大模型的規模化部署提供了關鍵的經濟性保障。此次嘗試標志著AI算力競爭正從單一的“算力芯片競賽”演進到“系統級效率競賽”。

?人工智能競賽 ?存儲墻 ?KV
華為云黃瑾：用AI解行業難題，為客戶打造新質生產力引擎

1月29日，第二屆“新質生產力產業實踐洞見活動”在京舉辦，會上發布了50余個新質生產力產業實踐示范案例，涵蓋人工智能、先進制造、生物醫藥、智能網聯汽車等熱門領域。華為云憑借基于CloudMatrix+AI+Infra的智算云服務，成功入選“人工智能基礎與產業融合”示范案例TOP5，彰顯了中國式AI與產業融合發展新路徑。華為云副總裁黃璜分享了華為云在AI行業應用中的實踐經驗，強調人工智能技術正在系統性重塑千行萬業，實現這一變革的核心在于將算力基礎與行業場景深度結合。華為云通過“深根技術、軟硬協同、架構創新”路徑，持續推動AI從技術能力轉化為解決行業實際難題的價值產出，助力新質生產力實現從試點驗證到規模化落地的關鍵跨越。

?新質生產力 ?人工智能 ?產業融合
從遮蔽到表達：當地板行業迎來它的“新質生產力”

文章回顧了地板行業從古至今的演變歷程：從七千年前河姆渡人以木構技術定義地面空間，到工業革命催生復合地板，再到如今行業面臨消費變革與格局重塑。傳統實木與瓷磚曾主導市場，而強化地板、實木復合等品類則推動市場進入百花齊放階段。當前，以零醛添加、觸感溫潤的石晶地板為代表的新材料，正憑借其環保、耐用、即裝即住等“全能型”產品力，引領行業從“賣材料”向“賣生活方式”的價值升級。文章指出，地板已不僅是功能建材，更是承載健康、適配智能、踐行生態責任的空間表達，其競爭重心正向健康、科技與可持續的新維度遷移。

?地板行業 ?消費變革 ?格局重塑
2025算力100強榜單重磅出爐算子芯片賽道龍頭企業同臺競技

近期，中科院《互聯網周刊》與德本咨詢聯合發布“2025年度算力100強”榜單。榜單全景呈現我國算力產業從數據中心到智算云的全鏈條頭部格局，聚焦量子芯片、國產GPU等核心硬件自主化進展，為行業技術攻關與投資決策提供參考。其中，華為海思、寒武紀、海光信息等企業強勢躋身算力芯片子榜單前十。展望未來，量子芯片、國產GPU等技術攻關將不斷突破瓶頸，為數字經濟發展筑牢底座，賦能相關產業實現更高維度躍遷。

?算力100強 ?數字中國 ?東數西算
2025算力100強榜單重磅出爐算子芯片賽道龍頭企業同臺競技

近期，中科院《互聯網周刊》與德本咨詢聯合發布“2025年度算力100強”榜單。榜單全景呈現我國算力產業從數據中心到智算云的全鏈條頭部格局，聚焦量子芯片、國產GPU等核心硬件的自主化進展，為行業技術攻關與投資決策提供重要參考。其中，華為海思、寒武紀、海光信息等企業強勢躋身算力芯片子榜單前十。展望未來，量子芯片、國產GPU等技術攻關將不斷突破瓶頸，為數字經濟發展筑牢底座，賦能相關產業實現更高維度的躍遷。

?算力100強 ?數字中國 ?東數西算
國產存儲突破：綠算GP7000率先適配英偉達G3層KV Cache架構，AI推理效率提升17倍

2026年1月15日，綠算技術宣布其GP7000全閃存存儲平臺已通過英偉達適配，成為全球首批、也是唯一支持G3級KV Cache分層存儲的國產化方案。該平臺采用存算分離架構，結合以太網閃存簇設計，為下一代AI工廠建設提供關鍵基礎設施支撐，能顯著提升推理吞吐量并降低延遲，實現成本與效率的最優平衡。

?AI推理 ?KV ?Cache
首次用iPhone芯片！蘋果擬推廉價版MacBook

蘋果正計劃推出其首款入門級MacBook，預計售價將低于799美元。這款產品將首次采用iPhone級別的處理器，并標配8GB內存僅為現有MacBook Air和MacBook Pro機型內存配置的一半。據相關消息指出，盡管內存規格有所降低，其運行流暢度預計不會受到顯著影響，并且該設備也將支持蘋果的AI助手Apple Intelligence，以保持在入門級市場的競爭力。據Mirror Daily援引消息人士稱，蘋果對這款低?

?蘋果 ?MacBook ?入門級
2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

AI正從參數比拼轉向賦能實體經濟的“下半場”，行業重心轉向千行百業的規模化應用落地。華為云憑借基于CloudMatrix+AI Infra的智算云服務，成功入選“人工智能基礎與產業融合”示范案例TOP5，彰顯了中國式AI與產業融合發展新路徑。華為云堅持深入產業，解決行業難題，通過“車-網-云”協同的AI無人駕駛全棧方案，賦能礦山、水泥等行業實現降本增效。未來，華為云將繼續堅持“做難而正確的事”，推動AI真正深入行業場景，共同邁向新質生產力發展的下一程。

?新質生產力 ?AI產業融合 ?華為云
男子植入芯片后戒掉20年酒癮：之前日飲3斤現在索然無味

湖北一名男子因長期酗酒，每天要喝2、3斤白酒，多次戒酒均以失敗告終。直到一個月前，他在武漢一家醫院接受戒酒芯片”植入手術后，奇跡發生了他再喝酒就索然無味，困擾多年的酒癮竟瞬間得到控制。所謂戒酒芯片，并非大家認知里的電子芯片，而是鹽酸納曲酮植入劑，通過皮下植入的方式發揮作用。這種芯片通過特殊工藝將鹽酸納曲酮藥物釋放周期最長延長至5個?

?戒酒芯片 ?酗酒治療 ?鹽酸納曲酮
為國產模型和國產芯片造“橋”：昇騰平臺上的DeepSeek-OCR-2遷移實錄

文章講述了使用智子芯元KernelCAT工具，將DeepSeek-OCR-2模型高效遷移至華為昇騰Atlas A2國產芯片的過程。傳統遷移需人工處理代碼依賴、環境配置和算子優化，耗時費力。而KernelCAT作為AI Agent，能自動分析代碼、適配環境、生成補丁，并將通用計算邏輯替換為針對國產硬件的優化實現，最終將推理速度從15 tokens/s大幅提升至550.45 tokens/s，加速超35倍。這展現了未來開發范式：人類定義目標，AI自主解決路徑，讓開發者從底層適配的繁瑣工作中解放出來。

?國產芯片適配 ?模型遷移 ?CUDA依賴

今日大家都在搜的詞：

熱文

3 天
7天

云天勵飛公布大算力芯片戰略：目標把百萬 Tokens 推理成本降低 100 倍以上

硬科技突圍：一顆中國芯片，如何破解AI算力的“存儲墻”難題？

華為云黃瑾：用AI解行業難題，為客戶打造新質生產力引擎

從遮蔽到表達：當地板行業迎來它的“新質生產力”

2025算力100強榜單重磅出爐算子芯片賽道龍頭企業同臺競技

2025算力100強榜單重磅出爐算子芯片賽道龍頭企業同臺競技

國產存儲突破：綠算GP7000率先適配英偉達G3層KV Cache架構，AI推理效率提升17倍

首次用iPhone芯片！蘋果擬推廉價版MacBook

2025新質生產力示范案例發布華為云CloudMatrix AI Infra榮獲人工智能TOP案例

男子植入芯片后戒掉20年酒癮：之前日飲3斤現在索然無味

為國產模型和國產芯片造“橋”：昇騰平臺上的DeepSeek-OCR-2遷移實錄

今日大家都在搜的詞：

熱文

2026支付寶集福正式開啟今年支持掃馬得福玩法

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

余承東公布問界M6實車外觀預計將于今年春季發布

盧偉冰：用戶反饋REDMI Turbo 5 Max幾乎可以做到妥妥用2天

B站將在春晚直播開放真彈幕已與總臺春晚達成合作

iQOO 15 Ultra今日發布主打極致性能

何小鵬：小鵬首款AI新豪華大六座SUV小鵬GX即將面世

2025胡潤中國500強發布：小米首次進入前十

REDMI Turbo 5 Max上線開售16GB+1TB版本首銷價3399元

2026支付寶集福正式開啟今年支持掃馬得福玩法

2026支付寶集福卡明天開啟：19套主題每套1.68元紅包

AI日報：阿里千問砸30億發紅包；快手整治AI魔改；靈光App支持上

馬上偷菜！騰訊《QQ經典農場》官宣2月6日上線

雷軍：第一代小米SU7已停售新款SU7預計2月13日左右到店

AI日報：OpenAI推出macOS版Codex應用；智譜發布0.9B輕量級GLM-

新款聯想拯救者Y700平板官宣3月發布

騰訊回應元寶崩了：目前已經恢復 10億紅包活動太火爆

AI日報：支付寶首次上線AI眼鏡掃福；昆侖萬維發布天工Skywork桌

余承東公布問界M6實車外觀預計將于今年春季發布

站長商機