DeepSeek大模型引發美國關注
DeepSeek大模型的卓越性能引發美國人工智能界關注,其訓練成本遠低于競爭對手,引發美國政府的猜測和調查。
訓練規模存疑
盡管DeepSeek沒有透露詳細的訓練硬件配置,但據稱僅使用了2048顆H800 GPU,在兩個月內訓練了6710億個參數的大模型。
相比之下,Meta使用16381顆H100 GPU訓練了4050億個參數的大模型,耗時54天,訓練成本差異巨大。
潛在的監管漏洞
半導體研究機構SemiAccurate提出,DeepSeek可能囤積了約6萬顆NVIDIA GPU,其中包括H100、A100、H20和H800型號,總成本超過140億元。
美國對中國出口H100和A100 GPU施加限制,但H800一度作為特供版獲得豁免,后也被限制。只有H20完全符合出口規定。
美國懷疑DeepSeek通過新加坡第三方公司獲得了管制出口的H100 GPU,數量可能多達5萬顆。
新加坡收入激增
NVIDIA財報顯示,2022年底,新加坡貢獻的收入僅占9%,而目前已飆升至22%,引發異常疑慮。
調查仍在進行
白宮和FBI等機構正在調查DeepSeek是否通過新加坡獲得了受限的NVIDIA AI GPU。
美國呼吁對新加坡實施更嚴格的出口管控措施,防止受限產品流入中國。
證據不足,NVIDIA回應
截至目前,美國政府尚未發現確鑿證據支持相關指控。
NVIDIA回應稱,其嚴格遵守法律要求,與新加坡的大多數交易均運往其他地區,并非中國。
NVIDIA強調,新加坡相關的收入不表示轉移到中國,其公開文件顯示的是客戶賬單地址,而非發貨地址。
(舉報)
