eNewsTree.com
标题:
被禁还是买 Deepseek传用Nvidia Blackwell打造新模型
[打印本页]
作者:
casper
时间:
2025-12-10 08:17
标题:
被禁还是买 Deepseek传用Nvidia Blackwell打造新模型
Yahoo
The Information引述知情人士报导,中国AI新创Deepseek正使用被美国禁止出口的辉达Blackwell芯片,打造新模型。 路透
[ad5] [/ad5]
The Information引述知情人士报导,中国人工智能(AI)新创Deepseek,正使用数千颗美国禁止输往中国的辉达Blackwell芯片,打造下一款大型模型。这些最新的辉达芯片,将助Deepseek在国内和全球的AI竞赛中保持竞争力。
根据报导,Deepseek已通过一套复杂的走私流程,取得这些先进芯片,部分员工希望能在明年2月的农历春节前推出下一代模型。不过,知情人士表示,Deepseek创办人梁文峰比较重视性能,因此没有硬性规定新模型的截止日期。
这套走私流程包含先将芯片运往获准购买这些芯片国家的数据中心,再拆解含有这些芯片的服务器,并将设备拆解后进口至中国。Deepseek可向一家或多家中国数据中心公司取得这些芯片。
报导指出,Deepseek今年1月凭借其R1深度推理模型一举成名后,至今都只对现有模型进行小幅升级,尚未推出过全新模型。一个可能原因是该公司采用一种名为「稀疏注意力」(sparse attention)的方法,这种方法只使用一部份的模型来回答问题,而非整个模型,可降低推理成本,但也提高了模型开发的挑战性。
不过,Blackwell芯片特别适用于这种技巧,因为此芯片包含的专门设计硬件可加速稀疏运算,运算速度比传统方法快两倍。
欢迎光临 eNewsTree.com (http://enewstree.com/discuz/)
Powered by Discuz! X3.2