eNewsTree.com

 找回密码
 立即注册
查看: 283|回复: 0
打印 上一主题 下一主题

被禁还是买 Deepseek传用Nvidia Blackwell打造新模型

[复制链接]
跳转到指定楼层
楼主
发表于 2025-12-10 08:17:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Yahoo






The Information引述知情人士报导,中国AI新创Deepseek正使用被美国禁止出口的辉达Blackwell芯片,打造新模型。 路透


native advertising



The Information引述知情人士报导,中国人工智能(AI)新创Deepseek,正使用数千颗美国禁止输往中国的辉达Blackwell芯片,打造下一款大型模型。这些最新的辉达芯片,将助Deepseek在国内和全球的AI竞赛中保持竞争力。

根据报导,Deepseek已通过一套复杂的走私流程,取得这些先进芯片,部分员工希望能在明年2月的农历春节前推出下一代模型。不过,知情人士表示,Deepseek创办人梁文峰比较重视性能,因此没有硬性规定新模型的截止日期。

这套走私流程包含先将芯片运往获准购买这些芯片国家的数据中心,再拆解含有这些芯片的服务器,并将设备拆解后进口至中国。Deepseek可向一家或多家中国数据中心公司取得这些芯片。

报导指出,Deepseek今年1月凭借其R1深度推理模型一举成名后,至今都只对现有模型进行小幅升级,尚未推出过全新模型。一个可能原因是该公司采用一种名为「稀疏注意力」(sparse attention)的方法,这种方法只使用一部份的模型来回答问题,而非整个模型,可降低推理成本,但也提高了模型开发的挑战性。

不过,Blackwell芯片特别适用于这种技巧,因为此芯片包含的专门设计硬件可加速稀疏运算,运算速度比传统方法快两倍。
收藏收藏 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|手机版|消息树

GMT-8, 2026-1-13 00:39 , Processed in 0.054574 second(s), 15 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表