eNewsTree.com

 找回密码
 立即注册
查看: 484|回复: 0
打印 上一主题 下一主题

成本低廉 中国AI初创DeepSeek震撼硅谷

[复制链接]
跳转到指定楼层
楼主
发表于 2025-1-27 08:53:03 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
财联社





中国AI新创公司DeepSeek先后发布两款大模型,由于成本低廉,性能与OpenAI相当,中媒指此举引发硅谷震惊,甚至引发Meta内部焦虑。(DeepSeek官网)




中国AI新创公司「深度求索」(DeepSeek)近期先后发布「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于成本低廉,性能与OpenAI相当,让硅谷震惊,甚至引发Meta内部的恐慌。分析认为,总部位于杭州的DeepSeek可能将改写AI大模型领域的游戏规则。

财联社报导,甚至有投资者将辉达上周五重挫3.12%的原因指向DeepSeek的一夜爆火。德国「世界报」知名市场评论员Holger Zschaepitz表示:「中国的DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。」

据报导,DeepSeek仅用2048片H800显卡 (GPU)、耗时两个月,就训练出了一个6710亿参数的DeepSeek-V3。相较于Meta训练参数量4050亿的Llama 3,用了1万6384片更强的H100显卡,花了54天。DeepSeek的训练效率提升了11倍。

中媒「每日经济新闻」26日报导称,在川普总统宣布5000亿美元的「星际之门」(Stargate)发展人工智能基础建设计划之际,DeepSeek以极低的价格创建了突破性的AI模型,且未使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有效的方法?

报导回顾,去年12月27日,DeepSeek推出开源模型「DeepSeek-V3」。AI系统排名网站「聊天机器人竞技场」(Chatbot Arena)显示,「DeepSeek-V3」在所有模型中排名第七,在开源模型排第一。且「DeepSeek-V3」是全球前十中,性价比最高的模型。


native advertising



不到一个月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日「DeepSeek-R1」在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型、OpenAI推出的o1并列。同时,测评机构「Artificial-Analysis」对「DeepSeek-R1」的初始基准测试结果也显示,「DeepSeek-R1」在AI分析质量指数中取得第二高分,价格则是o1的约30分之1。

「每日经济新闻」称,24日一篇发布在匿名平台teamblind上的文章疯传,一位自称是Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,「DeepSeek-V3」在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家「仅用550万美元训练预算的中国公司」就做到了这一点。

该匿名文指,工程师正争分夺秒分析DeepSeek,试图拷贝其中的一切可能技术。另外,「DeepSeek-R1」的出现,也让情况更加严峻。

然而,美国人工智能数据基础设施新创公司Scale AI首席执行官Alexandr Wang最近接受CNBC采访时爆料,DeepSeek拥有大约五万个辉达最先进的H100 GPU,并指「但是很明显他们不能说出来,因为这违反了美国所实施的出口管制,我相信他们拥有比外界想像的更多,他们未来会被芯片管制,和出口管制所限制」。
收藏收藏 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|手机版|消息树

GMT-8, 2025-10-15 02:28 , Processed in 0.062765 second(s), 15 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表