eNewsTree.com

标题: 国产AI新星DeepSeek崛起：日活超2000万，或适配国产GPU [打印本页]

作者: pengngychita 时间: 2025-2-5 23:15
标题: 国产AI新星DeepSeek崛起：日活超2000万，或适配国产GPU
歪睿老哥

电子发烧友网报道（文/吴子鹏）在蛇年春节期间，国产AI大模型DeepSeek爆火，频繁登上国内外的热搜榜单，成为科技界最炙手可热的新星。根据第三方统计数据，DeepSeek应用上线仅仅20天，日活用户数量就突破了2000万大关，其日活增长速度已经超过了当初爆火的ChatGPT。

爆火之后，发布DeepSeek的幻方量化旗下AI公司杭州深度求索人工智能（AI）基础技术研究有限公司开始招兵买马，开放了多个岗位的招聘，并且给出了丰厚的薪资报酬。同时，有业内人士指出，DeepSeek或许会接入国产GPU，对国产GPU发展有着积极的带动作用。

DeepSeek现象级爆火后，公司和产业发展都将提速

今年1月20日，DeepSeek正式发布DeepSeek-R1，并同步开源模型权重。据介绍，DeepSeek-R1遵循MIT License，允许用户通过蒸馏技术借助R1训练其他模型。DeepSeek-R1上线API，对用户开放思维链输出，通过设置`model='deepseek-reasoner'`即可调用。

在性能方面，DeepSeek-R1比肩OpenAI的GPT-4。这款AI大模型在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，DeepSeek-R1性能比肩OpenAI o1正式版。同时，由于这款模型采用的是开源策略，因此被认为具有更好的成长性。

目前DeepSeek-R1和更早之前发布的DeepSeek-V3得到了行业的广泛认可，包括京东云、百度云、华为云等云产品都已经接入DeepSeek大模型。以京东云来说，京东云已正式上线DeepSeek-R1和DeepSeek-V3模型，支持公有云在线部署、专混私有化实例部署两种模式。华为云方面，2月1日，华为云宣布经过连日攻坚，双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。同时，英伟达平台也已经宣布上线DeepSeek，英伟达网站显示，DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。根据介绍内容，英伟达认为，DeepSeek-R1模型是最先进、高效的大型语言模型，在推理、数学和编码方面表现出色。

https://user.guancha.cn/main/content?id=1375881

欢迎光临 eNewsTree.com (http://enewstree.com/discuz/)