eNewsTree.com

标题: 国产AI新星DeepSeek崛起:日活超2000万,或适配国产GPU [打印本页]

作者: pengngychita    时间: 2025-2-5 23:15
标题: 国产AI新星DeepSeek崛起:日活超2000万,或适配国产GPU
歪睿老哥

电子发烧友网报道(文/吴子鹏)在蛇年春节期间,国产AI大模型DeepSeek爆火,频繁登上国内外的热搜榜单,成为科技界最炙手可热的新星。根据第三方统计数据,DeepSeek应用上线仅仅20天,日活用户数量就突破了2000万大关,其日活增长速度已经超过了当初爆火的ChatGPT。

爆火之后,发布DeepSeek的幻方量化旗下AI公司杭州深度求索人工智能(AI)基础技术研究有限公司开始招兵买马,开放了多个岗位的招聘,并且给出了丰厚的薪资报酬。同时,有业内人士指出,DeepSeek或许会接入国产GPU,对国产GPU发展有着积极的带动作用。

DeepSeek现象级爆火后,公司和产业发展都将提速

今年1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。据介绍,DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。DeepSeek-R1上线API,对用户开放思维链输出,通过设置`model='deepseek-reasoner'`即可调用。

在性能方面,DeepSeek-R1比肩OpenAI的GPT-4。这款AI大模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1性能比肩OpenAI o1正式版。同时,由于这款模型采用的是开源策略,因此被认为具有更好的成长性。

目前DeepSeek-R1和更早之前发布的DeepSeek-V3得到了行业的广泛认可,包括京东云、百度云、华为云等云产品都已经接入DeepSeek大模型。以京东云来说,京东云已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。华为云方面,2月1日,华为云宣布经过连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。同时,英伟达平台也已经宣布上线DeepSeek,英伟达网站显示,DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。根据介绍内容,英伟达认为,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。

https://user.guancha.cn/main/content?id=1375881




欢迎光临 eNewsTree.com (http://enewstree.com/discuz/) Powered by Discuz! X3.2