eNewsTree.com

 找回密码
 立即注册
查看: 598|回复: 0
打印 上一主题 下一主题

如何以DeepSeek为契机实现信息技术全面超美?

[复制链接]
跳转到指定楼层
楼主
发表于 2025-2-1 03:07:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
纯科学

如果认真读完本文(90%以上普通读者都可以理解清楚),您不仅对人工智能,而且对整个信息技术的认知都可以达到这个领域全球一切博士生导师,甚至院士的层次。



DeepSeek冲击波意味着全球信息技术即将实现基本架构革命,这场革命有两大特征:



硬件体系从算力依赖型转向存储依赖型。



整体架构从硬件依赖型转向编程依赖型。



一、DeepSeek冲击波



一个月前,整个美国军事圈在密集地讨论中国六代机。



半个月前,整个媒体圈在讨论小红书上中美大对账。



现在,整个全球科技圈又在密集地讨论DeepSeek。



DeepSeek V3的发布日期是在2024年12月26日。在DeepSeek V3发布后短短的一个月左右,又连续两个大动作。2025年1月20日发布了DeepSeek R1,这是真正引爆全球的版本,其达到与OpenAI o1版本性能基本相同的程度,但训练成本仅为不到560万美元,只是o1的3%~5%。



请注意,并不是说DeepSeek R1的技术性能远超OpenAI o1,而是在性能基本相同或略好的情况下,其训练成本、训练时间却呈现数量级的下降,这两者带来的结果都是颠覆性的。原因在于:



训练成本极低的主要因素是对算力需求数量级的下降,这样一来,英伟达人工智能算力卡市场需求就会受到极大的冲击。



训练时间从过去6个月下降到只有6天,这会使人工智能软件的迭代速度发生质的变化。6个月的训练时间,简直就是农业领域种子大田实验的周期长度了,一粒水稻种子从发芽、插秧、抽穗、收割的时间也不过如此。早熟型的水稻全部生长周期甚至也就3个月。



任何软件都是需要不断迭代演进的,如果你的软件需要6个月才能完整地运行一次,而我的只要6天,那么你的软件做一次升级后要进行一下测试就得至少等6个月时间,而我的只要6天,那么即使我的软件一开始比你的差很多,要不了几个回合,我已经迭代10次了,你一次都还没迭代完,那你还怎么玩?就算你有天大的编程本事也没法和我竞争。而且DeepSeek还完全开源,这么一搞,全世界所有公司的大模型软件都不得不追随这个技术路线,尤其是技术理念,否则就是农业文明与工业文明相竞争了。



DeepSeek在美国的苹果应用商店上下载量瞬间排名第一。



2025年1月27日,Deepseek引发了美国纳斯达克震动,尤其是受冲击最大的英伟达,股价下跌16.97%,上一个交易日下跌3.12%。1月28日除夕,在美股重挫之后,DeepSeek又发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

https://m.huxiu.com/article/3963658.html
收藏收藏 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|手机版|消息树

GMT-8, 2025-10-15 00:52 , Processed in 0.065043 second(s), 16 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表