eNewsTree.com

 找回密码
 立即注册
查看: 101|回复: 0
打印 上一主题 下一主题

DeepSeek十一前献礼?更新版模型上线 使用成本降超50%

[复制链接]
跳转到指定楼层
楼主
发表于 昨天 10:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
世界新闻网






(路透)





在中国即将打开中秋国庆连假之际,DeepSeek推出更新版模型,DeepSeek-V3.2-Exp模型29日正式发布,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。同时还调降了API(应用程序接口)价格,直接让开发者使用成本降低50%以上。实现效率更高、价格更便宜,堪称「价格屠夫」。

综合第一财经、上证报、科创板日报报导,新模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长串行上下文长度。

据悉,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制。DeepSeek表示,这项技术在几乎不影响模型输出效果的前提下,大幅提升长文本场景下的训练和推理效率。

目前DeepSeek官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,随着新技术能让服务成本降低外,DeepSeek也同时将API大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

具体来看,输入价格上,缓存命中时,DeepSeek-V3.2-Exp从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中的价格则从4元/百万tokens降为2元/百万tokens;输出价格上,从12元/百万tokens直接降到了3元/百万tokens。





DeepSeek表示,为了严谨地评估引入稀疏注意力带来的影响,团队将 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

目前,DeepSeek-V3.2-Exp 模型已在Huggingface与魔搭开源,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。API 的模型版本已经更新为 DeepSeek-V3.2-Exp,访问方式保持不变。

今日稍早,有AI业内人士发现,DeepSeek于开源社区平台Huggingface上架了DeepSeep V3.2-base的页面,但很快删除。

DeepSeek每一次更新都成为业界瞩目的焦点,但近几个月以来DeepSeek几次更新都是小版本的迭代,关于V4和R2的呼声也越来越多。不过从这次DeepSeek的发布操作来看,有网友推测近期可能不会看到V4跟R2的推出。
收藏收藏 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|手机版|消息树

GMT-8, 2025-9-30 12:40 , Processed in 0.052716 second(s), 15 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表