阿里发布最新开源模型成本仅为DeepSeek三分之一(图)

casper · 发表于 2025-4-29 09:06:04

界面新闻

　　阿里巴巴4月29日凌晨发布开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的1／3，成本大幅下降，同时是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，大大节省算力消耗。据官方说法，Qwen3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro同一层级水准。

　　据了解，Qwen3系列模型依旧采用宽松的Apache2.0协定开源，并首次支持119多种语言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用，也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3，夸克也即将全线接入Qwen3。

　　至于Qwen3 的“混合推理”具体说明上，相当于把顶尖的推理模型和非推理模型集成到同一个模型，目前据称热门模型中只有Qwen3、Claude3.7以及Gemini 2.5 Flash可以做到。

　　在“推理模式”下，Qwen3会执行更多中间步骤，如分解问题、逐步推导、验证答案等，给出更深思熟虑的答案；在“非推理模式”下，模型会直接生成答案，让同一个模型内能完成“快思考”与“慢思考”。这类似于人类在回答简单问题时，凭经验或直觉快速作答，面对复杂难题时再深思熟虑，仔细思考给出答案。

　　同时，Qwen3的部署成本还大幅下降，仅需4张H20即可部署Qwen3满血版，显存占用仅为性能相近模型的三分之一。

htchh110 · 发表于 2025-4-30 09:07:42

你那么有钱，没必要吗

		自动登录	找回密码
密码			立即注册

阿里发布最新开源模型 成本仅为DeepSeek三分之一(图)

浏览过的版块

阿里发布最新开源模型成本仅为DeepSeek三分之一(图)