小米大模型突然登顶一项测试，用了DeepSeek的方法

pengngychita · 发表于 2025-3-17 04:32:57

来源：观察者网

3月17日，小米官方透露，其大模型团队在音频推理测试集MMAU榜单登顶，并强调“DeepSeek-R1的发布为我们在该项任务上的研究带来了启发”。

MMAU是一个侧重考察音频大模型理解和复杂推理能力的测试集，包含27种不同的任务，一万条涵盖语音、环境声和音乐的音频样本。

例如，其中一个任务是要求从一段10多秒的语音中，数出包含至少一个重读音素的单词数量；另一个任务是根据一段美剧《生活大爆炸》中的对话，解释其中一句话为什么是讽刺。

这是一个难度较高的测试集，人类专家的测试准确率为82.23%。而目前榜单上最强的大模型是谷歌Gemini 2.0 Flash，准确率55.6%。

小米大模型则达到了64.5%的准确率，较其它大模型有显著提升。其参数量更是只有7B，是一个非常轻量化的模型。

https://www.guancha.cn/economy/2025_03_17_768727.shtml

		自动登录	找回密码
密码			立即注册

小米大模型突然登顶一项测试，用了DeepSeek的方法

浏览过的版块