"昨天的我狙击了今天的你"

“昨天的我狙击了今天的你”

小米刚刚发布了两个新模型，我来给大家分别介绍，这个是第一个—— MiMo-7B-RL-0530

这是一个文本推理模型，跟 DeepSeek-R1 是一个类型。小米宣称这个新模型在 7B 规模这个是目前最强的模型。

官方比较的也是之前 DeepSeek-R1 蒸馏的 Qwen2.5-7B, 甚至说 AIME24 数学测试超过了旧版 R1，估计是也没料到 28 号 DeepSeek 发布了新蒸馏的 Qwen3-8B。我把数据整理到一起给大家看。结论就是——没打过 DeepSeek-R1-0528-Distilled-Qwen3-8B.

MiMo-7B-RL-0530：我明明是5月30号出生的，却被一颗来自5月28号的子弹打到了…

模型地址: huggingface.co/XiaomiMiMo/MiMo-7B-RL-0530