再来看小米发布的第二个新模型——MiMo-VL-7B-RL
这是个视觉模型,主打视觉推理,宣传也是在7B这个规模达到了领先,另外一个亮点是,它支持UI识别,因此可以当作各种界面操作MCP的前置模型。
由于官方没有放出在线使用地址,以及视觉测试我基本都没什么感知,所以感兴趣的朋友只能自己试试了。
地址:huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL



1
我看有人测了说MiMo-VL没有安全检查,可以直接生成FBI Warning
再来看小米发布的第二个新模型——MiMo-VL-7B-RL
这是个视觉模型,主打视觉推理,宣传也是在7B这个规模达到了领先,另外一个亮点是,它支持UI识别,因此可以当作各种界面操作MCP的前置模型。
由于官方没有放出在线使用地址,以及视觉测试我基本都没什么感知,所以感兴趣的朋友只能自己试试了。
地址:huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL
我看有人测了说MiMo-VL没有安全检查,可以直接生成FBI Warning