面壁智能刚刚发了一堆小模型,包括: MiniCPM4-0.5B/8B/MCP/Survey 等等

  • MiniCPM4-0.5B 是面向端侧设备的,8B是旗舰模型
  • BitCPM4-0.5B/BitCPM4-1B 是类似 bitnet 的1bit 量化模型
  • MiniCPM4-Survey 是个专门用于生成报告的模型
  • MiniCPM4-MCP 是个MCP专用模型

另外还有一些视觉模型组件。目前从跑分上看,与 Qwen3-8B 不相上下,感兴趣的朋友可以试试。

模型地址:huggingface.co/openbmb/MiniCPM4-8B 技术报告地址:github.com/OpenBMB/MiniCPM/blob/main/report/MiniCPM_4_Technical_Report.pdf

1
message-square
0