BitNet 模型又增加了,来看 TII 的 Falcon-E-1B/3B

据官方说这个模型性能与 Qwen3-1.7B 相当,但内存占用仅有 Qwen3-1.7B 的 1/4

如果有同学不知道什么是 BitNet, 它是微软推出的原生 1bit 精度模型框架, 用于推理 1bit 模型

另外 TII 还发布了微调库,可以自己微调,只用N卡就行:github.com/tiiuae/onebitllms 模型地址:huggingface.co/collections/tiiuae/falcon-edge-series-6804fd13344d6d8a8fa71130 Blog地址:falcon-lm.github.io/blog/falcon-edge/ 在线体验 falcon 模型:chat.falconllm.tii.ae

1
message-square
0