Llama-4可能要来了!
我在 ChatbotArena 随机测试的时候发现了2个新的 llama 模型:
代号跟别是 spider, cybele. 其中: cybele 这个模型输出特别慢,可能是个特别大的模型?400B+? 而spider特别话痨,输出了特别多并不需要的信息,可能用来创意写作会好一些,但是正常任务绝对不适合。
另外还有人随机到了一个叫 themis 的模型,不过我没随机到。
所以目前来看,可能的信息有:会发布3个模型,以及 llama-4 维持了既定路线?即仍然训练70B左右的大模型为主,而不是收到 DeepSeek 刺激迅速转到 MoE 路线。




0