从 Micron 的 brief 来看, 最高频率可以达到 8800 MT/s.

但是从苹果 M2 Max 的 400GB/s 的 LPDDR5 内存来看 (512 bits × 6400MT/s LPDDR5 ≈ 400GB/s). 如果提升到 8800MT/s, 也就大概是 450GB/s. 还不如两个 M2 Max 粘起来的 M2 Ultra 快. 不过即使是 M2 Ultra, 根据我和 @AlphaArea@cyberbus.net 的测算, 运行 Llama 3 的理论极限也就 17 token/s. 基本上属于只能个人玩玩, 完全没办法用于企业级 LLM 推理生产. 更别提训练了…

更重要的是, 这东西即使投产, 垃圾佬能玩到估计也要3-5年后了…

1
message-square
1
  • hqshi
    17 days ago

    非常坏评论,恨来自intel。

    by intel砍刀部