大语言模型推理显卡天梯

karminski-牙医 · edit-2 10 months ago

karminski-牙医 · 10 months ago

deleted by creator

karminski-牙医 · 10 months ago

另外需要注意的是：

不要买Jetson, 虽然显存大, 但是带宽惨不忍睹. 会卡到死.
如果不想垃圾佬(考虑二手残值), 买Mac M2 Ultra是靠谱的选择. MLX目前支持的LLM列表可以在这里找到, 而且我在Twitter上follow的MLX的两个核心贡献者, 他们对新LLM的支持还是挺快的: https://huggingface.co/mlx-community

AlphaArea · 10 months ago