KTransformers 迎来了 v0.2.1 更新!这个版本增加了 Triton MLA,可以扩展了最大上下文长度,同时还略微加快了预填充和解码的速度。详情见图片
地址:github.com/kvcache-ai/ktransformers

4
KTransformers 迎来了 v0.2.1 更新!这个版本增加了 Triton MLA,可以扩展了最大上下文长度,同时还略微加快了预填充和解码的速度。详情见图片
地址:github.com/kvcache-ai/ktransformers