来自 unsloth 团队的工程师 danielhanchen 分享了 DeepSeek 昨天开源的调度算法 DualPipe 的性能提升对比图。

可以看到使用了DualPipe后,气泡明显减少(空白部分)。而前两种方法流水线空白过多,明显硬件利用率低很多。

1
message-square
0