GitHub 锐评生成器

Limitee · 2 months ago

看起来不错

Limitee · 3 months ago

会赢吗

Limitee · 5 months ago

😂

Limitee · 5 months ago

牛逼

6 months ago

c/dam · 6 months ago

Limitee · 7 months ago

这个好诶😋

Limitee · 7 months ago

不一样的在长上下文的情况下 cpu的tps的损失是很大的 Ktrans这边基本不怎么损失

纯CPU的情况下我们用9375F最高也就跑到了7-10tps（首次提问）用Ktrans的方案是能轻松上15tps的

Limitee · 8 months ago

看来还得做一下后处理,不过目前效果很不错了

edit-2 8 months ago

c/ai_llm · 8 months ago

Limitee · 8 months ago

带alpha通道吗

Limitee · 8 months ago

Limitee · 8 months ago

所以prompt呢(●‘◡’●)

Limitee · 8 months ago

这个不知道好不好用捏

Limitee · 8 months ago

这图差不多是p的了

Limitee · 8 months ago

dify也挺好的配合bgem3

Limitee · 9 months ago

实际情况是官方算子没写好，新版已经取消了mla相关的更新今天刚修完 🫠

Limitee · 9 months ago

实际测下来 0.21效果并不是很好 😂 再优化一段时间吧我甚至遇到死循环了233333

Limitee · 9 months ago

嗯内存带宽始终都是最大瓶颈其次就是cpu了志强支持amx应该会好很多 gpu反倒不怎么吃

9 months ago

c/ai_llm · 9 months ago

Limitee · 9 months ago

消费级板子的layout就是一坨 5.0跑硬盘降速不认卡有很多案例了

Limitee