Qwen 又发新模型了！ ParScale-1.8B-P1 （P2，P4，P8）

karminski-牙医 · 6 months ago

Qwen 又发新模型了！ ParScale-1.8B-P1 （P2，P4，P8）

William7004 · 6 months ago

后面的结论不太对。非并发下算力利用率通常是比较低的，有人测试过vllm开到32并发对生成时间影响不大。如果是原本没有并发需求的本地部署场景还是比较有优势的，但用api相当于要相应倍数的价格就不如自己用更大的模型。这算是下一代推理模型的一个方向，但比较主流的貌似还是集束搜索。o3/o4mini还是采用了总结思维链的形式，要等deepseek r2出来才能知道具体的技术路线。

alert('beep') · 6 months ago

求一下牙医看网页用的什么翻译插件，看起来很好用的样子。

karminski-牙医 · 6 months ago

搜沉浸式翻译，chrome插件

alert('beep') · 6 months ago

沉浸式翻译感谢~