_neotoc/ask_anything•为啥open-webui 首字延迟特别大?15 days ago默认就是int4版本。是不是think部分没展示出来,你直接在命令行运行试试看。模型加载也需要时间的。
有点意思