阿里的移动端多模态大模型APP(完全开源且使用移动端本地的模型哈)——MNN 又更新了！现在支持 Qwen-2.5-omni-3b 和 7b 了。

karminski-牙医 · 1 year ago

William7004 · 1 year ago

今天测试了一下，音频输入用长音频可能有问题。以后如果添加滑动窗口，还是有望在实现实时交互的同时代替常规的ASR/TTS模型。音频输出的问题问过了，实际上还没有添加回放功能。

Anthony-Hoo · 1 year ago

omni模型在本地跑的话，似乎可以做离线的语音翻译器，回头试试看。手机的内存带宽还是瓶颈，也许他这个iOS版本在m系列的iPad上运行更快？