终于有合适的漫画风格绘画模型了

5 months ago

c/ai_llm · 5 months ago

6 months ago

c/ai_llm · 6 months ago

William7004 · 6 months ago

其实前几天就完成更换了，但忘记在这边发。

6 months ago

c/ai_llm · 6 months ago

William7004 · 6 months ago

昨天看到有人提到名称泄露，基本确认kingfall是gemini2.5 ultra。不过个人感觉再出更大参数量的版本意义不大，o3降价后与gemini2.5 pro相当，但仍然比deepseek r1贵几倍。达到这一级别后专注于同参数量下模型迭代，有助于控制成本。

William7004 · 6 months ago

之前在一些讨论看到有人提到名称为kingfall的模型，性能优于gemini2.5系列，可能是gemini3的早期版本。

William7004 · 6 months ago

关闭量化后画质还是有一些问题，后面引入了Accvid，之前Hunyuan Video的Accvid是5步，Fast Video是6到8步，都有一定画质问题。Wan2.1的Accvid改为10步，画质损失比较小。由于速度提高，顺便检查了一下Teacache，发现之前Teacache默认是按图生视频版本的比例的，调整后画质正常了。

William7004 · 6 months ago

后面的视频是关闭量化的。40系开fp8 fastmode的话应该有一定速度提升，但据说画质也差不少。

William7004 · 6 months ago

前两天用起来感觉画质还是差一些，今天发现是模型加载节点选了量化，该节点量化选项对显存占用和速度没影响，但会降低画质。不过文本编码器加载节点还是要开量化以降低显存占用。

6 months ago

c/ai_llm · 6 months ago

William7004 · 6 months ago

现在一共做了15个项目，重新总结一下Deepseek R1 0528在web开发的特点：

一个重要提升是编辑能力有较大改善，使用编程插件时可以进行多轮更改，可用的程序规模大幅增加。
控件和界面编程水平有较大改善，逻辑功能有一定缺陷。
2D内容和程序化生成等方面有较大改善，也降低了对p5js等较易用的库的依赖。虽然不能完全满足需求但考虑修改的情况下可以完成大部分项目。
3D内容的表现仍有较大局限性，不少应用场景相比旧版提升不大，有的项目甚至要用旧版生成的程序作为参考。

William7004 · 6 months ago

昨天主要用官方api开发，主要考虑测试目前api用量是否明显受限，用了7.78元，没有遇到限速问题。今天主要调用openrouter上的免费api，用3个号能覆盖大部分需求。

William7004 · 6 months ago

忘记发地址了，页面地址为https://willian7004.github.io ，项目地址为https://github.com/Willian7004/Willian7004.github.io

6 months ago

c/ai_llm · 6 months ago

7 months ago

c/ai_llm · 7 months ago

William7004 · 7 months ago

后面的结论不太对。非并发下算力利用率通常是比较低的，有人测试过vllm开到32并发对生成时间影响不大。如果是原本没有并发需求的本地部署场景还是比较有优势的，但用api相当于要相应倍数的价格就不如自己用更大的模型。这算是下一代推理模型的一个方向，但比较主流的貌似还是集束搜索。o3/o4mini还是采用了总结思维链的形式，要等deepseek r2出来才能知道具体的技术路线。

William7004 · 7 months ago

层数多可以把引脚做得更密集，主要用于高集成度设备。不过这个层数的确少见。

William7004 · 7 months ago

今天测试了一下，音频输入用长音频可能有问题。以后如果添加滑动窗口，还是有望在实现实时交互的同时代替常规的ASR/TTS模型。音频输出的问题问过了，实际上还没有添加回放功能。

7 months ago

c/ai_llm · 7 months ago

7 months ago

c/ai_llm · 7 months ago

William7004 · 7 months ago

新特性有一定优势，但性能上限相比deepseek r1的提升比较小，与o4 mini还有较大差距。主要优势是30b版本上混合推理或预测解码，在主流配置能部署性能相当于deepseek r1的模型。

William7004 · 7 months ago

感觉还是比较依赖cpu性能，并且30b版本显存足够，纯gpu推理应该更快 🤣 。主要还是希望能在主流配置上（8到12g显存，6到8核cpu带avx2）对30b版本有比较好的推理效果，这样就能做到接近32b版本的效果。

8 months ago

c/ai_llm · 8 months ago

William7004 · 8 months ago

可能是刷分了或者没有对这类任务优化，还是要等更多实测才能确定。

William7004 · 8 months ago

可以一步到位上魔改u（doge）。用桌面u的话看具体的预算节省幅度再决定。

William7004 · 8 months ago

楼主最近开始关注卡片电脑了吗？我最近也了解了一些。树莓派虽然“生态”较好，但做嵌入式linux有内核和驱动开发需求且注重成本控制，通常都用瑞芯微和全志等品牌的。加扩展板用于AI应用的话算力和生态比不上价格接近的香橙派aipro的20tops版本以及英伟达jetson。

William7004 · 8 months ago

有人分析过这类设计，只是处理器数量较多，算力密度没有优势。

William7004 · 8 months ago

长上下文通常用于输入较长的参考资料，用于翻译的话输出长度不够。长上下文，成本更低以及同时在文本和多模态任务有较好表现都是优势。后者此前基本只有闭源模型达到。

William7004 · 8 months ago

两个模型架构不同。demo上的是Lumina-Image-2.0。

9 months ago

c/scavenger · 9 months ago

9 months ago

c/graphic_card · 9 months ago

9 months ago

c/scavenger · 9 months ago

9 months ago

c/ai_llm · 9 months ago

终于有合适的漫画风格绘画模型了

终于有合适的漫画风格绘画模型了

新的高速绘画模型

新的高速绘画模型

新的主力绘画/视频模型

新的主力绘画/视频模型

Wan2.1 14b以及VACE版本测试

Wan2.1 14b以及VACE版本测试

我的GitHub Pages开发终于完成了

我的GitHub Pages开发终于完成了

更快的绘画/视频模型

更快的绘画/视频模型

刚才把主力绘画模型换成HiDream i1了

刚才把主力绘画模型换成HiDream i1了

分享我的两个新项目

分享我的两个新项目

折腾了大半个月，发现好用的绘画和视频模型以前就出了

折腾了大半个月，发现好用的绘画和视频模型以前就出了

分享一下我两台设备的软硬件方案

分享一下我两台设备的软硬件方案

3070m超频记录

3070m超频记录

一次笔记本电脑电源改散热经历

一次笔记本电脑电源改散热经历

Wan2.1 1.3b生成案例

Wan2.1 1.3b生成案例

Karma

Homelab

Trophy Case