官方比较的也是之前 DeepSeek-R1 蒸馏的 Qwen2.5-7B, 甚至说 AIME24 数学测试超过了旧版 R1，估计是也没料到 28 号 DeepSeek 发布了新蒸馏的 Qwen3-8B。我把数据整理到一起给大家看。结论就是——没打过 DeepSeek-R1-0528-Distilled-Qwen3-8B. …

karminski-牙医

karminski-牙医MA · 5 months ago

有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的

有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的, 之前的旧版R1则是用 OpenAI 模型合成的。图中是一个针对 DeepSeek 输出内容进行聚类的树，可以看到新版的 R1 在输出内容聚类上更靠近 Google Gemini, 而之前的 R1 则更靠近 OpenAI

…

karminski-牙医

karminski-牙医MA · 5 months ago

DeepSeek-R1-0528 模型上传了哈，不过模型卡还没填写，估计还要再等一会

地址：huggingface.co/deepseek-ai/DeepSeek-R1-0528

…

karminski-牙医

karminski-牙医MA · 5 months ago

AI能挖掘 0-day 漏洞了?

看到个安全研究员的博客, 使用 OpenAI o3 成功发现了个 linux 内核 0-day 漏洞. 当然发现过程并不是直接把内核4000万行代码扔进去. 而是有针对的分析.

blog 作者一直在审查 ksmbd (内核中的 samba3 协议服务器) 相关漏洞, 并且构建相关验证场景. AI 最大的用处是帮助人分析代码, 相关的代码片段大概 3300 行, o3 目前上下文召回也是最强的, 所以很适合这个场景, 然后 o3 就发现了个变量释放的引用计数器bug, 导致其它线程可以访问.

blog详细地址: sean.heelan.io/2025/05/22/how-i-used-o3-to-find-cve-2025-37899-a-remote-zeroday-vulnerability-in-the-linux-kernels-smb-implementation/ …

William7004

William7004 · 5 months ago

更快的绘画/视频模型

由于前段时间使用的Hidream i1 full等模型速度较慢，近期希望查找速度更快的模型用于非正式作品，总体要求是绘画模型在3070m上生成时间10秒内，视频模型单帧生成时间4秒内。

绘画模型用LCM比较快，但有LCM的模型较少，考虑速度因素，选择了以SD1.5为底模的Cyberrealistic v32，在人物等用途的总体效果也优于不少专用模型，只有航拍效果略低于ArchitectureRealMix。30步生成1024x680分辨率的图片在3070m上用时8.2秒。至于其它底模，SANA Sprint速度还要快不少但生成效果较差。

视频模型考虑速度和效果，选择了AnimateLCM SVD xt，是SVD xt的LCM版本，虽然后段画质有一定下降但总体上能用，8步生成1024x680分辨率的视频在3070m上单帧用时3.8秒。至于其它模型，AnimateDiff Lightning和LTX Video 0.9.6速度更快，但前者细节表现较差，后者只适用于部分题材。

以下是几组生成案例： …

AI/LLM

大模型 API 市场解读

大模型 API 市场解读

终于有合适的漫画风格绘画模型了

终于有合适的漫画风格绘画模型了

新的高速绘画模型

新的高速绘画模型

新的主力绘画/视频模型

新的主力绘画/视频模型

Unsloth 刚刚发布了一个强化学习小教程

Unsloth 刚刚发布了一个强化学习小教程

Gemini-2.5-Pro 和 Gemini-2.5-Flash 移除了 Preview 标签了

Gemini-2.5-Pro 和 Gemini-2.5-Flash 移除了 Preview 标签了

meta 刚刚又发了新模型——V-JEPA 2 （Video Joint Embedding Predictive Architecture 2）

meta 刚刚又发了新模型——V-JEPA 2 （Video Joint Embedding Predictive Architecture 2）

盘点一下 火山引擎 | FORCE 原动力大会展厅的 AI 软件

盘点一下 火山引擎 | FORCE 原动力大会展厅的 AI 软件

盘点一下 火山引擎 | FORCE 原动力大会展厅的智能硬件

盘点一下 火山引擎 | FORCE 原动力大会展厅的智能硬件

Intel 展位

面壁智能刚刚发了一堆小模型，包括： MiniCPM4-0.5B/8B/MCP/Survey 等等

面壁智能刚刚发了一堆小模型，包括： MiniCPM4-0.5B/8B/MCP/Survey 等等

一张图搞定结构化3D建模——PartCrafter

一张图搞定结构化3D建模——PartCrafter

Mistral 刚又发了个小模型—— Magistral-Small-2506

Mistral 刚又发了个小模型—— Magistral-Small-2506

Wan2.1 14b以及VACE版本测试

Wan2.1 14b以及VACE版本测试

我的GitHub Pages开发终于完成了

我的GitHub Pages开发终于完成了

再来看小米发布的第二个新模型——MiMo-VL-7B-RL

再来看小米发布的第二个新模型——MiMo-VL-7B-RL

"昨天的我狙击了今天的你"

"昨天的我狙击了今天的你"

有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的

有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的

DeepSeek-R1-0528 模型上传了哈，不过模型卡还没填写，估计还要再等一会

DeepSeek-R1-0528 模型上传了哈，不过模型卡还没填写，估计还要再等一会

AI能挖掘 0-day 漏洞了?

AI能挖掘 0-day 漏洞了?

更快的绘画/视频模型

更快的绘画/视频模型

盘点一下火山引擎 | FORCE 原动力大会展厅的 AI 软件

盘点一下火山引擎 | FORCE 原动力大会展厅的 AI 软件

盘点一下火山引擎 | FORCE 原动力大会展厅的智能硬件

盘点一下火山引擎 | FORCE 原动力大会展厅的智能硬件