有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的, 之前的旧版R1则是用 OpenAI 模型合成的。图中是一个针对 DeepSeek 输出内容进行聚类的树,可以看到新版的 R1 在输出内容聚类上更靠近 Google Gemini, 而之前的 R1 则更靠近 OpenAI

另外图中一个比较有意思的是, llama 完全是自己搞的. qwen3 则与旧版 R1 更相似.
注意, 这个说到底只是聚类, 怎么解释都有道理, 所以不能当作真正的论据用. 只能大家猜着玩了.
聚类的项目使用: github.com/sam-paech/slop-forensics

0