有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的

有数据显示 DeepSeek-R1-0528 的后训练数据可能是使用 Gemini 合成的, 之前的旧版R1则是用 OpenAI 模型合成的。图中是一个针对 DeepSeek 输出内容进行聚类的树，可以看到新版的 R1 在输出内容聚类上更靠近 Google Gemini, 而之前的 R1 则更靠近 OpenAI

另外图中一个比较有意思的是, llama 完全是自己搞的. qwen3 则与旧版 R1 更相似.

注意, 这个说到底只是聚类, 怎么解释都有道理, 所以不能当作真正的论据用. 只能大家猜着玩了.

聚类的项目使用: github.com/sam-paech/slop-forensics

You must log in or register to comment.