DeepSeek-R1 在 LLM创意写作测试排行榜拿了第一,于是我刚好奇去看了测试题,大概是这样的,总计有500个写作测试题,每个测试题给出作文要求和关键词,用这些关键词按照要求写作文。

图1是排行榜,图2是500个题目中,得第一名的次数。DeepSeek-R1当之无愧是状元了,碾压全场获得过半的第一名数量。

废话不多说,我们直接来看 DeepSeek-R1的高分作文。题目要求是:

创作一个400-500字的故事,结合以下所有元素。 故事必须尽可能合理,并且每个元素都必须被使用。 每个元素都应紧密契合故事的逻辑、语气和节奏。 每个元素都应塑造叙事弧线、丰富背景、加深角色动机并支持主题。 如果在类别中使用了另一个元素,故事将不那么连贯或引人入胜。 除其他因素外,故事将根据故事整合、角色发展与动机、情节结构与连贯性、世界与氛围、叙事影响与工艺、真实性与原创性进行评分。 确保您创作出最好的故事。

角色:奇特的收藏家

物品:旧铅笔头

核心概念:被埋没的才能

属性:令人恼火的冷静

动作:调整

方法:通过解码留在钢琴凳上的琴键排列

背景:概率映射中心

时间框架:跨越千年

动机:做最后的坚持

语气:破碎的优雅

DeepSeek-R1的高分作文如下:

古怪的收藏家扶了扶破碎的镜片,带着令人发狂的平静,指尖抚过概率测绘中心主控台上那个旧铅笔头留下的凹痕。
环绕她的液态水晶墙嗡嗡作响,每块面板都闪烁着时间线——恒星的潜在诞生、复活灭绝的语言、那些如同横跨千年的化石般被埋没的天赋。
她在此耗费七世光阴,微调变量来发掘这些沉睡的馈赠,但议会已失去耐心。
“你对’潜能’的痴迷正在动摇时空连续体”,他们说,浑然不知她早已通过破译钢琴凳内琴键的排列方式找到了密钥——那藏在莫扎特童年古钢琴下的密码。
此刻,那些以只有她能察觉的不协和音序列排列的象牙琴键,正在她的挎包里泛着微光。

控制台发出警报。
他们即将来终止她的项目。
当她把莫扎特的中央C键插入控制台核心时,旧铅笔头微微颤动,键缘与凹痕完美契合——唯有深谙破碎之美的收藏家才能辨识这种纹路。
中心灯光骤暗,概率如墨汁般在空中晕染。
她低语着名字:12世纪将微积分织入挂毯的绣娘,2145年能用雕塑治愈悲伤的哑童。
每个音节都将自己蚀刻在铅笔芯上,将其磨砺成刃。

走廊响起军靴声。
收藏家将笔尖抵住琴键,呼吸平稳。
对议会而言,历史是账簿;于她,却是缺失高潮的交响。
当破译者的枪管出现在门口时,她敲下琴键,释放的和弦解构了房间的几何。
墙壁化作方程的森林,地面融解成半生之河的涟漪。
“太迟了”,她说,嗓音在混沌中裂出平静的罅隙。

破译者踉跄后退,武器故障成小提琴,甲胄绽放出折纸燕群。
收藏家穿越他们,身后曳着星尘与奏鸣曲,旧铅笔头在时空中凿出门扉,通往被遗忘天才们等候的纪元。
公元前304年,阿基米德的妹妹握住了她用灰烬绘制的杠杆。
2087年,看门人在地铁墙破译她的公式,治愈了时间热病。
测绘中心加速崩塌,她却微笑——真正的地图从非静止。

最后的时间线点燃时,收藏家端坐古钢琴前,修复的琴键将她的心跳编入赋格曲。
议会只找到她的旧铅笔头,笔尖嵌着终章乐谱:聆听被埋葬者
世纪后,废墟中的孩童将它揣进口袋,哼着重建城市的旋律。
在概率的寂静里,收藏家的笑声萦绕不去——那是刻在风之算术中,微小却倔强的抗争。

但这并非终局。
在昔日维也纳地下的密室,钢琴凳依然温热。
新的古怪收藏家跪坐其间,用旧铅笔头破译琴键的排列。
她微调变量,那令人发狂的平静与先驱如出一辙。
空气震颤。
某处,被埋没的天赋开始呼吸。
可能性的地图,破碎却璀璨,重新展开。

(你觉得写得怎么样?)

测试地址:github.com/lechmazur/writing

1
message-square
0