KCORES 大模型竞技场的4个测试案例。(已创建 pull request)
通过火山方舟api直接调用的 Doubao-1.5-pro-32k-250115 版本进行测试,使用默认参数设置,无system prompt

总体表现来说和文心4.5差不多.

而且3次测试,每次都是第一次生成的得分最高,剩余两次要么更烂要么直接报错,但是检查了一下参数也没有变动。
0
KCORES 大模型竞技场的4个测试案例。(已创建 pull request)
通过火山方舟api直接调用的 Doubao-1.5-pro-32k-250115 版本进行测试,使用默认参数设置,无system prompt
总体表现来说和文心4.5差不多.
而且3次测试,每次都是第一次生成的得分最高,剩余两次要么更烂要么直接报错,但是检查了一下参数也没有变动。