大模型竞技场为大家带来 baidu 文心-4.5 和 文心-x1 的写代码评测结果!
简单来讲,这不是个用来写代码的模型。详细评分如 图1. 仅仅比 Gemma-3-27B-it 强一些.
这次评测由 @anthony_hoo@cyberbus.net 同学完成,感谢他的贡献!他的 github 地址是:github.com/Anthony-Hoo
具体评测中: …

PCIe 7.0 规范草案进入最终审阅了
PCIe 7.0 规范旨在支持数据密集型市场领域,如超大规模数据中心、高性能计算(HPC)和军事/航空航天;以及人工智能/机器学习、800G 以太网和云计算等新兴应用。其开发目标如下:
- 提供 128 GT/s 原始比特率和通过 x16 配置双向高达 512 GB/s 的传输速率
- 利用 PAM4(4 级脉冲幅度调制)信号
- 关注信道参数和范围
- 提升能效…

省流:这两个模型写代码效果较差,文心 4.5 略强于文心 X1。
测试项目 | 文心4.5 | 文心X1 |
---|---|---|
Ball Bouncing Inside Spinning Heptagon | 23 | 51 |
Mandelbrot Set Meet LiBai | 52 | 0 |
Mars Mission Animation | 26 | 39 |
Solar System Animation | 78 | 38 |
微软刚发了一篇论文 KBLaM,可以将外部知识引入大模型
(我简单读了一下应该就是把知识库扔进大模型里面了,不过它的存储是线性增长而非二次方增长,但我估计如果知识库足够大,还是会吃很多显存)
KBLaM 是一种将结构化知识库直接集成到预训练 LLM 中的方法,与传统 RAG 有很大不同:
知识表示方式:KBLaM 将知识三元组(实体-属性-值)转换为连续的键值向量对(使用预训练的句子编码器和轻量级线性适配器) …

AI 眼镜这个概念今年能爆发吗?
又看到个厂商 even realities,发布了他们的 Even G1 日常智能眼镜.
数据参数是:镜片98%透过性,使用绿色Micro-LED,投射(我看产品图感觉是投影式的,而不是眼镜片本身是MicroLED)分辨率640*200,视场25°,刷新率20 Hz,亮度1000 nits ,并且亮度随环境光自动控制,两个麦克风,蓝牙5.2,电池160mAh, 另外眼镜盒能充电,眼睛盒有 2000 mAh。
目前官方演示的功能有:快速笔记,导航,提词器,AI,通知,仪表盘。 …
Unsloth 现在支持微调 Gemma-3 了
他们与 Hugging Face 合作创建了一个免费的笔记本,使用 Gemma 3 和 GRPO 训练你自己的推理模型
另外团推提到:在旧 GPU 上,Gemma 3 的推理和训练都不支持 float16,这个问题影响了所有框架,包括Unsloth、transformers、vLLM 等,如果使用 float16,Gemma 3 会无限激活,因为 float16 的最大范围是 65504,而 Gemma 3 的值达到 800,000 或更大。Llama 3.1 8B 的最大激活值大约是 324。 …

NVIDIA DIGITS 详细数据发布啦!
还记得上个月那个128G内存的 NVIDIA DIGITS 吗?
内存带宽273GB/s !!!比我上次听到的消息275GB/s 还缩了2GB/s
(这意味着别说跑 DeepSeek-R1, 跑QwQ-32B-BF16也就每秒钟5个字…) …

Mistral-Small-3.1-24B-Instruct-2503 的 GGUF量化发布了哈。(昨天刚发布的模型)
地址:huggingface.co/bartowski/mistralai_Mistral-Small-3.1-24B-Instruct-2503-GGUF

HuggingFace 刚出了一个 PDF转 markdown 的小模型——SmolDocling-256M
我试了一下,见图1,大家看看效果
不过这个在线demo并不支持直接上传PDF。所以我估计模型也得先将PDF转换为图片然后再进行识别?
模型地址:huggingface.co/ds4sd/SmolDocling-256M-preview 在线体验:huggingface.co/spaces/ds4sd/SmolDocling-256M-Demo…

欧洲大模型的一只独苗 Mistral Small 3.1 发布了。
模型大小是24B,128K上下文,支持多模态输入。支持24种语言。其它的嘛。。。没啥了
我近期打算搞一个中模型竞技场,会横评最近的40B以下14B以上的中等大小模型,感兴趣的朋友欢迎关注。
模型地址:huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503 …
