👍
👍
PCIe 7.0 规范草案进入最终审阅了
PCIe 7.0 规范旨在支持数据密集型市场领域,如超大规模数据中心、高性能计算(HPC)和军事/航空航天;以及人工智能/机器学习、800G 以太网和云计算等新兴应用。其开发目标如下:
发布啦!感谢贡献♥
大模型竞技场为大家带来 baidu 文心-4.5 和 文心-x1 的写代码评测结果!
简单来讲,这不是个用来写代码的模型。详细评分如 图1. 仅仅比 Gemma-3-27B-it 强一些.
这次评测由 @anthony_hoo@cyberbus.net 同学完成,感谢他的贡献!他的 github 地址是:github.com/Anthony-Hoo
具体评测中: …
微软刚发了一篇论文 KBLaM,可以将外部知识引入大模型
(我简单读了一下应该就是把知识库扔进大模型里面了,不过它的存储是线性增长而非二次方增长,但我估计如果知识库足够大,还是会吃很多显存)
KBLaM 是一种将结构化知识库直接集成到预训练 LLM 中的方法,与传统 RAG 有很大不同:
知识表示方式:KBLaM 将知识三元组(实体-属性-值)转换为连续的键值向量对(使用预训练的句子编码器和轻量级线性适配器) …
AI 眼镜这个概念今年能爆发吗?
又看到个厂商 even realities,发布了他们的 Even G1 日常智能眼镜.
数据参数是:镜片98%透过性,使用绿色Micro-LED,投射(我看产品图感觉是投影式的,而不是眼镜片本身是MicroLED)分辨率640*200,视场25°,刷新率20 Hz,亮度1000 nits ,并且亮度随环境光自动控制,两个麦克风,蓝牙5.2,电池160mAh, 另外眼镜盒能充电,眼睛盒有 2000 mAh。
目前官方演示的功能有:快速笔记,导航,提词器,AI,通知,仪表盘。 …
Unsloth 现在支持微调 Gemma-3 了
他们与 Hugging Face 合作创建了一个免费的笔记本,使用 Gemma 3 和 GRPO 训练你自己的推理模型
另外团推提到:在旧 GPU 上,Gemma 3 的推理和训练都不支持 float16,这个问题影响了所有框架,包括Unsloth、transformers、vLLM 等,如果使用 float16,Gemma 3 会无限激活,因为 float16 的最大范围是 65504,而 Gemma 3 的值达到 800,000 或更大。Llama 3.1 8B 的最大激活值大约是 324。 …
是的,需要增加到src文件夹。另外每个测试需要测试三次turn-1 - turn-3,并且分数最高的后面后缀-high-score 保持同样风格即可
Mistral-Small-3.1-24B-Instruct-2503 的 GGUF量化发布了哈。(昨天刚发布的模型)
地址:huggingface.co/bartowski/mistralai_Mistral-Small-3.1-24B-Instruct-2503-GGUF
HuggingFace 刚出了一个 PDF转 markdown 的小模型——SmolDocling-256M
我试了一下,见图1,大家看看效果
不过这个在线demo并不支持直接上传PDF。所以我估计模型也得先将PDF转换为图片然后再进行识别?
模型地址:huggingface.co/ds4sd/SmolDocling-256M-preview 在线体验:huggingface.co/spaces/ds4sd/SmolDocling-256M-Demo…
牛逼,我的刚跑完还没来得及人肉评分 😇 老铁愿意提交PR吗?我根据结果再人肉复核下,没问题就合并了
NVIDIA DIGITS 详细数据发布啦!
还记得上个月那个128G内存的 NVIDIA DIGITS 吗?
内存带宽273GB/s !!!比我上次听到的消息275GB/s 还缩了2GB/s
(这意味着别说跑 DeepSeek-R1, 跑QwQ-32B-BF16也就每秒钟5个字…) …
其实内存够强,量化版用CPU跑也行
欧洲大模型的一只独苗 Mistral Small 3.1 发布了。
模型大小是24B,128K上下文,支持多模态输入。支持24种语言。其它的嘛。。。没啥了
我近期打算搞一个中模型竞技场,会横评最近的40B以下14B以上的中等大小模型,感兴趣的朋友欢迎关注。
模型地址:huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503 …
Anthropic 要发布 Claude-3.7-sonnet-Max?
这个消息是 cursor 刚发布的新版本的 change log。里面写了为 3.7-sonnet-max做准备。
change log 地址:https://www.cursor.com/cn/changelog
是,感觉大家也都在AI Studio玩文生图
草
哈哈哈哈哈哈哈👍
草
老铁这个是你图被盗了还是是你的号…
笑死。我建议我的数学老师也给我选择题64次机会,我肯定能考满分 😂
猜猜为啥自家的 TREA 编辑器写代码不用豆包 😅
Mellanox其实我觉得是 Broadcom 2 世,我的CX4/CX5 100G都嗷嗷烫
这底座,太巨大了。6代有400瓦吗?
👍可以,还是HBM2E
牛👍
这种纹波咋样?
牛逼👍👍👍👍还得是绿猪
所以评分规则里充分考虑了这种情况,目的就是增加能完整生成20个球和不能生成20个球增加区分度