1
message-square
4

1
message-square
1

PCIe 7.0 规范草案进入最终审阅了

PCIe 7.0 规范旨在支持数据密集型市场领域,如超大规模数据中心、高性能计算(HPC)和军事/航空航天;以及人工智能/机器学习、800G 以太网和云计算等新兴应用。其开发目标如下:

  • 提供 128 GT/s 原始比特率和通过 x16 配置双向高达 512 GB/s 的传输速率
  • 利用 PAM4(4 级脉冲幅度调制)信号
  • 关注信道参数和范围
  • 提升能效…

2
message-square
0

省流:这两个模型写代码效果较差,文心 4.5 略强于文心 X1。

测试项目 文心4.5 文心X1
Ball Bouncing Inside Spinning Heptagon 23 51
Mandelbrot Set Meet LiBai 52 0
Mars Mission Animation 26 39
Solar System Animation 78 38
2
message-square
5

微软刚发了一篇论文 KBLaM,可以将外部知识引入大模型

(我简单读了一下应该就是把知识库扔进大模型里面了,不过它的存储是线性增长而非二次方增长,但我估计如果知识库足够大,还是会吃很多显存)

KBLaM 是一种将结构化知识库直接集成到预训练 LLM 中的方法,与传统 RAG 有很大不同:

知识表示方式:KBLaM 将知识三元组(实体-属性-值)转换为连续的键值向量对(使用预训练的句子编码器和轻量级线性适配器) …

2
message-square
0

1
message-square
0

AI 眼镜这个概念今年能爆发吗?

又看到个厂商 even realities,发布了他们的 Even G1 日常智能眼镜.

数据参数是:镜片98%透过性,使用绿色Micro-LED,投射(我看产品图感觉是投影式的,而不是眼镜片本身是MicroLED)分辨率640*200,视场25°,刷新率20 Hz,亮度1000 nits ,并且亮度随环境光自动控制,两个麦克风,蓝牙5.2,电池160mAh, 另外眼镜盒能充电,眼睛盒有 2000 mAh。

目前官方演示的功能有:快速笔记,导航,提词器,AI,通知,仪表盘。 …

1
message-square
0

Unsloth 现在支持微调 Gemma-3 了

他们与 Hugging Face 合作创建了一个免费的笔记本,使用 Gemma 3 和 GRPO 训练你自己的推理模型

地址:colab.research.google.com/github/unslothai/notebooks/blob/main/nb/HuggingFace Course-Gemma3_(1B)-GRPO.ipynb

另外团推提到:在旧 GPU 上,Gemma 3 的推理和训练都不支持 float16,这个问题影响了所有框架,包括Unsloth、transformers、vLLM 等,如果使用 float16,Gemma 3 会无限激活,因为 float16 的最大范围是 65504,而 Gemma 3 的值达到 800,000 或更大。Llama 3.1 8B 的最大激活值大约是 324。 …

1
message-square
0

更多 NVIDIA DIGITS 的图

2
message-square
1

NVIDIA DIGITS 详细数据发布啦!

还记得上个月那个128G内存的 NVIDIA DIGITS 吗?

内存带宽273GB/s !!!比我上次听到的消息275GB/s 还缩了2GB/s

(这意味着别说跑 DeepSeek-R1, 跑QwQ-32B-BF16也就每秒钟5个字…) …

1
message-square
2

NVIDIA 刚发布了一个 Llama-3.3-Nemotron-Super-49B-v1 模型。

这是一个基于llama-3.3的推理模型,这个模型是通过他们整理的蒸馏数据 (来自这些模型: Llama-3.3-70B-Instruct, DeepSeek-R1, Qwen-2.5-Math-7B-Instruct, Qwen-2.5-Coder-32B-Instruct 等等)

另外强调了这个模型适用于RAG,并且可以商用。(以下分数均开启推理模式)AIME25 分数大概是 58.4 (QwQ-32B 是60),GPQA66.67 (QwQ-32B 是 65.2),看测评跟QwQ-32B不相上下。

总之我已经在做中模型竞技场了。各位可以等一个中模型水平横评。 …

1
message-square
1

1
message-square
0

另外 NVIDIA RTX PRO 6000 Blackwell 反而超出预期,96GB显存给到后,带宽来到了1.6TB/s

1
message-square
0

1
message-square
0

4
message-square
0

4
message-square
0

3
message-square
1

草,我刚看到了Gemini-2.0-Flash-Image-Generation 的最佳使用场景,真的心动了。

用 RPG Maker 的 tile set 来制作地图!我生成了几张大家看看效果。真的很好玩!

7
message-square
4

RTX PRO 6000 X Blackwell 96GB 的最新网传游戏性能截图

1
message-square
0

1
message-square
0