[第一届晒机大赛]年轻人的第一台HGX
https://cyberbus.net/pictrs/image/57a6e9eb-d384-46e0-90b5-506ae7e1c9bf.jpeg
https://cyberbus.net/pictrs/image/57a6e9eb-d384-46e0-90b5-506ae7e1c9bf.jpeg
如题,现在正值换代窗口期,SM70 SM75价格跳水,于是正好组一台自己玩玩
首先是模组,目前模组价格已经下探到谷底,虽不排除仍有下降空间,但新一轮的制裁也增加了厂商延保的可能性,所以姑且认为价格相对来说还算有吸引力
ES.jpg
机头方面使用的是曙光的x660-g45,Intel平台HGX,复用曙光同代4U GPU X640-G40 主板,但是底层交换板可维护性较低,不能快速拆卸,这里需要点个差评
风扇方面用的是AVC的48V风扇,满载4.3A,整机六个已经比Host端的功耗高了
风扇拉满后有两万转,声音穿透力一般,就是会有些许共振同时,该平台的早起版本使用的是88080,并非主流厂家后期批量出货时使用的88096,因此需要在拓扑设计上作出取舍。虽然说sw直连硬盘并不会带来非常多的性能提升,但莫名其妙吃上的一坨热乎的总会让人觉得哪哪不舒服,比起别家吃着的热乎的饭,总感觉缺了点什么。
在经过沟通后,好消息是后期市售版本已经更换为88096,但是坏消息是不插模组SW不启动,因此下游设备一个认不到,属于是从一个屎坑掉进另一个屎坑了。
在接上模组后,通过BMC可以看到该Delta模组能够被正常识别
快速装好驱动后,才发现NVL并未正常启动
一番查询后得知老黄的NVL在host测有单独fabricmanager驱动包,并不像其他几家直连UB/Inf 等直接就能建链,装好NVL驱动后可正常识别
接下来就是喜闻乐见的测试环节
以及DCGM 虽然这个没输出,但是如果有报错那就是包有问题 https://docs.nvidia.com/datacenter/dcgm/2.4/user-guide/dcgm-diagnostics.html以及喜闻乐见的拉负载环节
以及满负载工况的总输入功率