宝德作为国内优秀服务器厂商之一,凭借多年来积累的行业经验与资源,与Intel、NVIDIA等国际大厂深度合作,并成为国内为数不多的代理商之一。此次针对该公司的特殊要求,宝德工程师为其推荐了NVIDIA DGX系列产品,包括一台DGX-1、两台DGX-Station。因为深度学习神经网络尤其是几百上千层的神经网络需对计算和吞吐能力的需求非常高,GPU对处理复杂运算拥有天然的优势,出色的浮点计算性能,可以同时保证分类和卷积的性能以及精准度,所以搭载GPU的超级计算机是训练各种深度神经网络的不二选择。
自动驾驶所需要的运算能力体现在云端和终端两个方面:终端运算平台主要负责通过传感器数据感知周围的环境,用高精度地图实时定位,并按照算法模型做出驾驶决策。而在云端,则需要数据处理能力超强的数据中心。所有与云端连接的车辆都会将自己的行驶数据上传到这里。而云端的任务则是利用这些大量的数据,通过深度学习或者增强学习的形式去训练决策和感知的算法模型。经过训练优化的算法模型在经过稳定性验证后将会被重新更新到各个车辆终端中,这就是未来自动驾驶所使用的自我优化体系。
NVIDIA DGX-Station
在DGX系列产品中,DGX-1相当于把250台服务器装在了一个盒子里,它配备了7TB固态硬盘,8块Tesla P100显卡和2块英特尔Xeon处理器——如此的配置也给起带来了超高的处理性能(170万亿次浮点运算/秒),是上代机型的12倍。而DGX-STATION则拥有高达480 万亿次浮点运算性能,是目前首款也是唯一一款基于4 个Tesla® V100-加速器构建的工作站,同时采用了下一代NVLink™ 以及全新Tensor核心架构等创新技术。相较现今最快的GPU工作站,深度学习训练性能提升了3倍;相较20节点Spark服务器集群,大数据集分析速度提高100倍;由于采用NVIDIA NVLink技术,I/O 性能较之通过PCIe方式相连的GPU 提升5倍;在深度学习训练方面实现最大通用性,每秒可以推理30,000 张图像。NVIDIA DGX系列超级计算机为该公司提供了海量数据和强大的计算能力,使其可以在深度神经网络的基础上进行快速的机器学习。