近日,国际权威AI基准评测组织MLPerf™公布最新AI推理(Inference)V2。1榜单,包括21家世界主流芯片、系统厂商、云厂商参与本次评测,共提交超过5300项结果。在激烈的角逐中,紫光股份旗下新华三集团服务器表现优异,继今年6月在MLPerf™AI训练(Training)榜单中斩获25项第一后,本轮一举夺得数据中心场景任务(Datacenter)和边缘场景任务(Edge)61项世界第一,体现了新华三在人工智能领域深厚的技术积淀和领先实力。
MLPerf™由图灵奖得主大卫•帕特森(David Patterson)联合斯坦福、哈佛大学等顶尖学术机构发起成立,是全球影响力最广的AI性能基准评测。其评测任务与AI领域的前沿应用紧密结合,覆盖当下主流AI应用场景,例如BERT(自然语言处理)、DLRM(推荐)、ResNet(图像分类)、3D UNet(医学图像分割)等,行业用户可根据评测结果了解厂商在AI领域的真正实力,为AI技术的发展和落地提供极大的应用参考价值。
数据中心场景推理任务:34项世界第一
本轮MLPerf™评测,数据中心固定任务分为6个模型,16个测试项,面向多场景对各计算系统进行测试。例如3D UNet(医学图像分割)、RetinaNet(目标检测)和ResNet50(图像分类)测试,重点应用于医学图像分析、自动驾驶、工业质检等场景,是数据中心的典型应用领域,也是MLPerf™竞争最为激烈的主战场。新华三集团AI服务器凭借领先的AI系统设计和全栈优化能力,一举拿下数据中心场景测试34项评测任务世界性能冠军,以及1项绝对配置第一。
在3DUNet模型任务中,R5300 G5在99。9%精度要求下,每秒能处理13。04张3D医疗影像的分割,平均只需十几秒就可以辅助医生完成病灶分析
在ResNet50模型任务中,R5500 G5每秒可对314368张图片进行分类,让以图搜图的等待不再漫长
在RetinaNet模型任务中,R5500 G5每秒可完成对4657。04张图片中的目标进行识别,让交通肇事或生产质量缺陷无处遁形
H3C UniServer R5300 G5作为“推理+训练”的全能型选手,共取得25项同配置第一,实力诠释了其对于大规模、多元化、高复杂度AI场景的支撑能力,可提供1!8、1!4、1!2等多种拓扑配置,灵活适应不同人工智能场景的需求。同时,单机最高支持8块双宽GPU或20块单宽GPU计算加速卡,相当于40台传统服务器的运算速度,全面加速人工智能及深度学习等大规模计算应用场景的运算效率。
边缘场景推理赛道:27项世界第一
在边缘推理赛道,H3C UniServer R5500 G5、R5300 G5、R4900 G5三款AI服务器同样表现出色,在边缘固定任务中共斩获27项世界第一,其中3项绝对配置第一。R5500 G5在本轮推理评测中拿下19项同配置第一,彰显了其在边缘推理场景下的强大竞争力。
R5500 G5针对Transformer架构模型进行优化,为机器视觉、自然语言处理等多种AI业务提供强大支持,在单线程模式下BERT推理时延仅为1。53毫秒。同时,R5500 G5支持全新的多实例GPU特性,可将单颗GPU分割成7个GPU实例,每个GPU实例运行不同应用,极大地提升了GPU的资源利用率,满足业务快速部署的需求。
数字化时代,以人工智能技术加速业务创新已成为行业共识。作为数字化解决方案领导者,未来,新华三集团将继续深耕人工智能领域,依托“云智原生”战略和数字大脑的全栈实力,让内生智能的智慧计算持续赋能百行百业数字化转型,为数字经济的发展注入源源不断的智慧动力。