阿里云发布神龙异构超算集群,人工智能深度学习训练缩短至分钟级

云计算
3月21日,阿里云发布业内首个公共云异构超算集群——基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。

人工智能正在召唤“神龙”。3月21日,阿里云发布业内***公共云异构超算集群——基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。

阿里云

阿里云发布***异构超算集群

人工智能特别是深度学习,对算力的要求永无止境。但如果只是堆砌芯片,没有低延时网络、高速读写能力,大规模集群无法发挥出***的计算性能,性能损耗通常在50%左右。且算力资源并不丰富,有研究显示,到2030年中国研究人员每人平均只能拥有1-2个GPU,大多数研究将受到计算能力的严重限制。 SCC-GN6是***基于X-Dragon架构的超算异构产品,神龙云服务器与阿里云ECS、GPU云服务器等一起,最多可达512个节点,计算性能依旧接近线性增长,提供堪比超算中心的并行计算资源。

阿里云

神龙异构超算集群性能接近线性增长

这不仅因为支持节点数量多,更因为集成多项自研技术:软硬结合的X-Dragon架构兼具性能和灵活性,50G RDMA超算网络降低网络延时,***IOPS性能的ESSD块存储提供低于百微秒的读写延时,高性能并行文件系统CPFS读写吞吐达1TB/s,分布式加速框架Ali-Perseus对集群内每一颗GPU工作负载进行优化和加速。***可以实现100%的性能提升,从而***限度发挥芯片的计算性能。

以ImageNet竞赛的128万张图片的数据集为例,用普通计算资源训练ResNet50模型,如要达到75%的精度需要数天甚至一周的时间,而使用该神龙异构超算集群产品,模型训练可以缩短到几分钟,大大提升AI算法研发效率,加速业务创新。

阿里云智能创新产品线负责人张献涛表示:“人工智能对算力提出了新挑战,神龙异构超算集群提供了堪比超算中心的并行计算资源,用户可以随时获取高性能计算能力,更不用担心购买、搭建GPU需要耗费的时间成本。”

此外,阿里云还发布了国内***公共云上的轻量级GPU异构计算产品——vGN5i,打破传统直通模式局限,提供比单颗物理GPU更细粒度的服务,从而让用户以更低成本、更高弹性开展业务。

作为国内***、全球前三的云服务商,阿里云于2017年10月发布了全球***新一代“跨界”服务器弹性裸金属服务器神龙X-Dragon,拥有接近物理机的性能以及虚拟机的灵活性,提供了新的计算资源获取方式,已经大规模服务于智能客服助手、智能翻译、无人驾驶、智能推荐等场景。

在2019阿里云峰会·北京上,阿里云还提出未来将围绕IT基础设施的云化、核心技术的互联网化和应用的数据化、智能化,持续推出符合用户需求的产品,同时致力于被生态伙伴集成,不做SaaS并帮助企业做更好的SaaS。除了神龙异构超算集群外,阿里云还发布了新版本POLARDB可兼容Oracle、SaaS加速器和小程序云。

责任编辑:赵立京 来源: 51CTO
相关推荐

2021-11-22 05:45:40

云计算云计算环境NVIDIA

2021-03-30 13:45:00

人工智能

2017-09-14 15:39:05

阿里云异构计算人工智能

2022-11-25 07:35:57

PyTorchPython学习框架

2021-04-16 09:53:45

人工智能机器学习深度学习

2022-11-13 08:11:03

TensorFlow人工智能开源

2021-04-07 10:48:45

人工智能深度学习

2021-02-26 10:02:13

人工智能深度学习机器学习

2021-04-07 10:52:35

人工智能深度学习

2022-10-19 07:04:12

​人工智能云服务Alaas

2021-02-22 10:59:43

人工智能机器学习深度学习

2017-03-18 16:28:40

人工智能机器学习深度学习

2017-05-02 13:45:14

2017-12-21 12:06:15

种地阿里云隆平高科

2011-01-26 09:48:04

IBM沃森

2017-03-16 15:33:09

人工智能融资

2021-12-01 22:55:45

人工智能机器学习深度学习

2017-09-13 10:02:53

人工智能阿里云FPGA

2016-09-01 14:47:56

人工智能机器学习深度学习

2018-05-11 14:34:24

人工智能机器学习深度学习
点赞
收藏

51CTO技术栈公众号