人工智能技术网

为人工智能而生 IBM日前宣布推出装有最新POWER9处理器

  众所周知,人工智能的三大要素是算法、数据和计算。特别是随着人工智能深度神经网络的快速发展,更大的数据量,更深的算法模型、更复杂的计算架构正在成为新的趋势。

    在这种背景之下,如果计算力不能实现不断的增长,那么整个深度学习的过程将变得“无比漫长”,很多人工智能的应用也将无法快速落地。从某种程度上可以说,人工智能对计算力的需求是永无止境的,其挑战也是空前严峻的。

   所以,当IBM日前宣布推出装有最新设计的POWER9处理器的新一代Power Systems服务器上市时,也就有了更多解读的价值和意义。

    在我看来,专为计算密集型人工智能工作负载而设计的全新POWER9系统,为降低人工智能的计算门槛以及提供更多计算方式的选择,提供了重要的支撑。更为重要的是,IBM在POWER9上的一系列的技术创新,无疑为开启全面AI时代,助力中国成为数字化转型浪潮中的赢家打下了坚实基础。

POWER9为人工智能而生

    实际上,如果从计算力层面看,人工智能对于计算力的要求确实不同于以往的应用需求,如何为深度学习提供源源不断的“动力”是业界的一大挑战。

     确实如此,随着更多的人工智能应用出现,传统的计算平台也会遇到很多瓶颈,比如数据的瓶颈、计算能力的瓶颈、延迟的瓶颈、通信能力的瓶颈等等。这里有三个核心的问题:第一处理单元能多快速度的取到它处理的数据;第二每次处理之后能以多快的速度去交换数据;第三是在单位的空间内能集成多少计算能力。

IBM大中华区科技合作部副总裁

Mary Couche

正如IBM大中华区科技合作部副总裁Mary Coucher所言,尽管计算已经有了快速的发展,但面对人工智能这样一个蓬勃发展的需求,仍然面临着许多挑战。因此,早在四年前IBM开始着手研发POWER9芯片时,就为人工智能的需求做了专门的优化和设计。

以最新发布的IBM AC922 Power Systems服务器为例,它基于全新POWER9设计,是首批嵌入PCI-Express 4.0、新一代NVIDIA NVLink及OpenCAPI的系统,这几项技术的结合使其能够加速数据传送,在计算速度方面超出基于PCI-E 3.0的x86系统9.5倍;此外,它还可将深度学习系统时效提高近四倍,可以帮助企业以更快的速度更准确地部署人工智能应用。

对此,IBM杰出工程师、大中华区硬件系统部首席技术官李永辉表示,POWER9在芯片制造、计算能力、内存容量、网络连接等诸多方面都做了重大升级和革新,具体来说:

999.jpg

一是,全新POWER9处理器采用14纳米技术的制造工艺,在AC922系统中,最多可以支持24个核,比POWER8中的12核多了一倍,大大提高了计算能力。此外,IBM还为POWER9做了面对不同应用需求的设计,既有针对高端的Scale-up的设计,也有针对水平扩展的Scale-out设计,为市场提供了更加多样化的选择。

二是,全新POWER9每插座支持最高1TB内容容量,而将来可以扩展更多。1TB及将来更多内存容量带来的好处在于,IBM可以通过I/O加速的能力,把GPU中的内存,即图像内存(Graphical Memory)拓展到实际内存库中的内存里去,形成UMA(Unified Memory Access)模型,从而让GPU和CPU的内存产生一个共享的方式,这大大提高了计算中的处理能力,解决了大规模计算中难题。

三是,全新POWER9还支持四种不同的网络连接能力,包括支持新一代PCIe Gen4技术,它比上一代速度快了1倍;支持CAPI 2.0,并且兼容CAPI 1.0,这个技术可以跟CPU的总线结合,加速通讯之间的连接能力;支持OpenCAPI,实现了新一代I/O连接技术的迭代;支持新一代的NVLink的加速技术。

不难看出,全新POWER9的发布并不是一个单纯的芯片迭代,而是在计算领域上开启了新的技术创新,为高性能计算、超大规模的人工智能应用提供了强大的计算能力,更真正推动了加速计算新时代的到来。

降低人工智能计算门槛

当然,在人工智能的发展中,除了计算平台之外、系统管理、计算框架、应用方案也是推动人工智能应用不可或缺的几个重要环节,而在这方面IBM同样也做了很多深入的布局。

IBM杰出工程师、大中华区硬件系统部

首席技术官李永辉

例如,IBM支持各种不同类型的深度学习算法,包括CAFFE、Chainer、TensorFlow、Theano、Torch、cuDNN、NVIDIA DIGITS以及其它若干个机器学习与深度学习架构和库,能够显著降低企业在Power系统上部署这类开源架构时的复杂性和风险,同时还考虑到企业级应用的需求和服务支持等。

此外,IBM还在此基础上不断实现功能性的增强,今年12月,IBM对外发布了Deep Learning Impact技术,可以把人工智能的计算框架水平扩展到多台机器中去。

“通过Deep Learning Impact技术,IBM可以帮助用户打通所有的计算平台,形成一个AI的资源池,所以用户将来的应用提交到多少GPU上去都可以跑起来,如果一个不够可以给两个,两个不够可以给三个,这不仅加快了速度,也满足了多租户场景的使用。”李永辉说。

不仅如此,IBM还提供Hyper-parameter Search能力,可以帮助客户实现最优的超参设置。确实如此,在人工智能算法中如果选择的超参是错的,那么用户跑了一半或者跑了半个礼拜才发现有问题,那就需要重新设计,整个开发应用的周期就太慢了,而IBM提供的工具可以自动化帮助用户做一个超参的首选,无疑大大提高了整个深度学习的过程和时间。

IBM副总裁、大中华区硬件系统部总经理侯淼

在IBM副总裁、大中华区硬件系统部总经理侯淼看来,IBM和NVIDIA针对AI能力的优化以及性能提升也值得一提。

据了解,NVLink技术发布于2014年的GTC大会,当时IBM便宣布了将把NVLink技术融入到POWER CPU当中,NVLink技术能够将POWER CPU与NVIDIA GPU紧密结合,由于目前x86服务器还不支持NVLink互联,这也形成了POWER系统独有的能力。

特别是在最新的POWER9中,通过NVLink技术IBM在2U的空间中,实现了6个GPU的互联,由此比上一代提供了更高带宽、更快速的能力,这些都是IBM为人工智能的快速落地和普及带来的前所未有的新力量。

能否开创全面AI时代?

那么,作为人工智能时代的产物,IBM POWER9能否开创一个全面AI的时代呢?

首先,从市场看,美国能源部橡树岭国家实验室正在建造的HPC系统“Summit”,这套新的系统使用每节点采用2 IBM POWER 9 + 6 NVIDIA Tesla V100 GPU的CPU + GPU架构,使得每个节点能够提供大约40TeraFlops的性能,其性能巅峰将超过 150 PetaFlops,有望明年成为全球排名第一的超算系统。

来自美国劳伦斯利弗莫尔国家实验室的Sierra和谷歌公司也采用了POWER9处理器,这都证明了POWER 9强大的性能和潜在的市场空间。

而中国目前已经成为人工智能最大的市场,也是最大规模的应用市场。根据IDC报告,未来三年,中国人工智能市场的复合年增产率将超过50%,到2020年中国人工智能市场的规模将到达150.2亿人民币,其中政府、金融、医疗、制造等行业将占整体人工智能应用市场规模的一半份额以上。毫无疑问,已经经过实践和市场验证的POWER9,无疑将为IBM带来了更多的想象空间。

其次,从产品看,IBM POWER9专为人工智能市场而生,基于AI的应用在硬件层面做了全面的升级和革新,确保了硬件能发挥出最大性能。此外,在软件层面,

IBM提供了各种不同类型的算法框架并不断优化,所以用户可根据自身需求,选择不同框架适应不同应用场景,能够显著缩短部署时间、降低风险,加速AI业务上线速度。可以说,IBM POWER9端到端的解决方案,为市场更带来了全新的选择。

最后,从生态看,IBM POWER9还希望通过赋能生态伙伴,共同推动人工智能应用的快速落地。毫无疑问,人工智能时代不仅仅需要强大的处理能力和前所未有的速度,还需要创新型公司所构建的开放式生态系统提供技术和工具。

对此,Mary Coucher表示,POWER8为OpenPOWER生态的发展起到了重要的作用,并形成了一系列良好的开发、销售的模式,所以POWER9仍将采用OpenPOWER的模式,为300多家来自OpenPOWER基金会及OpenCAPI联盟的成员,所组成的开放且发展迅猛的社区,继续提供强大动力和重要支撑。

全文总结,全新发布的POWER9通过其强大性能和创新的技术,推动了加速计算和人工智能的落地,同时在这个过程中,IBM还通过技术、服务、生态输出的方式,不断赋能没有技术优势和人工智能技术基因的企业和合作伙伴,更体现了IBM让更多企业受益于人工智能普及带来更多价值的决心和信心。

 

001.png扫一扫获取最新精彩内容与学习资料 

人工智能技术网 倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至1851688011@qq.com我们将及时沟通与处理。!:首页 > 新闻 » 为人工智能而生 IBM日前宣布推出装有最新POWER9处理器

()
分享到:

相关推荐

留言与评论(共有 0 条评论)
   
验证码: