行业新闻

【2018亚太数据中心峰会】曹峰:AI赋能下的数据中心产业发展趋势

作者: 发布时间:2018-05-16

在过去的2017年,亚太地区的数据中心市场增速接近15%,领先于全球其他主要地区,与整体经济增长水平保持同步。区域内多元化的经济体发展特征使各国数据中心市场形成了鲜明的差异,以香港、新加坡为代表的成熟市场保持稳定增长,而以印度、印度尼西亚、为代表的新兴市场则呈现出强劲的增长动力。

2018年5月15日-17日,由中国IDC年度大典组委会主办,、CloudBest承办的"2018亚太数据中心峰会"在深圳盛大召开。

5月17日,"2018亚太数据中心峰会"正式召开,中国信通院云大所人工智能部标准和评测项目主管、人工智能关键技术与应用评测工信部重点实验室副主任曹峰在现场进行《AI赋能下的数据中心产业发展趋势》精彩分享。

530514058319371623

中国信通院云大所人工智能部标准和评测项目主管

人工智能关键技术与应用评测工信部重点实验室副主任 曹峰

以下为演讲实录:

曹峰:今天我的介绍分三部分:一是人工智能产业发展现状;二是AI+数据中心,在我们看来有哪些结合的点,AI如何赋予技术中心,如何让它更加环保、更加节能。AI给数据中心新业务提供好的方向。三是简要介绍信通院在人工智能方面的工作,非常欢迎大家积极参与到我们的工作中来。

2017年到2018年,人工智能发展是非常火的,一系列的智能产品,比如智能音响、智能手表等等的智能产品应用层出不穷。最后是英伟达的估价,上次拿出来190元,现在已经260元了,上次拿出来是9月份,我发现亏大了。为什么这么火呢?现在人工智能训练芯片大概70%、80%都是由英伟达出货,他们基本一家独大。人工智能肯定会继续火下去,股票不敢说。

全球的政策,大家看到近年来美国、英国、日本、___等一系列国家都针对人工智能的技术、产品应用等等发布相关的计划、规划路线图等,都可以看到各个国家把人工智能抓住作为本次科技革命重要的抓手来作为重点推进。这是我国人工智能产业发展的要求,其实能从去年十九大习___在里面提出推动人工智能实体经济深度融合,我们看到人工智能是我国的国家战略,从2015年开始国务院发改委、工信部、教育部等等已经出台了一系列的国家层面的纲领、规划等等文件,整体推动人工智能的发展。主要的是后面这几个,包括新一代人工智能发展规划,促进新一代人工智能产业发展三年行动计划等等。还看到这些从人才等等的力度非常强。

人工智能层面在各位看来,已经深入大家的实际生活中。比如移动互联网、金融、医疗、政治等等方面,包括语音识别、互联网数据、银行保险应用、券商、医学、教育,这些大家可能没有实际的感官。比如大家早晨起来第一件事是拿手机看新闻,新闻有智能推送和智能筛选的机制,这样就会推送你比较喜欢的新闻。比如早晨起来去上班,你叫一辆车,还有一些路径规划的工作。如果各位有开特斯拉的,会有些辅助驾驶的功能。比如去银行办业务或者出差去机场,人脸识别、人脸验证,验证你是不是自己。还有天眼工程等,是暗地里保护我们每个人的安全,会实时把一些敏感人都会识别出来抓住。其实可能大家没有明显看到,但是人工智能技术深入我们的生活中。

这是我们院里的一组数字(见PPT),我国人工智能的应用创新层出不穷。人工智能作为一种赋能的技术,是可以和传统行业深度融合,帮助传统行业提质增效,还有创新提出新的管理或者生产方案。

简单讲讲,这个图如果关注人工智能就听得比较多,人工智能为什么又崛起?三驾马车,算力、算法和数据资源,跟数据中心结合是算力这块,和数据中心结合非常紧密。

第二,刚才简要经少了人工智能整个产业的发展现状,接下来着重介绍一下数据中心和人工智能的深度融合的体验。

首先是人工智能对数据中心带来的挑战,人工智能因为很多训练的芯片都是在用GPU做,在座的肯定业内的近期接到很多GPU机架的要求,可以看到GPU服务器对机架的供电要求特别高,传统一个机架的功率密度是5000W或者8000W很高,但是它的级别要求更高。功率密度提高,供配电基础设施的能力,而且不只是成倍提升,有可能是指数层级的提升。制冷,其实很简单,用电多需要散热多,所以一方面现在很多企业都在探索风冷向液冷转化,单机架构功率超过20KW、30KW的时候,风冷对散热的改善就没有那么强了。这方面国外的研究,我记得Google还是亚马逊的数据中心做得放得比较稀,但是国外地广人稀,和咱们国家北上广深的情况不一样,咱们寸土寸金,如果一个机架大,显然成本上是扛不过去的。人工智能带来边缘计算的兴起,为什么单独把边缘计算拿出来作为挑战?传统认为数据中心是信息的交汇或者处理的节点,人工智能的很多技术,比如摄像头的数据,一方面需要在靠近端侧进行实时的训练,如果把它传到传统的数据中心里面一方面带宽要求比较大,另外时延要求没有办法满足实时要求。如果大家验人脸,五秒,我站在那儿认不出来会特别郁闷,这是什么情况,到底怎么回事。我们看到人工智能给数据中心带来一些挑战。这些挑战并不是不能解决,前面也有很多位专家都对数据中心的、边缘计算、供冷都提到了,业界跟着产业的潮流来说,也是做相关的事情。

下面是智能化的数据中心,智能化的数据中心相关的解决方案成为近期的热点。人工智能能做什么?我们来看它在数据中心里面做什么。人工智能一方面替代简单的重复劳动,另外就是大量的数据终提取规律性的信息。第三个是大量的方案中优选最佳方案。最后就是在复杂的数据环境下选择最优的模式。对应的数据中心就是智能运维和节能降耗。目前我们运维是一群人在那儿盯着大屏幕,设置告警信息的阈值,还有相关模式识别的任务,如果有告警,就帮助大家解决。一方面它可以做故障的实时监控,能实现潜在的故障告警。如果是人,模式识别是有些自己本身的固有的技术的瓶颈,可能达到50%、60%就已经很高了。另外对小的或者级别不是很高的告警,它不是很敏感。根据大量的算法实现一些实时的故障定位,传统来讲,大家可能需要找到故障去查手册或者找工程师,去做故障定位。如果在大量数据训练情况下,会把实时故障定位找出来。实现重点区域的问题或者潜在的问题监控,比如说这块我经常出问题,我可以把它作为解决方案,能持续的把它潜在的问题找出来,或者持续对它进行监控。能够提交一些解决方案的智能化推荐。

最后一报,这里没有列,传统数据中心的日志,可能过去就过去了,大家存一个月、两个月不会动它,大家认为可能没有价值,但是数据中心长久的运行当中的日志经过深度学习的手段,它其实是能形成相应的模型的。这样不但可以实时的检测或者监控数据,最重要的是能够预测出一些问题,换句话说,可以根据现在日志的特征预测出可能出现的问题。这就相当于从亡羊补牢变成提前修羊圈,这样对数据中心的能力是很好的提升。

第二,节能降耗,UPS的智能化管理,可以实现延长寿命、提高可靠性的好处。上一位专家讲到,整个数据中心一方面是每个时段的波峰波谷的负载是不一样的,另外每个业务的波峰波谷也是不一样的。但是现在所有的机器都不能关了等这个业务,但是实际上这些波峰波谷是有它内在的规律的。通过深度学习的技术,一方面预测出来潜在的未来一个小时的需求,比如我提前关掉一些设备或者怎样,达到真正的节能降耗的目的。

为什么要把硬件拿出料?算力是技术实现的保证,从数据中心或者计算能力来说,大家从FLOPS到G到T到P,它已经到非冯诺伊曼体系架构出来之后,对未来的数据中心的设计和建造和运维提出更高的要求,五年前的数据中心都是CPU一家独大,现在可以看到,很多是GPU已经进入数据中心,而且传统互联网企业,比如BAT都会去踩GPU服务器,另外一些人工智能的企业,比如说科大讯飞、旷世等大型人工智能企业主动要求租或者买具有GPU训练能力的数据中心,会提出整个数据中心对GPU的要求或者能力。其实GPU其实并不是深度学习训练最佳的选择方案,只不过目前是最好的解决方案,所以随着计算能力或者人工智能硬件能力的提升,未来数据中心的整个架构也会持续进行进步。

数据中心是给人工智能的服务器带来新的发展趋势,从两个层面讲,传统服务器+AI、AI+传统服务器。传统服务器+AI,比如联想、浪潮等等传统服务器厂商,它因为看到GPU等计算能力的需求,所以它纷纷退出GPU的服务器,不管是两卡还是四卡还是八卡,推出相关的服务器,其实可以看到市面上服务器已经几十款了。另外AI+传统服务器,每个不同的人工智能的企业其实对底层的计算能力的要求是有不同的,所以不同的企业会依据自己的业务能力,还有业务的实际特征,它会寻求一些定制,比如说一方面我们可以看到今年3月份华为意图共同宣布要做AI的一体机,是专注于视频智能分析的,基于意图的智能识别算法可以识别视频的对比等等分析能力,这其实是对它现有业务的优化。另外一方面,英伟达不断突出DGXE或者HGX1这一系列人工智能的一体机,也是为了顺应大家对计算能力的需求。

人工智能给数据中心带来什么业务呢?我们能看到的是人工智能给数据中心带来业务上的发展,从底层,包括计算服务平台再到上层的智能语音、语义的服务平台,还有计算机视觉的平台,这些平台都是支撑产品服务或者应用的底层技术。我们认为这个是在线服务的形式,类似云计算这种提供AI相关的高性能计算或者智能语音、语音识别、计算机视觉等技术的能力。每块展开讲一下,首先的是计算服务平台,大家可能见到比较多,主要是依托第三方搭建和运营的基础计算,存储网络基础设施,以服务交互的能力提供人工智能需要的计算能力。一方面是大家能看到GPU服务器比较贵,GPU卡也比较贵,还买不到,很多初创型企业,如果要投资做这个平台,可能自己的几百万块钱够买几台服务器,就黄了。所以业界是需要一些即取即用,然后通过用量收费的平台,来完成训练任务。我租三天平台,跑完训练任务就可以还了。这几种服务是国内云服务企业来做的,包括BAT、金山云等。国外也有相关的阿里,AWS等等都在做相关的工作。这里面有三种类型,GPU云服务器,通过虚拟机的形式提供GPU相关计算。还有FPGA云服务,这个比较少,业界对这个需求量还是没有那么大。最后是基于GPU服务器和深度学习平台,相当于在传统硬件的平台搭载着TensorFlow和Caffe为等的框架为基础,提供相应的深度学习平台,方便开发者的使用。

智能语音基础应用平台,智能语音语义的平台,现在业界是非常火的,大家看到的智能音响,还有手机里能实现的语音交互的应用,比如说讯飞输入法或者是高德地图等,我告诉你要去哪儿,还有智能家居、智能音响、智能空调、智能机器人,它提供的是智能语音、语义相关的在线服务。怎么理解呢?所有的音响其实只是一个前端的接收和输出设备,所有的语音理解相关内容,都会传到后台的平台上做。这些平台进行理解或者翻译或者是取得相应的响应再传输给音响,然后做出相关的反应。音响只是一个前端的输入和中端的输出功能,所有的东西都在后台做。这里面提供语音识别、语音合成、声纹识别等一系列功能,企业都建立自己希望的产业链,比如科大讯飞等公司。

计算机视觉开放平台,跟语音识别类似,如果我这个厂家专注于语音或者视觉平台的业务,我不需要去买或者开发相应的底层能力,我只需要买,如果是语音的,买科大讯飞的API或者是图像买旷世的API,我把前端____工智能相关的应用,人脸识别或者图象识别或者语音的翻译,我就可以自己再做了。这块目前能做的物体检测、人脸检测、图象识别、智能鉴黄等等服务。现在随着深度学习技术的突破,相关的应用已经非常成熟了,它可以达到接近人能力的水平。大家近两年能看到这块业务非常火。为什么讲到这块?不管是智能语音还是计算机视觉开放平台,后台的底层支撑还是属于中心的计算能力,也就是说这些平台、这些上层应用的驱动还会带动数据中心的进步发展。另外就是高性能的计算要求也会带给数据中心更多的走向人工智能。

最后梳理一下,目前整个计算平台还有基础应用平台做的情况。大家看到,其实互联网公司是整体推进的策略,能提供计算服务、深度学习、智能语音、语义、图像、视觉等等一系列从底层到上层的能力,他们一方面是希望自己的服务平台建立自己的产业链,另一方面,很多互联网企业把本身的人工智能技术融入自己的产品当中,比如说百度的AI搜索、识图、腾讯语音的,微信可以语音输入相关的文字等等这些功能,其实是希望通过这些能力帮助它的产品能力提升。

传统的人工智能企业,人工智能企业其实是专注一些领域,比如科大讯飞、思必驰,他们会基于自己的需求而提供相应的开放平台,也是为业界服务。

最后一点时间给大家介绍信通院人工智能领域的相关工作,包括做好政府支撑、加强科研布局、推动产业发展、促进行业融合。

2017年我们成立了中国人工智能产业发展联盟,这个联盟是国家发改委、科技部、工信部、网信部四个部委指导下成立的,成立大会来了三个副部长还有数位院士,目前联盟大概有240多家会员单位,5月底会发布第二批会员。我们分为十个工作组,包括政策法规、评估评测等,我是评估评测的负责人,未来如果大家有评估评测的相关需求可以和我联系。

这是我们成立以后开的一系列大会,从去年10月份开始,比较重头的几个活动是去年互联网大会的人工智能论坛,包括李彦宏、雷军和人工智能俗称"四大神兽"之一的吴闻达(音)都参加了活动。去年10月份,信通院正式获批人工智能关联技术和应用评测实验室,评测实验室也是希望通过一些前沿的技术验证、公共技术服务、承载评估评测来搭建成为国内影响力高、技术水平高,然后具有相关能力的产业推动能力强的实验室。为了提供整个实验室的能力建设,我们也在招募实验室的联合供电方,希望业内具有人工智能相关软硬件、算法软件等等一系列的企业,能够共同参与到相关工作。其实我们现在和小米、华为等达成意向,现在已经在做具体的细节沟通。各位有兴趣可以共同开展相关工作。

这是整个人工智能产业发展联盟的评估体系,是我负责,目前已经建立了整个人工智能基础软硬件服务平台、智能产品应用等的评估体系,在座的各位对下面两层的相关评测会比较感兴趣,我们也有相关的在研的评测标准和评测规范,里面包括人工智能相关芯片,技术评测评估方法,等等一系列评估能力,希望各位如果有兴趣可以积极参与到我们的工作中来。

最后也是非常感谢大家对我的支持。这是我们信通院目前人工智能领域的研究成果。非常谢谢大家!

收缩