由中国电机工程学会电力信息化专委会、国网信息通信有限公司主办的、北极星电力网全程直播的2012电力信息化年会上,中国电机工程学会电力信息化专委会委员、华为技术有限公司IT解决方案部部长王国钰在本次大会上做了以《高宽带、大数据成就智能电网》为题目的主题演讲,以下为现场文字直播:
王国钰:非常荣幸有机会再一次跟咱们电力的各位领导和专家一块分享一下我在大数据这一块的一些理解。应该说我接触电力行业陆陆续续也有十年了,包括刚才跟我坐在一块的栗宁总,我们想在2003年的时候还在探讨PRC相关的事情,时间过的非常快。今天应该说我们这一次大会的主题是宽带中国与大数据,应该说这两个东西都是时下非常热,非常时髦的两个词,这也不是孤立的两个东西,一切的东西都有一个源起,源起那儿呢?应该说一切的一切都源自于宇宙的大爆炸,应该说大数据的产生从宇宙大爆炸的那一瞬间就产生了,而大数据这个时代可能只有到了今天,我们可能才陆陆续续的感到,无论是很多社交型的网站,或者说相应的一些邮件处理系统,我们会感到每天的数据量的变化。应该说按照IDC一些比较权威的机构他们的一些判断,到了2015年我们的数据量能达到8个JB,这是什么概念呢?我们知道一个T是1000个G,1000个T是一个P,一千个P等于一个E,一千个E等于一个J。
应该说数据越来越多,之前也很多,但是我们收集在手上越来越多了,这越来越多的数据,上一次刘主任讲过如果把大数据比作一个金矿,你要发现它的价值就在于你怎么样能够大浪淘沙在金矿里面找到金块。大家都看到了大数据,看到大数据种类多,速度多,容量也大,当然相对来说,相对传统我们看到的结构化的数据,他的价值力度相对来说低一些。我们看到很大,也知道很有用,并不是一伸手就能够拿到,是不是像昨天曹总讲做信息化这些年,有没有一本书能够指导我们做一些事情呢?应该说在这一块有一些方式和方法,我们说如何让大数据成为洞悉未来的水晶球呢,我觉得这一块可以帮助我们拿到一个钥匙或者给我们一个指引。简单的分解了一下,从大数据来讲,大家都知道它本身是一个海量的价格力度相对来说比较低,产生的变化也比较大。昨天王总也在讲到数据的时候说数据分为结构化,非结构化,如果换一个维度来讲,可能从时空的哲学概念上来讲,又分历史的实时的,从空间维度上来讲,我们知道现在有很多很多的创业公司,都有一种新型的服务LBS,就是基于空间的地理信息。我们现在所有电力的网上的监测业务应该说越来越频繁,从单向到双向,从主站到更低层面的,从风火水河潮汐太阳能到电网运营,这些监测本身带有一定的空间信息。
在这样一个数据产生以后实际上接下来就有怎么传送,端到端有效的传送,包括传上来以后存在哪里,他存下来以后,不是睡在那里就可以了,我们还要焕发他的生命和活力,我们通过云计算等等技术用起来,这里面大数据产生了以后要收集,收集采集以后怎么传怎么存怎么用是非常重要的。
我下面有几页材料基本上围绕着这个思路跟大家展开一个汇报,后面也有一些相应的案例跟大家来分享。
应该说华为公司大家可能不陌生,从八几年成立到现在20多年。在无线,包括现在的新的十年在IT这个领域都做了大的战略的投入,它自身进入IT这个领域,进入政企行业的市场应该说他也在这一块在战略驱动下实现的,这一块跟云计算大数据的战略很吻合的,我们都知道现在华为讲云管端ITCT战略,端我们现在知道接入终端一方面分为个人的家庭的企业,有办公用的,生产用的,在物联网兴起以后可能会看到基于传统的固定的以PC为代表的,基于PAD或者手机这种移动智能终端的算是一类,这两类应该说都是基于现有网络这样一个移动或者说固定的。
第三类是随着大数据和物联网越来越发展,物联网终端把低速单向的数据采集接口变成双向实时的。应该说在端这一块,现在的种类是越来越多的,包括不同的端带来一些安全问题,昨天讲到的DYOD,这里面怎么实现效率的提升,又怎么实现安全的保障。中间这讲一个管,华为过去20年主要在段这一块做经营,包括有线的无线的,语音的、视频的,数据的。在云这一块我们这些年也做了大量的战略投入,从2002年开始做存储服务器这样的战略预演到2007年我们跟赛门铁克成立了合资公司,结合业界最先进的技术,突破进入了最新的业务领域。包括说在前年的时候华为也成立了三个业务集团,在云这一块从虚拟化计算平台到云数据中心,都是做了大量的战略投入。
相对于我们电力来讲,应该说我们目前在发电输变电等环节上,跟整个工作流有关,整体来说也是在信息的产生、传送、处理、计算、呈现这些方面,我们觉得也是根据云管端大致相匹配的。
下面我分三个方面,第一,在传这一块,如何端到端的高速通过高带宽来实现我们这样一个梦想。应该说华为在通信这一块,除了传统的光通信,现在在IP通信这一块也做了大量的投入。这里面写了一个题目叫云引擎成未来,这里面也分享一个小的故事,这里面我们都知道华为高端的路由器,昨天我们也有讲到,在联通最核心的位置把CRS替换掉了,实际上这里面要讲的核心交换机,我想随着我们云时代大数据时代的到来,实际上海量的数据传递上来,他可能又需要通过虚拟化分步式的技术,通过不同的机器去处理。这里面想举一个例子,在吉林石油的数据中心,吉林石油应该说原来只是一个省级石油公司,但是在金融、税务、电力等等这样一些行业,越来越走向大集中的时代,石油它也建了一个类似于我们3地3中心的体系,他是2地3中心,在北京数据中心,上海数据中心,第三个灾备中心在吉林石油,吉林石油数据中心是整个中石油的。
我们知道石油也是讲物联网,讲云,这一块强调比较多的。在物联网这一块他们做过一个基本的测算,今年在大庆和克拉玛依试点就有120亿,这里面大量通过智能终端网上传,传上来以后干什么用呢?以前不做什么,现在要做大量的数据挖掘,这个时候我们就看中石油在吉林石油的要求来讲,原来这个数据中心700个机柜就能满足要求,现在规划是在上万台以上,短期是一万,三、五年到两万,这意味着数据中心处理能力要非常大,非常大的一个基础在于你首先要跑起来,先不说到了那个地方能不能干这个事情,先跑到那个地方,要强大的网络平台。
就以数据中心的交换机为例,我们当时去的时候跟客户交流,一般目前可能在一个数据中心里面五千台左右是一个极限的,在传统数据中心交换机设计的思路里面,他从千兆也好,万兆也好的接入到相互之间的互联有一定的收敛,因为传统的业务是基于梳树状的下面和上面有来往,但是相互之间比较少。我们这两年P2P的兴起,迅雷也是随时可以上市。这其实要求一个什么呢?每一个端点和其他端点要做到端到端的线性研究,现在可能还有一个动态的概念架构,通过这种架构可以实现上万台服务器互联,这样相互之间的数据快速移动,才能使得网络变成无阻塞的。在吉林石油我们通过最高端能够提供1150个实际接口,在数据中心要做云化,做石化,很重要要虚拟化,这才能实现自动化,才能实现数据和资源的迁移。传统来说迁移是需要通过走到三层,IP地址的变化来实现,IP地址变化走到三层就慢了,能不能走二层迁移呢,这对下面IP网络提出来一个考验。目前应该说在等等一些技术上都实现二层,我们叫大二层组网,整个网络从二层到三层又回到二层了,应该说在这个上面我们通过开放的协议来进行交互,用户因为现在好多业务还没有完全确立下来,所以要求开放的业务体系。应该说这一块是最后导致思科没有进入这样一个项目里面。
我这里面讲一下吉林石油在大数据处理,首先对网络做一个要求,宽带中国核心宽带要宽,对于电力来讲华为这十几、二十年服务电力,首先说在网络领域做了很大的工作,在这张图里面稍微显得零乱一些,但是从层次上来说比较简洁,应该说这些年建设国网整个从传输层面也好,数据层面也好都实现了双网的冗余,在各地骨干层面还是实现了宽带中国超前一步的运营梦想。目前无论是国网还是南网在配电自动化和用户信息采集最后一公里可能面临跟中国电信,中国移动一样的阶段,在这一块可能在智能化,互动化,配网自动化这一块也在加强。当然在华为这一块,在接入这一部分也做了大量的工作,在这一块可以通过工业交换机或者无线网络,在这些方面甚至我们也做了一些结合底层的低速接口,在这些设备上的定制。
目前在超长距离传输这一块可以做到270公里,加上摇泵可以做到380公里,应该说这个对降低维护量,实现整网大数据高速传输提供了保证。
在OTN传输层面,目前可以做到单波100G,30波的速率,在这一块上,在通信整个领域我们传统的主要的友商,爱立信,摩托,北电逐渐消失我们的视野,在欧洲这一块,但是欧洲厂商也有一个好处,我们喜欢跟他合作或者说是竞争。我觉得爱立信的东北亚副总讲希望在开放公平的环境下跟华为一块为客户服务。
下面跟大家分享一下大数据除了传以外在存和用这一块需求,这一块简单过一下,我后面想跟大家简单看一下案例。在存这一块应该说数据量的增大需要整体的吞吐量的提升,包括他容量的一个增加。我们刚才讲的数据分为结构化和非结构化,结构化应该说传统上都是用块级访问,非结构化后面又会分别通过大量的文件系统或者说大量的对象数据的接口来进行访问。在这一块上,块一级的对于高速单业务低顺延的要求,我们可以通过高端存储来做,目前华为16控高端存储也在我们全国的住宅联网里面系统。UDS,分步式的我可以结合大爆炸分享一个案例。中间这一块,基于文件访问应该说我们大量的数据存在一些从非结构化到结构化的一个数据清洗的过程,要结合一些业务的建模,这样你才能真正把BI的模型,把大数据挖掘的模型建立起来。同样一堆数据,针对不同的业务,针对不同的行业可能能产生的价值也都是不一样的。
我们刚才把传和存讲了一下。第三个就是要用起来,实际上还是要靠算,要靠怎么算呢?以前我们讲网格计算也好,分步式计算也好,跟云计算有异曲同工之妙的,不管通过什么方式都需要为整个的大数据的挖掘,大数据的数据处理提供一个强大的心脏。我们看NBA讲关键球员的能力,就是最后有一个大心脏,能够带领球队取得胜利。华为公司目前投入六千人的研发,这在全球都是比较大的投入,六千人的研发来做什么呢?来做云计算的云操作系统,虚拟化的软件平台。包括整个华为使用桌面云系统,这是实现最直接的办公OA的应用。在这个基础上要实现有效的安全保证,从接入到网络到后台的业务应用,还有要结合ITO的管理,昨天有领导讲ITO的管理,结合这一块建立整个运维的体系。
当然在这个基础之上需要通过业务建模和数据清洗,针对不同的行业作相应的数据挖掘,这里面也离不开大量的合作伙伴,包括行业的,比如说在电力跟南瑞等等也在开展合作,他们在具体业务上理解比我们更深入,华为在基础的平台上,在自己的电气工程这个领域上会贡献自己更大的力量。
最后是几个案例,我今天在第一张图上也给大家展示了一个宇宙大爆炸的图,应该说这是我们认为由于宇宙大爆炸产生的后续的过程,才是一切的源起,包括大数据。这里面我们讲,我们说云计算,云储存发现上帝粒子。什么意思呢?欧洲原子能机构,这个机构在今年八、九月份发布了非常震惊科学界的消息,就是说他们证实了这个希格斯玻色子存在,他们有一个大型探测机器,他通过这个探测器和一个强子对撞机,我们右边图就是这个对撞机,看到像动车里面一节一节车厢一样。在这个对撞机里面放了三千万亿个基本粒子,这比原子质子更往下走,他做实验的时候每秒能产生六亿次对撞,实际上相互相撞级别还是很低的,这六亿次对撞产生的原始数据有50个TB一秒钟,他不可能一天24小时都做,就这一秒50个TB数据量就非常大,这个数据量产生之后需要通过欧洲原子能机构以及分支机构通过云计算的方式来计算,通过原始数据计算,这个计算完了以后再来论证原来的理论是不是真实的,因为实验产生的数据是真实的,但是真实的数据要去看整个理论是不是合适的。
通过他们这一套发现原来理论上存在,但是没有抓到看到的。到了今年8月份以前,还有最后一种粒子被理论存在,但是没有发现过的,这个粒子就是希格斯玻,这是爱丁堡大学一位物理教授,之所以称之为最后,就是最后发现的粒子。搞清楚这个例子对研究整个人类的宇宙的起源是有帮助的。
很有幸我们通过路透社报道,原来我们华为公司给他提供这里面云计算和云存储,尤其是云存储这一块。我们想每一秒50个TB,传统任何存储都放不下这个东西,无法处理这个东西。随着实验横向的线性增加一些东西的时候,增加容量和性能的时候,这也是一个恐怖的事情。包括他要全球联网来实现数据的一致性,还要实现任务的分步式的发布,这个时候数据的完整性和一致性也是对系统产生了非常大的考验。
华为在整个云计算,云存储这一块,早在大概2010年的时候就开始来做,就在上海的电信E云,为什么叫E云,最开始合作是EMC和上海电信做的,他目标是给上海2000万市民每人提供100G空间,在这个空间上你可以存你个人的照片,也可以作相应东西的备份,包括在上面游戏、社交等等一些东西。在分步式这一块,通过20兆上行用户来开展这个业务,但是分步式这个东西,包括中国区域有一定定制的业务特点,让国外的厂商来说还是非常痛苦的。这个时候我们中国自主可控这个特点就出来了,我们可以结合业务来优化性能,提高实验。
最后一个案例,这是我经常去深圳机场经常能够看到中国移动的网络,4G宽带要来未来。我要说这个案例是在南网,在南方电网在十二五也是把最后一公里的覆盖,配网也好,用户的用电信息采集以后作为很重点的工作。当时也是把两次获得全国供电可靠保障企业的珠海电力作为试点单位,这是全国第一个LTE商用的,我们看到在宁波、青岛、北京,在一些有心这一块配网用户用的比较多,但是我想这一块虽然是南网的,但是可以给各位领导和专家汇报一下,一块听一听。
当时遇到了一个什么困难呢?我们知道电力应该说是传统的老专网,整个通信很强,但是在最后的接入这一块,因为我们可能电力先进去的,可以一块把这个网络解决了。包括原来我们说PRC的时候你有电线,我能把这个东西布过去。实际上我们当时想这么多办法,也是因为实际上现实的网络接入,网络在最后的客户这一块有一些困难的。当时珠海电力就遇到这个问题,他要做智能抄表,他要做一些智能的业务,他发现勾不着客户。他想办法,我可以用WIFI,但是他发现这个距离还是短,我不可能为一个楼客户或者没有多少客户单独假设网桥,包括点到点的这种。他另外对环境要求也比较大。
还有一种方法,中国电信,中国移动布了2G、3G、2.5G,甚至4G也可以布置网络,他也可以用,但是安全性和QS保障是没有办法提供的。我们在家收邮件的时候很少有人说收邮件慢找中国电信,中国联通,但是你到公司慢马上打电话给信息中心说怎么回事,这么慢,这还是私有、公有的互联网区别比较大。游线够不着,WIFI在剧烈环境和带宽上都是不够的,公网的电信移动在安全性,业务质量上也都有一些问题。当时我们跟珠海电力的领导专家们做了一些沟通以后,把我们LTE的技术,这应该说是宽带中国里面一条,无线的。他当时应该说论证了一种方向,可能单机站覆盖5400个用户,每平方公里可以做到350个通信点,当时用了一些数据采集终端,来汇集一个一个通信点,不是每一个点都往上传,其实没有那么大信息量,你把用户接入数量,通信点接入数量提高了十倍。这里面还有一条非常重要的,当时讲到遥控指令,整体端到端要在一秒钟之内,包括业务应用开销,包括网管开销和其他层面的东西,包括底层设备,算来算去给你网络这一块必须低于100毫米,我们也做了测试,下行是在8.8毫秒,最大是11毫秒,上行是在平均36.9毫秒,最大58毫秒。应该说这个指标还是远远优于客户在这方面的要求。通过LTE4G技术,当时主要是配电自动化,计量自动化和视频监控这三块业务先有,这一块远远提高了带宽和QS的保障。
在整个大数据领域我们都认为是一个化云为雨,把云计算落地的一个东西。我们看到围绕大数据,云计算也好,宽带也好,海量的存储也好,似乎活了。围绕着这个大数据这些东西转起来了,但是转起来实际上也不是某一个厂商能搞成的,即使我们现在说有所谓美国国会的事情,但是我们现在包括跟因特尔,跟欧美一些公司合作还是非常紧密的。当然非要打我们也必须去打。在这里面应该说从底层的存储服务器,这种S层面包括操作系统虚拟化,还有中间件,这些PASS层的东西,包括再上面应用层面的东西涉及到SARSS,我们也有广泛的合作,我觉得最重要的一点是可以跟我们用户先网上零零种种的异构东西能够有高效对接,保证用户价值的最大实现。华为现在坚持被集成的策略,在自己最擅长的IT、CT这样领域里面跟我们做上层业务应用,尤其是行业应用的一些伙伴朋友,比如说这一次承办方,在这两年对我们也提供了很大的帮助,大家在对电力行业的理解和深化也提供了很多的帮助。
最后我想说一下,华为目前在14万人里面,大概有8万人是研发,每年超过10%的收入是投入到研发里面,去年324亿美元收入,我们看到37亿美元投入,专利技术非常领先的,这里面讲的六万人研发工程师还少了2万,我们有一个实验室是2012实验室,专门做诺亚方舟的,我们也经常在网上看到华为开始做手机的操作系统,也做自己的芯片。我刚才讲欧洲原子能机构里面海量存储的,我们就是给每一个硬盘提供一个IP接口,里面放一个小芯片,这就是我们自己做的,这都是做2012实验室做方舟的人,做最初的技术原形的创想。
通过持续的研发投入,我想最重要还是要构建自主可控的核心技术能力,而不是说把国外的产品买过来帖个牌子就可以了,如果这样的话我们也真的不用担心美国或者担心欧洲。
这是我们现在不断强化自己全球服务能力,遍布在156个国家,通过全球化服务体系,我这两天也听到包括中间件或者很多电力行业的企业,你们自身可能还有自己最终的客户,也在走出去,我们也希望在这个过程里面,能为大家贡献一些我们过去的经验,更多的也可以分享一下我们的教训。因为我听昨天几位领导讲了很多东西,感觉好象都是有一些共鸣的。
我今天的汇报大概就到这里,非常感谢各位,谢谢大家。