以“数据造化 智见未来”为主题的2013中国存储峰会今日在北京盛大开幕。作为一年一度的中国信息产业界领袖级会议,本次大会得到了中国软件行业协会、中国计算机学会存储技术专业委员会、武汉国家光电实验室和国防科技大学计算机学院的大力支持。共有10位第三方专家和23位业界领袖/专家出席峰会,并发表了25场极具前瞻性的主题演讲。Gartner和Forrester两家全球知名机构的分析师还与与会嘉宾就大数据浪潮下的存储进化与应对策略进行了两场高质量的高峰对话,现场吸引了超过千名参会嘉宾,给大家带来了丰盛的存储盛宴,再次引领中国存储产业发展的深度思考。
今年是DOIT正式成立十周年,也是中国存储峰会连续举办第九年。十年前成立DOIT传媒时,还没有Facebook、微博和微信,转眼十年过去了,互联网和IT技术都发生了翻天覆地的变化。也正在经历从传统互联网向移动互联网变革的过程,IT技术正在越来越融合,云计算、大数据的兴起,社交网络和海量数据的出现使传统企业IT架构越来越难以满足需求。
在高峰论坛这一环节,国家信息中心专家委员会主任宁家骏、信息存储系统教育部重点实验室主任,武汉国家光电实验室副主任、教授、博导谢长生、国务院发展研究中心国际经济技术研究所所长陈宝国以及赛门铁克公司大中国区技术总监李刚和DOIT传媒主编邵海宏。四位专家主要围绕“面对2013年的大数据和移动互联网、社交网络的出现使得数据的类型更加多样和复杂,存储该如何应?”为话题展开探讨,分享各自的真知灼见。
以下为高峰论坛对话全文:
邵海宏:非常高兴来到今天最后这样一个环节,今天上午大家围绕数据和信息存储讨论了一上午,其中也谈到很多比较鲜明的技术,比如闪存、虚拟化、云计算、云存储,以及软件定义数据中心和软件定义存储。那么,我想所有的这一切都是在应对数据的多样性变化,包括咱们的很多专家也一直在讨论非结构化数据的海量爆增。我想首先采访一下在座的四位嘉宾,大家现在随着这样一个移动互联网、云计算和大数据的出现,每个人自己自身的变化,比如工作、学习、生活之间有那些很大的变化?先从左边开始。
陈宝国:如果说它变化,我们觉得移动互联网确实给我们的生活和工作带来了巨大的变化。我刚才在进进出出的时候,进出了几次看到大家,特别是会场的外边,这种无线互联网,对这种会议内容的享用,包括二维码。就我自己来讲,我觉得现在移动互联网,我们说离开手机,离开网络基本上没法工作。第二、生活就会受到很大的影响,我们现在比如做科学的研究,这种研究一般来讲不是由一个人所完成的。那么,基于互联网上的合作以及资料的获取就成为了我们现在研究工作的基础。大数据的应用以及现在网络里边知识的获取以及知识的再造已经成为对无论哪个学科基础研究的一个最基础的组成部分。谢谢!
李刚:因为是业内的,我可能是唯一一个所谓厂商的代表,所以关于所谓生活的变化我想可能大家都有很多真知灼见,我谈一下作为IT厂商我们感到的最大的变化,严格意义上是整个产业链重新的洗牌和重组。我们可以说任何一家在这个产业链的公司都感受到巨大的挑战,同时也是巨大的机遇。一个是说像移动互联网,或者叫做万物互联了,不光是移动互联了,万物互联和大数据这两个新的技术直接产生了所谓重大的应用创新,这两者是产生应用创新的。另外还有三点,一个是云集成,一个是数据中心的架构挖掘,再有一个就是IT Service使得整个产业链本身有一个巨大的存储。尽管我们讲很多点状的产品的突破和技术突破,这些突破正在或者说将要给我们整个的产业产生很大的影响和变化。
谢长生:我是在学校做科研的,除了我们日常生活利益不开手机,我觉得我们在科研中的一个变化就是我们跟国外的同行在十年,二十年前获取信息是有很大差距的,包括发展以后,20年前我们可能要经过一年才能获取他们的信息,但是现在不是了,他们得到的信息我们马上就可以得到,我们从互联网上,从手机上很容易可以得到这种科研信息,所以这是一个很明显的变化。
宁家骏:现在新技术不仅给我们生活带来变化,更重要给我们产业,包括政府的管理模式都带来巨大的变化。现在比如我们在政府出现的政府微博、微信的应用已经为我们这个行政管理的改革也提供了新的途径。因为总的来说,现在我们进入了一个4个“O”的时代,我们现在是一个移动的、位置服务的、社交的和整个商务的时代。正因为这样大数据是因为大家需要有更多的交互,所以必然产生大量的数据。
邵海宏:谢谢,我第二个问题就是既然大家的工作生活都有那么多变化,一个企业他们的数据中心给他们带来什么变化?
宁家骏:我觉得大数据的出现,大数据有四个特征,但是不是都具备这四个特征才是大数据,我觉得具备几个特征也是一个大数据,正因为这样,我们的数据中心规划进入了一个新的时期,新的阶段。怎么样规划这个新的数据中心的建设,我觉得必须要运用到新的技术,要用到新的数据中心建设的策略和新的数据中心规划的方法。所以,这一点我觉得可能是我们要从规划,从我们实施的策略到我们具体的技术几个层次上来考虑新的数据中心的建设。而这一点应该说在这几年来我们很多的企业,包括我们现在国内的比如说央企和我们重要的部门对这一点都有比较多的经验,应该说我们作为国人来说,我们中国这种特定的高速增长的社会、经济发展的环境和我们巨大的市场潜力,使得我们国内的数据中心的建设和规划可以说是能够领先于世界,而且能够产生很多创新的亮点。
李刚:宁总最后讲的一点,我觉得讲的特别有高度。就是正好提醒我,刚才我讲所谓的产业链的变化,整个产业很大的变化。IT来说并不是第一次了,比如十多年前互联网革命的时候那是一个变化,宁总讲的是跟以前不一样的,是说中国因素,可以说十几年前的时候我们在谈变化的时候基本上比如看硅谷,硅谷在做什么,中国复制过来。这次变化特别明显,就是里面有强大的中国因素在驱动。宁总讲新的数据中心的规划,我做一个转述者,一个月前我们做了一个类似这样的活动,CIO论坛,请了很多企业的CIO交流,我听一个CIO谈,他说作为一个CIO来说,现在面对数据中心的转型有几个重要的工作要做,一个重要的角色就是保证基础架构的稳定、可靠和安全,以及一个可控。因为大家都知道信息的竞争是未来一个很大的竞争,作为一个大的企业来说,怎么样把自己的信息技术可控,我不把它放到云上去,对于我来说这个东西是可控的,这个很重要,所以这是它第一个大的要点。第二个大的要点就是业务创新的支持,怎么样支持一个新的业务创新,这是它的第二个大的要点,大的数据在我这个行业里面怎么落地。第三个大的要点就是融合,融合就是说不只是指技术、系统,而对他们来说是一个知识的融合。今天我们谈的很多数据中心,我们可以想像,这个中间大家很有限的在谈论,到底对于一个CIO来说,数据中心的最高领导来说,它要落地,所以它说怎么样跟我以往的经验,哪些可以借鉴,哪些不可以借鉴,这个怎么样融合在一起,这是他们一个很大的挑战。所以,刚才说那三点,对于数据中心的新的变化来说我认为他谈的各种高度,所以我转述他的一个合,也是很好的一个答案,给大家启发。
邵海宏:李刚老实说的确实比较好,大家都知道,既然大家都在谈大数据,我们今天的问题也大数据一把。易会作为我们整个峰会的官方APP,其实也有很多人跟我们一直在互动,也问了许多问题,我们抽出一两个问题问一下。第一个问题是针对虚拟化对存储的影响,大家知道云计算的基础技术实际上最开始就是虚拟化,就是把你整个资源要做池化,虚拟化技术在存储领域这几年做了哪些重要的作用?请场上四位专家给我们解释一下。
宁家骏:昨天参加国企的一个会,一个重大的国企,他们最近变更了他们设备采购的策略,从过去传统的自己买设备,现在变成租赁,就是一次性的租赁一大批设备,而且能够提出来这个设备要虚拟化管理,这种重大的变化标志着我觉得虚拟化技术应该说在我们国家重要的信息系统和重大的工程中间得到了认可,这个进步我觉得是说已经把我们过去讲虚拟化还往往是在会议上讲,或者是在技术上讲变成真正推到实际应用,而且这种应用过去比如试点、示范小应用,现在是把它变成一个实实在在大规模的应用,我觉得这个变化是巨大的。
之所以能有这样大的变化,第一个我觉得还是我们对技术承包带来的认同,但是我觉得这个是不够的,最重要的是什么呢?最重要的大家认识到今后信息化必须要转变发展模式,就是从过去自建、自用,这种重复建设,或者说信息化的投入高,效率差这种模式要转变到集约化这种模式中间来,来进一步提高信息化的建设效率。我觉得这是虚拟化得到使用的一个最大的亮点。
邵海宏:确实太有帮助了,谢老师。
谢长生:我们从技术上来看,虚拟化以后它可以极大的提高存储的效率。不仅如此,而且还可以现在一个问题,刚才主题提的一个问题,就是数据多变你怎么适应?我觉得虚拟化进一步发展可以解决这个问题。现在我们所有的信息都有一个最好的形式就是数据,就是0、2、1是表达数据最好的形式,人是平等的,但是数据0和1是不平等的,因为有的数据需要响应很快,有的数据需要响应慢一些,有些数据价值非常高,有些数据价值非常低。所以,相同的0和1,但是它对应不同的信息,所以你的重要性和性能需求各方面都是不一样的。如果我们以前在没有虚拟化之前,它这个都是单独的设备。比如说我们在整个虚拟化的管理之下,把最需要快速的数据要放到高速的地方去,把最重要的数据放到那些有很好保护的存储中去。所以,我们要用合适的存储介质来保存不同种类的数据,要做到基本上对应。比如你要是快的,我有快的给你应对,你要是很重要的,比如我有很好的数据保护的那部分存储来跟你对应。所以,这样就把合适的信息放到合适的存储资源里去,我们虚拟化就可以完成这样一种功能,所以这样我们就可以解决你的数据多变,存储怎么应对的问题。
邵海宏:谢谢,李刚老师。
李刚:虚拟化是一个很长的话题,几乎是从我开始进入这个行业里面有在谈虚拟化,谈到今天。我认为首先第一点,虚拟化肯定是对整个的比如资源的有效使用,简便的管理,还有刚才谢教授提到对整个的服务水平,不同的服务器水平可以布置到不同的存储上面,这些是一个很重要的问题。我是想说,未来我认为因为虚拟化部署了以后,我听到一些市场的反馈说虚拟化可以带来虚拟化的问题。所以,我所看到的方向是看到很多中国因素,中国客户领先的一些想法。中国的客户在寻找虚拟化的虚拟化,就是进一步的虚拟化,就是对现有虚拟化技术进一步的虚拟化和抽象。那么,这里面比如说像OpenStack这样一些大的技术方向,我们中国很多的厂商也在开始积极的参与在里面去。所以,我看到这里面的发展标志着进一步虚拟化的方向。
陈宝国:刚才前面三位专家把虚拟化的优势都阐述的淋漓尽致,包括从资源的优化,包括整合上都阐述的淋漓尽致。说到这儿,我觉得李总已经把大家的头脑虚拟化了。但是,无论如何,虚拟化我们刚才谈存储,从2012年开始在信息安全领域面临最大的问题就是虚拟化安全问题。大家一定要在充分的认识虚拟化优势的基础上更加充分认识虚拟化安全的问题。那么,在此我觉得我们说虚拟化能够带来企业经营模式的变化,企业IT架构模式的变化,以及资源整合的变化,或者基础架构的变化。但是,这些变化所带来的刚才李总也说了一个可控的问题,可控的问题将是虚拟化存储面临的不可回避的,或者不可逾越的问题。
那么,这个问题的解决,第一个我觉得就是对虚拟化安全问题技术的深入研究,这是一个问题。另一个就是如何正确的认识虚拟化?因为现在虚拟化为什么成为一个热词呢?其实虚拟化不是近两年才有的,随着存储技术,磁盘技术带来的就是虚拟化技术。为什么虚拟化这么热呢?就是因为云计算、大数据的概念炒作的虚拟化热了,好像如果一个峰会,一个高端的论坛如果不谈虚拟化,不谈云计算有没有价值了,好像档次就不够了。正确认识虚拟化才能够使我们未来的大数据、云计算虚拟化的领域有一个比较好的前景。谢谢大家!
邵海宏:其实虚拟化的下一步就是云计算,最开始的时候陈所长在致辞里面也已经提到了,其实云已经在中国开始落地了。那么,包括今天IBM的黄总也在提,我们现在要让大数据落地,我想问一下在座的四位专家,大数据究竟什么时候才能真正的落地?这样一个问题大家来讨论一下。
陈宝国:我说完之后可能会引来大家的一些不快。什么叫落地?落地其实是应用,应用起来了就落地了。那么,对于产业也好,技术发展也好,一般来讲有两种动力,一个叫技术驱动,一个叫做需求牵引。但是,反过来两种最代表意义的是什么?技术驱动,比如苹果确实是创新驱动去驱动的应用,苹果肯定不是说需求驱动,肯定是技术驱动,说发展的两架马车。那么,大数据的落地,刚才说大数据、云计算、虚拟化,其实我们觉得今天的会有这么多的贵宾来参加就已经表明大数据在中国已经落地了。那么,说大数据已经落地我们就不干事了吗?其实不是,大数据落地是一个点,如果普遍的在我们国内开发落地,还尚有时日。第二个问题,我们说的落地其实也是一个虚词,落地就是逐步的应用,应用是无止境的,这是第一个问题。
第二个问题,我们虽然今天在谈云计算、大数据、数据中心,特别的火,特别的热。但是,反过来看我们的厂家,我们的厂商包括李总,其实他也在煽动大家,你们快做云计算吧,快做云存储吧,赶快做数据中心吧。其实这里面有一个悖论,这个悖论在哪儿?大数据、云计算、虚拟化它的前提的基础就是这种东西能够带来结构化的变化,能够使资源更加集中,能够使效率更加提高。从2012年的数据表象看出来,已经在各级发改委立项的云计算项目已经超过500个,遍布都是云,如果2013年不知道大数据是什么,2012年不知道云就落后了。云本身应该是一个非常集约的东西,有人统计中国有七个云中心已经都应用了,现在有500个云中心。大数据又来做了,到底我们做云计算中心,做大数据中心的目的是什么?是真正用于数据的存储还是在抢地盘?这个问题比较尖锐。因为有很多城市,包括说自己是某某某绿色数据的城市,建了大概有几千亩地的云中心,现在已经成为费城,在全国招商也招不到,刚才宁老师也说到,托管,他也想别人都托管到他那儿去,但是现在可能利用率不到10%。
所以,我们在充分认识大数据、虚拟化这些热词之后,在充分理解它对科技和生产力的促进的时候,在投资上我们还要正确的理解,审视的,谨慎的对待,这个里面我觉得各加央企也好,民企也好,要从自身出发,千万不要被峰会也好,专家也好,被厂家代表也好给忽悠了,切忌,切忌!谢谢!
邵海宏:谢谢陈所长。
李刚:下来该我说两句,我跟陈所长的观点可以说百分之百一致。因为除了刚才说的我在忽悠大家做云存储,做云计算这一点,可能是我有一点没有表达清楚。但是,我在想呼应一下陈所长的话,就是陈所长刚才一上来讲到一个问题,就是是技术驱动还是应用牵引?这个很关键,这个特别关键。因为大数据来说我不看它最开始原生是怎么来的?就从现在来看,大数据是一个特别特别明显的技术驱动型的一个产品,也就是说,有那种创新的技术,这个技术突破的很厉害,就是说简短讲,从技术上讲,就是用十分十分廉价的IT基础设施,可以去支撑以前不敢想象的数据量,然后在这个数据量上做分析,这是一点技术突破。
陈宝国:这个我得打断你,大数据的代表性是什么?
李刚:比如我们放弃了对高进度的分析结果的要求,我们把这个精度可以放低,然后对原数据的比如说质量可以不去再做更多的要求和筛选,这样可以把数据量低一点。第二、用分布式的廉价的计算手段可以对硬件的价格降的很低,之前我们想象1T的存储多少,现在不价格低了,就不要求了。所以,这样的一些技术突破使得大家可以有一个雄心,我是不是可以也做一个大数据。所以,刚才陈所长说的是做什么?我把这些数据都收集到一块,建了一个大数据中心,建了一个大数据系统了,接下来做什么?这才是关键。所以说,有一个说法说未来我们需要的可能不是说大数据系统搭建的专家、厂商,对中国来说,对整个行业来说最急迫的是大数据分析师,而这个大数据分析师本身是懂得大数据里面的分析机理和理解,第二点很重要是懂得行业。我相信一个医药行业的大数据分析师他肯定是对医药行业有深入的了解,对医疗有很深的了解,最后一个比如说微小金融行业的所谓大数据的分析师它是对微小金融行业有更深入的了解。所以,这样的人才才是未来我们讲大数据落地的一个很关键的因素。所以,到不急于去忽悠,大家买存储吧,建中心吧,可能培养这么一个技术的团队,或者说一个专业的技术团队才是更为紧迫和优先的。谢谢!
邵海宏:请谢老师预测一下,大数据大概什么时候能真正的落地?
谢长生:大数据在中国应该还是处于起步阶段,我觉得要发展,更多的刚才李总说要发展大数据的分析公司,要培养更多的大数据的分析人才,只有在很多人懂得从数据中挖掘价值的时候他对数据的需要才越来越大。我也接触很多政府部门,一些公司,它反正就是把数据中心建起来,买很多存储设备,建全国最大的存储数据中心。想的很好,但是是不是有人把数据放到你这儿来,人家不把数据放进来,你那个就是一个“空城”了,就像搞房地产,建空楼一样,没人住。所以,我觉得大数据真正落地只有建大数据的分析中心,这样大数据才能真正的落地。
宁家骏:前面几位嘉宾说的观点我都非常认同,特别是陈所长站在国家产业发展的角度讲我们目前,前一阶段,或者我们部分地区对云计算这个产业发展的误区,这个讲的很清楚。但是,我也非常同意前面专家说的,我们现在老说大数据是四个特征,其实我还是说,并不是说所有的数据集完全具备这四个特征才叫大数据,或者还有一个说法,大数据本身起名字,大的含义实际上就是不能是它数据量的大就能变成大数据,而更重要还有其他的结构,比如数据结构的复杂,变化速率快,而且它有价值,这个价值是在系数矩阵存在的价值。所以,这个价值我们好像说它是一个原油,但是真正把它变成我们汽车好的原油需要精炼加固的过程。所以,至于说大数据这个东西怎么样落地,我个人觉得我们更多要有对大数据这个概念,这个理念的正确理解,第二要以应用为核心,但是我们不能说这个是遥不可及的事情,也是一个扎扎实实可以做的事情,而且现在应该说在很多行业中间也正在取得一些进展,这个得看到。
我在最后举一个非常小的例子,可能大家都知道北京市现在提出了一个叫做“自动型住房”,提出这个之后,恒大老大首先在北京周边推出2000套自助型住房,三天时间有十万家庭在那儿做了详细的登记。所以,我们可以预见恒大的老板有可能是大数据挖掘的方面看到了这样一个市场,他就拿到这样一个很珍贵的数据。所以,大数据的应用只要我们找到真正的应用场景,它的潜力还是非常巨大的。
邵海宏:我觉得宁总刚才说的这个对,其实包括大家看到的类似于双十一这样的,实际上它的海量数据是非常大,刚才陈所长提到一个问题,就是到底是技术驱动,还是需求驱动?那么,假如我今天在这儿举一个最简单的,假设我把所有的技术都可以给您,那么,我们在场的四位嘉宾畅想一下未来大数据的生活是一个什么样的状态,每个嘉宾一句话总结一下。
宁家骏:我的观点还是说一句老话,大数据的核心是删除,而删除的核心是不删除。
谢长生:我觉得大数据一个极端理想的状况就是我们发生的每一件事情都被记录下来,每一个事情都有过去,这样我们就可以这些发生的每一件事情中找到你所要的所有的规律。
李刚:我有一个想法代表我自己,在大数据时代真正到来的时候,能够大家真正用到大数据,而不是真正被别人大数据。提一个概念,信息资源运营产业将是未来最蓬勃发展,也是最有发展潜力的产业,谢谢大家!
邵海宏:非常感谢四位嘉宾精彩的分享,今天上午的主题演讲到此结束!