数据虚拟化大数据平台之利器
信息技术到底是有哪几个主要的构件。从下往上看有网络、计算、存储、数据、应用、业务,与其相关的有软件、硬件产业。这些这并不是信息产业一开始的概念,70多年前几乎是围绕着计算为中心的产业,所有做计算的人,CPU、芯片是整个信息产业的主要力量。这带来了很大的挑战,围绕着信息解决它的特殊问题的应用,每一个都建立了自己独立的数据。网络当时只是一个附加的功能,所以网络有很多很多技术、很多很多架构、很多很多协议,这带来了很大很大的问题。另外一个产业当时也做网络,当时把这些称之为通信公司,真正做计算的我们叫做IT公司。
网络技术对计算技术带来了冲击。从70年前所谓的信息产业产生时就有定律,计算讲的非常简单,就是追求更快,处理能力更大,英特尔不断的用CPU加速来做,那个方向是超级计算、高性能计算,没有朝着那个方向走,反过来是网络对计算有巨大的冲击和影响,不需要走那么精密精确控制的计算方式,而是走向了网络计算也就是所谓的云计算。云计算的产生某种产生是融合网络的条件下产生的融化效果。这样梳理我们发现IT产业由孤立的、烟囱式的方式走向了融合的网络融合的大潮,过去我们发现几个重要现象,IT的飞速发展大家都认为是因为“摩尔定律”的贡献,当时摩尔定律说每18个月计算的性能就提高一倍,这个定律在我看来在信息产业的70年的历史中,几乎60年都绝对正确和成立。但是过去10年,如果你仔细观察,发现有些现象不一样。
怎么解决这个问题?应该回到问题的根本。数据以前就有,现在所谓的大数据和以前不一样的关键点在于有了统一融合的网络平台。换句话说数据不但有冷热之分,数据还因为网络而有了生命,数据因为有了网络个体的数据可以变成整体的数据,破碎的数据可以变成互联的数据,衰老的数据可以变成鲜活的数据,数据是有它的生命周期的,这个基本原因是数据生活在网络平台上,网络是大数据应用的血液和神经。从这个角度来讲,我们解决问题的基本出发点非常简单。所有的数据都是现实,我们必须面对主要的方法是什么?就是数据虚拟化,数据虚拟化是IT产业界走过的网络虚拟化、计算虚拟化的进一步,所谓虚拟化非常简单,是把物理资源和逻辑资源相分离,换句话说数据可能存在在网络的各个角落、各处都有,各个应用都有。统一放在一个数据仓库,不单耗时、耗经费,而且有时候基本是不可能的。所以传统的思维方法把数据清洗、数据统一是耗时耗力的,甚至把这些做成以后,可能计算已经变了,因为我们的速度是由摩尔定律加上网络定律双能驱动,所以在这个基础上,我们仍然可以有这么一个概念,就是所谓的数据虚拟化,数据逻辑上可以集中,便于管理、便于使用,但是物理上存在于网络的各个渠道。
信息产业的驱动不是传统,六七十年都认为的真理,计算性能提高的驱动力,还有另外一个独立的驱动力——网络驱动力。所以信息产业是双轮驱动,现在网络驱动力量更大。这两个驱动力为大数据应用提供了前提和保证。网络为大数据提供了生存空间和生命价值。
大数据面临的,无论你是应用开发者、软件开发者、大数据的使用者、管理者或者大数据的挖掘者,都会发现你们面临更多格式、更多接口、更多新技术,说好听的是百家争鸣、百花齐放的大数据时代,悲观地说它是混乱的、复杂的、麻烦的时代。但这种时代正好给我们创新的机会,希望在座的年轻人,这是我们展现自己创新和勇气的时刻,在技术大转弯的时代,技术战略、远见、勇气容易帮助你,助你成功。
IT的大方向,融合的网络、计算的融合,大数据最终会走向相对虚拟化以后的一体化平台,相互之间是在影响,思科公司刚好在这个领域有幸能够做这样的推动工作,带动整个产业向未来的十年发展。