文/徐国允(文章来源:徐富记)
昨天,徐lady冒雨去听百度百家逼格高冷但又无比接地气的The BIG Talk,这一期的嘉宾是大数据权威专家,可穿戴设备之父阿莱克斯•彭特兰。
阿莱克斯•彭特兰是MIT的负责人,21岁在MIT学习时阿莱克斯•彭特兰就有非常朴素的愿望——电脑一定能够懂读人类。他的实验室有一个非常温暖的名字叫做“凝望人类”。昨天他从波士顿来到了北京,跟大家一起分享。
谭雅玲女士是中国外汇投资研究院院长,很多年前我就听过她对金融的思考。下面我们来看看,他们碰撞出了什么。
主持人艾诚:我们站在政府的层面,除了大数据这方面技术的提高更重要的是有一个信念的增强,那就是透明度,还有就是它的公信力。对大数据所经营的中国企业,我们彭特兰教授发现非常的年轻,但是也可以说非常的不成熟,有点急于求成,是不是我们应该更好地去理解大数据的规范,甚至是我们可以颠覆更新我们现在的规则,比如说,我们不一定要对采集数据负责,但是一定要对使用数据的结果负责,比如说我们是不是要考虑避免大数据可能造成的垄断,但这些担心和这些经验是不是可以应用到中国的金融行业呢?我们问一下今天第四嘉宾,谭雅玲女士,您所在的金融行业在大数据方面您发现最大的困惑是什么?
谭雅玲:首先是跨度太大,我们的基础不足,这个主题告诉我们,大数据开启大未来,它是未来不是现在,中国的现在跟美国之间是不一样的,基础薄弱是我们的弱点,我作为金融人跟健康有关,跟卫生有关,我们得病的机率多了,得难病大病的机率多了,疑难症越来越多了,中国解决的是保健康、保安全,中国的经济才会有希望。所以我觉得如果从卫生或者是健康的角度,怎么把大数据对接到中国是要合理、公平,使我们的医务能够让老百姓得到福利。
如果从金融这个角度来看,我们的不切实际应该是很多,金融本身可以归纳为四个字叫“信用、信誉”行业,信用和信誉要的是道德、责任和法律,这三块我们中国是有极大缺陷的,在美国借钱,借钱还钱是理所当然的,在中国借钱不还,这叫骗钱。中国的角度基础环节薄弱,我们做任何事情是跳跃式的发展,我们这个跳跃式发展,底下是空的,一旦顶端做不下去会塌下来的,美国底端是非常夯实的,这个角度来看我们应该警惕我们的风险不是盲目的大数据。
我经历的角度30年做研究,只有数据可以得出结论,但是我们要去想,我们的数据概念跟西方的数据概念有巨大差异,西方很多发达国家非常了解中国的状态,我可以讲我的经历也是一些故事。
主持人艾诚:谭院长说,中国数据概念跟西方数据概念有很大差别,您猜猜她指的数据差别是什么?
阿莱克斯•彭特兰:可能她过高的估计了西方的金融系统,金融系统在西方刚刚开始理解他们自己的一些情况,他们利用的一些测量也是很古老的,也未必是很好的,他们刚刚意识到他们还需要提高这种测量的包容度、准确度、及时度,你们也知道我们这边的金融系统的革命,中国的基础我想说是新,相对年轻,不是那么广泛,但这里也有一种好的东西,没有太多的陈旧的东西需要去除,这里面需要花很大的精力来去做这件事儿,有一个很全面的,一套测量,来测量到我们的经济。
主持人:大数据在金融行业最火的五个字是互联网金融,都是顶着大数据的帽子说,这可以解决中国金融最核心的问题,比如说风险评估,信息评估,是这样吗?
谭雅玲:互联网金融脱离了金融专业本身最基础一个东西,历练,金融本身是要经过市场的历练,只有历练了才相对比较有经验,不是任何一个人拿起金融就可以做的,风险管理是年年不断的积累能做到风控的,而不是说我看到一个财富,我看到一堆的数据我就能做风控的。所以从这个角度我们现在有的时候把金融过于简单化了,这样简单化可能在借用大数据的时候,不会得到你最终的安全保障,可能在一定程度上,我用一个比较极端的话来描述,投机取巧,成了这样的一种门道的话,对我们来讲就是不利的局面。所以我们现在处在一个生产力不足的阶段,我们是以经济为主,而不是到了金融的时代,所有的人都在做金融,如果没有实体经济再谈金融,谈金融大数据都是空洞的。
相关新闻
以下是全程记录:
(一)
主持人:大家好,欢迎来到百度百家的The BIG Talk,大数据开启大未来的现场,我是主持人艾诚。我想先问现场的朋友一个问题,这是一个什么样的时代?是最好的时代还是最坏的时代?我觉得这是一个裸奔的时代。可以想象每天早上当我被闹铃唤醒,我的手机就会不停地更新着所有的信息,所有的新闻,当我拿着早点赶上了一辆公车,当我“bi”的一下刷了一下卡,于是乎北京交通部门的电脑上就有了我的一份样本,赶到了办公室领导交给我一个任务,中午安排一个饭局,开是匆忙地开始大众点评。下午有一点困,我一定上上京东、淘宝,因为这叫劳逸结合。可是就在这个瞬间,我所有的消费数据,所有的饮食爱好都被记录下来了,到了晚上,我扫一下朋友圈,看到我的初恋男友和他现在的老婆在一起,我赞一下,这样会跟他数据之间的连接稍微紧密一些。到了晚上10点钟,决定关闭所有的电源,因为我要睡觉了,我要回到一个完全只有我自己非常非常安静的私密的环境,可能吗?不可能。因为我手上戴着这个,这个叫可穿戴设备的手表,它记录着我所有的睡眠数据,这就是一个很平凡的一天,但是我的一切一切都在被记录着,也就是说不管你是否愿意和大数据这样的概念有什么样的牵连,我们已经不可避免的被覆盖、被影响甚至被数据找到你。
我们到底该怎么办?今天在我们百度百家的现场请到了一位非常重磅的嘉宾,他被认为是大数据的研究非常权威的专家,也是可穿戴设备之父,他是MIT的负责人,在他21岁在MIT学习的时候就有非常朴素的愿望——电脑一定能够懂读人类。在过去40多年的研发里面,白天他很奇怪,他研究心理学,到了晚上在充满着各种高级机器人的智能实验室里面,他想研究人机对话,他的实验室有一个非常温暖的名字叫做“凝望人类”。今天这位专家也不远万里从波士顿来到了北京,来到了我们今天大会的现场,下面就让我们用尊敬的掌声来请出阿莱克斯•彭特兰。
主持人:您好。
阿莱克斯•彭特兰:你好。
主持人:我想象过无数遍您可能出场的景象,就像穿越电影里面的物理学家,他们都非常的冰冷,或者是非常的散发着数据的光芒,但我从来没想到您如此和蔼地出场,非常的慈祥,很温暖,是不是这样研究大数据会更靠谱呢。
阿莱克斯•彭特兰:大数据研究是一个很高端的技术,不仅仅是研究我们人类的行为,更重要的是他也跟心理相关,所以它跟你所想象的冰冷的肯定是不一样的。
主持人:现场谁知道是谁发明的谷歌眼镜?
阿莱克斯•彭特兰:是我的学生。很多人组成一个群体,然后其中有一个人对谷歌眼镜非常感兴趣,最终他去了谷歌,然后他就说服谷歌投资了很多钱,这个产品就上市了。
主持人:人脸识别是谁发明的?
阿莱克斯•彭特兰:还有类似的东西已经非常普遍了,像是做手势识别的也是从我们这个小组出来的,有一个人叫做马斯克是最开始做这个领域方面的人,也就是人脸识别。他没有发明iPhone,但是所有基于位置的服务,所有的关于GPS的最开始的,最大的项目也是从我们这个团队里出来的。
主持人:所有的发明在今天会场只有一个答案,都是教授的学生发明的,在场的朋友们是不是都有一个私心,是不是听您一堂课,做您一天的学生,是不是可以在大数据的时代抓住一点的机会稍微的靠得近一点。
阿莱克斯•彭特兰:我的学生和我开启了30多个公司,大家也可以有机会大家一起来创业。
主持人:接下来掌声欢迎我们阿莱克斯•彭特兰带来第一堂演讲,掌声欢迎。
阿莱克斯•彭特兰:谢谢。今天跟大家讲三件事情,第一件事情是可穿戴设备,第二件事情是社会物理学,这是我们使用可穿戴设备非常好的媒介,还有大数据,隐私的问题以及数据的分享所引起的担忧,一些小的问题可能由于大数据变成大问题的一些东西,这些我们今天都会讲到。这是我讲话的概要,首先从我的角度给大家介绍一下可穿戴设备。可能我的角度跟大家之前听到的是不一样的,因为我们在20年前就开始了做可穿戴设备了,在这个过程当中有很多拆分的公司,有不同的想法,我想从我的角度给大家介绍一下什么是可穿戴式设备。我们讲一下如何利用可穿戴设备了解人们的行为、城市、健康等等,我们有一个专家讨论环节,我们会邀请中国在这方面领先的人物。然后和大家讲一下社会物理学,我觉得在座各位可能都没听说过社会物理学这个概念,这是一个已经很老的概念了,有200多年的历史了,这个概念是社会学的创始人发明的,但是他的一生没有时间来做这方面的研究。通过社会物理学我们想了解一下城市、机构和文化是怎么运作的。在这个环境用数学的理论研究可穿戴设备,预测一下未来这些事情会怎样演进。最后讲一下隐私和安全,我们总是接受中国的一些高级别人物的采访,他们表达了对于数据分析和收集产生的一些问题的担忧,也许各位都有一些担忧,我们为了解决这些问题并找到解决方案,跟大家分享一下欧盟和美国在世界经济理论中所持有的一些观点以及一些解决方案和一些公司的解决方案。
我对大数据的理解可能跟很多人理解的都是不一样的,在提到大数据的时候,大家想的是搜索引擎、社交媒体,这就是大数据。我在这方面不会讲太多,大家都很熟悉这些东西了。同时还有输入数据的一些东西,比如说我们有了这些数据之后,我们才能够对这些数据有所控制,另一类型的大数据也是大家经常聊到的,而且这一点也是刚刚上线的,那就是“物联网”这个新的概念。也就是说,在生活中各个物件都有二维码还有射频识别的机制,这样电脑能够读取知道这个房间的东西到底在哪个位置,通过这些标志,计算机就知道家里发生什么样的事情,我们的家、我们的车里、我们的工厂发生了什么样的事情,这是革命性的,以前是没有的。我主要讲一下跟人相关的内容,我更想说的就是可穿戴这个概念,因为随着我们嵌入到车里还有工厂里、家里的这些设备,其实相当于把这些设备移植在我们身上了,我们在座的各位都有智能手机,每个人都在手里拿着有传感器的系统,不断地跟踪着你的位置,类似的就是现在大家开始把这个设备移植到人体,现在已经有200万人拥有可穿戴设备,而且是无线互联网的连接。
比如说理论来讲,手机上可以打电话给他们的心脏,这是很恐怖的一件事情,但是在医疗领域是非常重要的。这里我们谈的是可穿戴设备和大数据的关系,这个是最重要,最有意思的话题。大概20多年之前,每个人都开始讨论,摄像机还有电脑被嵌入到了墙上,我觉得可能会有一些更小型的电脑,我希望把这个电脑嵌入到手机里面或者是我的眼镜上,所以我和我的学生开创了第一批的赛博格集体。他们的身体上穿戴着半机械、机械性的东西开始进行日常活动,左边这张图片是1994年的图片,前面这位是我的学生,后来他发明谷歌眼镜,这位男士是第一批所有生活都在互联网上进行的人之一。其实即使是现在,这两个人所做的事情都是非常先进的,他们在20年前就做到了,非常惊人。右边这张图片,大概20多个学生随身带着可穿戴设备生活,可穿戴手表、智能手表等等,在这个过程当中学到了很多,他们能够利用这个设备做很多事情,当然有好的地方也有不好的地方,我们最开始研究的时候,会邀请外边的人过来参观,这是非常有趣的一件事情。
所以我就联系到法国的时尚学校,我们跟他们一起合作来设计可穿戴的时尚产品,我们在巴黎这个地方,在这个图片展示的是几年之后开始的第一个智能可穿戴设备的时装秀,这些就是我们的项目,叫做彭特兰项目,是以我的名字命名的,因为我是领导。我的学生发明了很多类似谷歌眼镜的东西,但是这是20多年的事情。这个学生手中的东西看起来像iphone,有指纹识别码还有连接屏幕,iphone存在之前的20、15年前左右,大家可以看到这个研究是很有意思的,它由像摩托罗拉这样的公司支持的,摩托罗拉开创了第一部智能手机,还有东芝等等,这些公司你发现都是手机方面的技术领先者,大家花钱来资助我们这样的非常有远见的项目,现在这种技术非常普遍了。所以在麻省理工,我们这样的项目,研究的就是可穿戴技术的内容,而且是比较有远见的。我们这个项目中学到了什么呢,大家在今天可以看到很多像这样的设备,人手一个,每个人都有这样的智能手机,很多定制的应用,其实我们在20多年前已经开始研究这方面的东西了。所以我们对此有所了解,我们当时也了解了现在没有在市场上投放的,有些关于健康方面的,有些是政府规划方面的,有一些可能是商业方面的,有一些是关于时尚方面的。
大家今天可以看到很多的产品,像谷歌眼镜、智能手表到处都是,而且现在涌现出了几百个健康医疗方面的可穿戴设备。还有一些设备可能是从市场角度来讲是非常重要的,你可以看到有些特殊的职业,比如说,有一些建筑的工人,他们开始使用这些可穿戴的技术,因为他们要解放双手进行工作。所以只要是这样的职业,他们就开始寻求如何进行可穿戴设备的应用,同时把双手解放出来进行工作。这告诉我们什么呢?比如说,我们穿戴了可穿戴设备之后,我们有哪些了解呢?这是我要讲的第一个内容,我一共要讲三个内容。大家对可穿戴设备的一些看法,开始把它们认为成是像智能手机一样,会传递一些信息,但是事实上,另一方面可穿戴设备很重要的部分就是他们的传感器,他们在测量你,而且把关于你的数据传送回来,也就是说通过传感器,我们可以了解到你的行为,你的行为是健康的吗?还是说不健康。我可以通过传感器了解到你公司所有员工的生活方式,了解到你公司是不是生产力非常强的,还是说生产力非常低下,亦或是出现了很多问题。我可以传感到所有城市的居民的行为,能够了解一下整个城市的运作是否是健康的,所以这是我想跟大家说的第一个信息,有一些信息对大家来说是非常令人惊讶的内容。比如说我们在手腕上戴一个可穿戴的设备,比如说手环,我们可以了解到我们的心跳,但是它传感了更多信息,我们全身有神经系统,就是我们自主的神经元。也就是说我们兴奋的话,自主会有一种反应,比如说我们恐惧或者是被什么所吸引,这是一个非常基本的一个情绪的反应。
那么,在这种情况下我们会更兴奋,我们的神经元被激活,也由此所导致,我们可以用可穿戴设备测量这部分的神经元。那么其实小的时候我们就可以做,比如说孩子兴奋的时候就可以到处地蹦,嘴不停地说,这样的话你就可以发现他们是兴奋的状态。其实我们同样可以用可穿戴设备来衡量成年人,而且会测量得更细。比如说职业的扑克牌玩家就可以戴上可穿戴设备,澳门就有这样的职业玩家,我们通过让他戴上可穿戴设备,发现他们什么时候是真正有好牌,还是说在欺骗他的对手。所以说我们让他们戴上可穿戴设备之后我们就可以衡量他们的兴奋状态或者是恐怖程度。
我们可以稍微思考一下,想一想在商务谈判中,如果说坐在谈判桌对面的人,我们可以从他们的表情中读出他们情绪的话,肯定是很有价值的,同样你可以读出来人们是否注意到了你说的话,不仅是语言的解读,也可以在相应的及时度的角度来讲,比如说在对话的时候,可以看一个人的反应是不是足够集中,你可以通过这种方式,这也是一种很有意思的方式,你可以想象一下。比如说在约会的时候,一男一女坐下谈三分钟,最后决定是不是要互换信息,我们可以非常准确地去判断到底他们彼此之间感不感兴趣,而不需要听到他们之间讲的具体内容。但是由于我们有了这样一个设备进行测量,就可以来进行了解了。
还有就是说人们的神经元系统在模仿这个角度,因为我们彼此之间可以通过这种镜像神经元来彼此观察和理解,如果你在举手的时候,那么你自己大脑皮层当中举手的这部分就会变亮,这通常会在两个人坐着得比较近的时候,你在点头的时候,我从自己的感受上会有一种一样的感觉,这就是一种能够理解或者是说互相相信的举动,这也是非常强大的一种方式。大家可能了解我们上个月邀请了杰瑞米•拜伦森,他也讲到了如何来就计算方面比较确实的东西来进行研究,但是另外一种情况下,他可以来感受大脑的情绪,我们可以了解到对方是不是在点头,如果在点头的话这个小小的计算机也就是在点头,像阿凡达这个计算机在感受人们的感受。但是实际上他有了这样一个设备,等于有30%更高的理解力。
我不知道大家在日常的表现是怎么样的,如果能够提高30%感受的话,当然是很有价值的事情。
另外,我们还有一个新公司叫做COGITO,这个公司在健康的领域聆听公司和病人的变化,看看这个病人是不是有很高的参与度,或者是说这个病人是不是很好的理解这个医生的话,这个里面是不是分析具体的内容,以及如何来进行交流,以及是不是做一个很好的判断,这个病人是不是理解医生给他的医嘱和如何服药。在美国,我们通过这样的计算机系统,与病人进行交流的时候,来理解到他们一个月会花两万五千美元的费用,来获得更好的病人依从性。并且他们也从这个行业界的专家和老专家去了解,比如说一个人的抑郁程度,聆听别人对话的时候是怎么样反应的,不是关于具体的对话内容,或者是普通的医学内容,而是反应模式,这是真正可以造福社会的。
我们可以同样做很多这样的融合,这里能展示出来我们的行业和整个时尚行业的结合。首先,第一个就是这个人在走动的过程中,我们可以来反应出来她行动的模式,当她变得比较激动的时候,她的头发就会竖起来,因为在她身上、头发里面安装了线路,当她感到非常高兴的时候,头发就会自动竖起来,大家可能不喜欢这样的发明,但是我的学生觉得是很好的发明。
还有就是不只是传感这种普通的医学内容,而是来将一个人的感受或者是说是兴趣转换为社交层面的东西,那么比如说当你和一个人共舞的时候,你们共同使用的交换的模式可以产生出音乐来,等于说你不是随着音乐而跳舞,而是音乐给你伴奏,这是非常有意思的,可以应用到灯光当中。所以说人们在舞池当中舞动的时候,他们可以创造中周边的舞厅体验,这也都是可穿戴技术。
这是另外一个公司我们叫做Ginger.IO,非常有意思的是这种创新可以拯救我们健康系统,而且为美国带来非常大的收益。这样一个小小的可穿戴的技术,到底是怎么样的来造福于人类的?它就像你可以通过发动引擎来了解车况一样,通过这个技术,可以发现你的状态不好,你的一些行为模式和病人很像,同时也可以把这个信息传到医生那边,比如说今天看上去有一些病态,护士可能会打电话问我,这个从系统的角度来看是非常有价值的,医院里面可能有三十多万的病人,然后每天可能有两百多人会生病,但是对于医院来讲不可能每个人都了解,直到他们真正到医院来看医生为止,这样的话,通常他们来看病的时候比较晚了,有这样一个系统,你可以看到他们开始有病态的时候,有倦容的时候,就可以直接接触到他们,这自然改变了医学行业的经济状态,等于是我们通过这个技术来感受你的健康,而不是我们通常所想象的信息传播方式一样。我们也可以这样应用,比如说金融和财务方面,比如说八达通的时候,你在做一些小额支付的时候,或者是说乘坐交通工具的时候,当你来看看这种类型的购物行为,然后来经过长期的记录,可以获得这样的数据,通常有一亿多人,他们可能也是使用同样概念的技术,这也不是在香港了。但是我们可以看到当人去商店的时候,这个箭头可以展示出他们去的方式,他们去超市的时候是不是去了加油站、药店、花店等等相关的路径,做一些非常有意思的分析,有几万亿的记录,还有很多有意思的事情,你可以了解到哪一个商店有可能是比较好的,比较有收益的,收入比较高的。如果他们来的顾客比较多,房地产行业会了解到这个购物中心哪些商店应该在一起,哪些东西应该分开放,因为这里有一些箭头可以展示出来,这是在商业购物方面最大的改变,非常有商业价值。
我们还可以做其他的应用,但是可能是比较令人惊讶的,比如说像在你车里边的导航,告诉你现在的交通状况怎么样,现在往哪走,至少你还可以做更好的改善,当你开始把人们与他日常的正常行为做一些区分的话,比如说以前我们使用这种方式,比如说这个人他的购物模式是这样的,但是现在我可以获得你的一个运行的数据,这样的话我可以去预测你接下来很可能会去哪,这里面判断的准确性是很高的。所以我可以了解到,到底从哪里把你接上,可以知道这个巴士应该在哪带上你是最方便的。
所以说有的时候交通非常堵塞的时候,我们可以通过交通系统的定制化来针对个人进行定制,这能够更加有效地了解到人们的行为习惯,同时你也可以更加安全地出行。比如说从汽车的技术当中,我们知道汽车是算一个比较大型的可穿戴设备了,等于是可穿戴设备带你在身上,你在车里面。
基于一些数据的基础上我们可以了解到到一个人踩刹车的习惯是不是有可能会出现交通事故,到底在这个交通事故出现前多少秒开始踩刹车,通过你的驾驶的习惯,比如说可以判断出来在接下来三到四秒里面你有50%的可能性出现事故,这是非常有用的信息,而且能够做到这一点本身是非常令人惊讶的。
我们可以来分析一个城市,从V模式到行为再到安全,以及其他的很多的方式,我们第一次使用大数据规划的时候,比如说城市规划的大数据,来自于手机或者是其他的可穿戴的设备等等,这样的话成为城市规划,成为城市更加有效的来源。
下面给大家来分享一些非常有意思的东西进行讨论,让大家看一下我们未来的社交生活,就是彼此之间朋友的网络。还有很多媒体不断讲社交图谱的重要性,很多公司的价值也是依于社交图谱之上,我给大家讲一下什么是社交图谱,我们曾经做过一个试验来去分析人们在案例当中,就是说人和手机之间的一种交流的模式,我们看一下到底有什么样的人和你一样去同一个地点,有多少人是打电话或者是说发短信,有多少人是经常成为你Facebook的关注者等等。
如果说了解到了这样的社交图谱之后,你的距离或者是电话、网络、或者是协同的定位就可以来预测你的行为。我们在广告当中就可以运用,比如说我们可以知道什么人在附近,而且还有一点,当我们谈到下载应用程序等内容的时候也是非常有商业价值的,还有数据规划,这是另外一种应用的方法。
后来我们发现通过了解,到底你和谁一起,到底你在给谁打电话,这样的话你就可以比正常的情况下有更多的机会来预测,是不是有人有可能下载某一个应用程序,而且相对于正常的商业实践来讲,我们可以预测一个人的数据规划,计划中的可能性会有翻倍增长,这是我们在亚洲国家的调查。
非常有意思的是,这样的社交图谱是有能力来更好地实现商业应用地,同时还有很有意思的是,现在它不是像Facebook这样的网络,当然这种数字的网络可以很好地来进行一些预测。但是,这种面对面的网络更加的强大,你可以通过可穿戴设备来进行感应,最近有没有和他们见面,是不是和他去了同一个地方。这是非常强地去预测人们行为的一个方法,而不是这种数据的网络。这是一种思想的变革,从我们通常去想象的方式来进行改变,当然在其他的情况下,也会有其他的意义。首先这些人是在旧金山来进行移动的情况,这是在2006年搜集的一个手机数据。那么这些比较大的点就是比较受欢迎的酒吧和餐厅。这是一个城市的起程,但是我们做一个非常有意思的数据分析会发现,在旧金山这个区域,可能不止是一个城市,可以分为七到八个不同的小城市,这等于是不同的人群的聚合。他们彼此之间总是往同一个地方聚,但是彼此没有交流过。他们很多人做的事情是不一样的,去的地方可能不一样,可能他们住得很近,可能在同一个地方工作,但是他们不是同一种人群。所以通过这样的分析,通过这种移动性的分析,我们可以实现对这种人群的细分。当然了,你也听到一些广告界的人谈到,年轻的群体,老年人群体等等。但是这里是等于通过行为将人们进行了分类。
那么用它有什么用呢?非常有意思,如果你分析不同的人群,他们彼此进行交流的时候,实际上他们不见得彼此真的认识,但是他们经常遇到彼此。那么我之前已经说过了,现在我们注重的是这种面对面的网络,他可以影响到人们的宣传,所以说你可以想象,比如说绿色的这部分人群,他彼此之间会影响到彼此的选择,他们有同样的行为类型,所以说蓝色的点上有同样的行为,但是他们行为和绿色点上的人的行为是不一样的,这是我们发现的。
我们还会发现一组人,可能是女生爱穿红色的衣服,没有什么原因,就是她们喜欢这么穿,另外一组人女生穿黑色的裙子,另外一组群体的人,他们不太愿意还信用卡的债。另外一组人可能信用比较好。所以说这等于是一种社会影响,社交影响,在群体内部,他们经常在一起所以会互相影响。这样也会和我们今天的这个嘉宾有关系,比如说他们可能会有同样的这种疾病。比如说有一组人他们可能会患糖尿病的机率比另外一组人高五倍,这不是通过对具体的行为分出来的,他们从街巷走的话看起来长得也不一样,他们的所有行为当中有一些原因使得他们比较容易患糖尿病。另外一组人可能比其他的几组人酗酒的可能性高十倍以上。
那么,他们的行为导致他们属于同一类型的人,如果你是一个公共健康机构研究者的话,你可以通过这种方式了解到这种潜在的糖尿病人群在哪,这样的话你可以把钱用在刀刃上,你还可以了解到酗酒者的是哪些人群,这样才会有效。
另外一个例子,也是这种类似的,这是在伦敦。我们从所有的交通和人们的移动当中获得两个月的数据,所有犯罪的数据。然后我们把它放在左手边做一个影射,到底这些犯罪的热点在哪里?这等于不是说人,这是说地点,然后我们发现,如果某一个地区成为犯罪热点的话,你可以进行一些预测。也就是说人们去那以后的这个行为会发生变化,比如说在一个广场上你会看到忽然之间老人不见了,他们不去这个广场了,为什么?我们具体不太清楚,但是你突然发现很多老人不再去原来特别爱去的广场了,这就是说当地发生了很多事情。往往都是预测着该地区的犯罪率上升,我们都是通过人携带这种传感器来确定这些地方到底在哪里,确定出什么地方的犯罪率将会在过去的一个月或者两个月会升高,所以这是非常的了不起的一件事。或者是说这是另外一个应用。
在过去的十年,比如说中国就遭受过这个,这种流感的袭击,比如说像SARS和禽流感等等。当然,也发明出了一些疫苗,但是有一些是没有什么效果的。也就是说中国,包括了全世界各国,现在都是受到流感的威胁。但是我们也发现了一些很有意思的东西,就像你能够区别出当人们的行为发生改变的时候,他们可能有一些疾病,那么同样的也可以看到流感的传播趋势,比如说通过人的行为变化,以一种系统性的行为变化就可以发现,你几乎可以判定这个人将会得到现在的流感或者是某一种病菌。通过跟踪这些人我可以跟你说,你患某一种疾病的风险在某一个特定的地址,在某一个时段风险是多少。
这是麻省理工大学的校园,绿色的区域是你不要去的地方,因为在未来的一个小时这些地方会有很多的人。那么这些人看起来是有这种病菌的,如果说你想避免受感染的话,你不要去这些地方。这对于我们来说跟今天的行为方式完全不一样,因为现在我们做不到实时的这么具体的预测,现在我们已经渐渐有这样的能力了,我们可以跟踪这个疾病在这个非常细的时度上进行跟踪。同时我们把这个应用到其他世界各地。比如说法国、还有非洲。我们去年授权了一个比赛。我们用所有的从科特迪瓦所得到的数据,这个国家是非常贫困的,而且近来也有内战。那么通过使用所有的这种不同数据来源的信息,我们可以绘制这样的地图,其中一个是可以通过绘制地图来改进他们的交通效率。我们可以减少10%的交通通勤时间,而且不增加额外的成本。
就是因为我们知道大家的住所和工作场所,以及他们的工作通勤时间,这样的话我们可以调整公交车的出发时间。同样,我们也可以将这些应用在公共卫生领域,应用在传染性疾病上,我们不知道人流动的方式,所以就无法正确建立公共卫生体系来减缓疾病的传染的速度。所以通过有这样的地图我们就可以帮助科特迪瓦来改进他们的公共卫生系统,以此来减少20%的感染性疾病的发病率。而且不增加他的成本,就是通过更有效率的分配资源,这一切就是因为有大数据的支持。
谢谢。我先讲到这里。
(二)
谈话部分
主持人:你也不用知道那里为什么发生犯罪,就在那个区域,哪里有流感,那里就有流感,您是可穿戴之父,您如此推崇,我想问您一个问题,您戴什么可穿戴设备?
阿莱克斯•彭特兰:我可不戴多少可穿戴设备,我其实不太喜欢,不够好。
主持人:为什么呢?
阿莱克斯•彭特兰:我有很高很高的标准,如果这个设备达不到我自己的标准的话,我就不会穿戴。
主持人:现在这些可穿戴设备有哪些缺点呢?
阿莱克斯•彭特兰:也不能够很好地告诉我真正的我所需要的信息,比如说,这个手环只是告诉我这个心率,可是我并不需要知道,让我如何变得更加具有创造性,这达不到我的要求,其实是有潜力可以达到的。
主持人:这样的话,你如何定义完美的可穿戴设备?
阿莱克斯•彭特兰:最有趣的可穿戴设备应该是可以让我去穿戴这些设备,可以让你改变你对我的想法。
主持人:如果您都不相信这些可穿戴设备,我们普通老百姓为什么喜欢它,为什么觉得靠谱呢?您坐飞机从波士顿来北京之前,我们偷偷做了一个实验,这个实验本来想挑战你的可穿戴设备之父这个名号的,我们看看到底是什么?
阿莱克斯•彭特兰:好的。
(播放短片)
主持人:看完这个短片,教授,您最大的感受是什么?
阿莱克斯•彭特兰:这些设备都不是特别完美。
主持人:我在想我花了700块钱买了一个可穿戴式手表扔了,都不计数,计的也不准,太不靠谱了。但是很奇怪,为什么它们性能这么差呢?
阿莱克斯•彭特兰:不是说有些信息都很在意。
主持人:我知道2014年年底,全世界大概可穿戴设备的生产量达到1900万,这样的设备是去年的3倍左右如果现在的设备就是这样的让人类觉得无助,我们还信它吗?
阿莱克斯•彭特兰:我想还可以吧,新上市的APPLE的设备还不错吧,当然在不同的设备当中希望能够通过竞争改善它们的性能。
主持人:我可能就关心我花了700块钱买的表到底值不值,今天的现场还有来自医疗、计生方面的专家,他们带来非常犀利的问题来质问一下大数据靠不靠谱?可穿戴设备值不值得研究,接下来请大家用热烈掌声欢迎他们,首先欢迎的第一位专家来自中国工程院院士、浙江数字医疗卫生技术研究院常务副院长李兰娟,第二位嘉宾来自国家卫生计生委统计信息中心副主任王才有,第三位专家是来自中国医院协会信息管理专业委员会的顾问何雨生,第四位专家是我们金融领域的专家,中国外汇投资院院长谭雅玲嘉宾,有请四位嘉宾入座。
刚才四位嘉宾听到了阿莱克斯•彭特兰教授关于可穿戴设备的演讲,也看到这个令人有些失望的视频,今天你们来到现场带来最关心的问题是什么?
李兰娟:我从事医疗卫生工作几十年,我最关注的是大数据时代将如何推进医疗卫生事业的变革。
主持人:大数据如何改进中国的医疗行业是吗?
李兰娟:对。
王才有:关于大数据最关心的问题是什么,因为我来自于原卫生部统计信息中心,现在叫国家卫生计生委统计信息中心,一直做数据工作。我们有两大职能,一是数据,一是信息,大数据面对领导决策需要信息,公共卫生控制和改进人们的健康需要信息,我们的医生给病人看病也需要信息,对数据的需求是原始的动力。大数据来了,你喜欢也好,不喜欢也好,我们一定要去应对,我们希望大数据技术可以在中国的政策决策、公共卫生和居民健康改进以及医疗方面发挥出重要的作用,这是我最大的期望。
主持人:大数据来了只能拥抱。第三位嘉宾,何雨生先生,让我们了解一下您最关心什么问题?
何雨生:我一直从事临床医学信息的研究,非常关心大数据如何开创我们未来医学的研究,引导我们医学的发展。
主持人:很大,我们看到第四位嘉宾是金融行业,来自中国外汇投资研究院的院长谭雅玲女士,您能用一句话告诉我们,最关心什么问题吗?
谭雅玲:关心金融大数据能否给中国的银行业带来更强的竞争力,使我们的金融安全得到更有效的保障。
主持人:在整个论坛互动环节,现场所有朋友都可以通过找我们百度百家的二维码和现场嘉宾进行互动,提交您的问题,可以是质问,可以是怀疑,谢谢。在开始跟教授交流之前,我倒是有几个问题想问一下各位专家,也让我们教授更好地了解中国的大数据现在处于什么样的阶段?我们先从李院士开始,现在讲医疗大数据,非常火,尤其是移动设备的医疗大数据,网上铺天盖地的一个词就说这是个伪命题,中国很多数据,我们中国的医师的数量,持证医师的数量还都没办法统计准确呢,谈何大数据医疗呀,您能不能做一个简单的回应?
李兰娟:大数据事实上是无时无刻都存在的,即使我们以前没有叫大数据,但是我们在医疗工作当中也已经在应用一些大数据,无非就是它数据的范围、数据的内容、数据的质量不一样而已,现在互联网时代,大数据意义的提出使人们更加重视大数据。所以像我们医疗过去有统计学,在因果关系上比较重视,现在的大数据从事数据的关联性,尤其网络时代的到来,我们每个人的身体上有海量的数据,在我们医疗工作当中也有海量的数据,这些数据在信息时代的到来之时,它的语义怎么样更加标准、更加统一,这数据的质量如何提高,数据的利用以及数据的应用就会发展得更快一点。
主持人:刚才我问的问题是如果当一个国家,连最起码的持证医生的数量都没办法统计的时候,怎么谈大数据的应用呢,是不是我们距离刚才教授所描绘的大数据时代还有一个很长的距离?
李兰娟:所以我觉得对大数据时代的到来,我们大家要进行研究,怎么样做好顶层设计和做一个规划,当然需要,好多问题,标准往往是滞后的,事实往往是先发生的,所以我觉得我们还是要弄清大数据的概念和理念来应对这个大数据。
主持人:在您描述的时候,其他三位嘉宾和教授都在非常仔细的聆听,因为可能需要先了解中国在各个领域行业的一些现状,然后才能有一个针锋相对的交流。
李兰娟:最近刚刚发表了一篇文章,关系到人的微生态的大数据,人的细胞,人的基因大家都了解,但事实上人的肠道的细菌数量是人的基因的10倍、100倍,所以这又是一个新的大数据,这篇文章是260多万个基因的数据的分析,与健康有很大的相关性,所以这篇文章刚刚发表,也是全部范围大数据的应用。
主持人:李院士,今天彭特兰教授坐在您身边,如果问他最犀利的问题,您想问他什么?
李兰娟:我想问他今后大数据如何能够更好地应用?
主持人:应用到哪个具体行业?
李兰娟:应用到人的健康行业。
主持人:这是个很大的问题,如何将大数据如何更好地应用到人的健康行业?
阿莱克斯•彭特兰:大家说得非常好,在刚才的医疗体系当中对大数据而言还是有很多的机会,虽然说我们还要做很多的努力,当前来看,我们首先要更好地去理解传统外的一些人们的行为,比如说不同医院之间的合作,我们日常的一些行为,关于基因的信息,如何进行很好的合作,如何防止某种疾病。比如说,糖尿病,作为单独的疾病,我们来看很多人都认为,它其实是和很多不同的疾病是紧密相关的,是跟我们基因信息紧密相关的。所以我们现在再通过看很多行为的数据,我们就可以得出不同的疾病更多的衡量标准。另外一方面,我想说的是。我想说,如果改变一件事情,并不是说全部进行改变,而是说从一个部分开始,一步一步地去推进,可能对于非常贫穷的地区而言,从点开始,不是一下子把贫穷地区的疾病状况都解决了。
主持人:中国对于移动大数据的研究还处于非常早期的阶段,但是在国际市场上,我们能找到让人不安的反例,比如2009年的时候谷歌因为成功地预测了流感,在那个领域非常有名望,2012年的1月谷歌关闭掉了那个部门,因为没什么影响力,也没办法赚钱。所以即使中国的技术够先进了,那是不是就可以实现充分地利用移动端的数据来帮助改善我们的医疗状况呢?今天我们还请到了一位来自医疗行业的专家。
阿莱克斯•彭特兰:我觉得有几种,一个是用来预测像洪水、饥饿等等的一类数据,还有一类疾病控制的大数据,就像你说的全世界的医生去寻找疾病分散的迹象。
主持人:您有信心吗?中国目前离可以利用数据给人家看病,让我们中国的医疗发生翻天覆地的变化,到底有多远?
何雨生:我们不要老期待着大跃进,而且我们应该抑制大跃进的心态,大数据是重要的方向,而且在各行各业有更大应用,不要期待一天就把罗马建成,而我们不断地积累数据,不断地研究方法,不断地完善我们的方法。另外,我们还要经常试图找到适合我们国情的很多技术,比如说像可穿戴技术,可能有很多很先进很重要的可穿戴技术,在中国很多医院里面很简单的技术但非常实用。中国有偷孩子的情况,这种情况在其他国家可能很少见到。这种情况在我们国内用一个可穿戴的腕带就可以很好地防止,这是很好的数据,可穿戴设备,这是一个很漫长的过程,我们在不同的阶段善于发现这种机会,不断地完善,这是一个很重要的过程。
主持人:今天你看到教授在可穿戴设备在医疗方面具体的案例,您觉得可以应用到中国吗?
何雨生:当然,全世界都在重视可穿戴设备,尤其在医学上,人的生命总是最重要的,尤其是老年人和一些高危发病人群,所以这个时候我们经常需要实时的数据,对于保护他们的健康是非常重要的,我们传统的数据收集过程,医院是被动的,被动的提供服务,真正需要知道自己需要医疗服务的时候,病人才去医院,而病人不是医学专家,下一代医疗将提供主动的服务,病人不知道有不好的生活习惯造成疾病的时候,医院主动提供医疗服务帮助他预防,在他有病前期的表现来提供这种医疗服务,而这时候可能这些信息的获取非常重要。现在有一个很大的问题,可穿戴设备在医疗中间,尤其是可穿戴的,要求是无损的,总不能让病人带核磁、CT满街跑,我们很难在很短的时间有这么大的突破,现在传感器只能获得一些简单的病人的信号,甚至于现在糖尿病、血糖的指标也都很困难,大家努力尝试做这件事情。在座有很多年轻人,假如你要致力于去开发这种传感器,你也不用开发大数据,也不用去做什么,你只要把你的传感器卖出去就可以挣很多的钱了。
主持人:没错,今天开场的短片里面为什么戴的手表测出来的步伐不一样,核心就是没有它的传感器,在中国是鱼龙混杂,质量没有保证,面对这样在中国医疗很关切的问题,教授您怎么回应呢?
阿莱克斯•彭特兰:这是一些商用的穿戴设备,不是设计的时候就要非常高精度的,只要有一致性就好了,跑的多数据大,跑的少计数小,不一定非常准。当然讨论到孩子的时候一定要非常精确,如果做研究,把他们校准的更好一点,我们可以做出这种设备,我们可以给医院,连大的设备都做了,小的设备为什么不能做呢,价钱也可以接受,中国能做很好的一种工程研究。
主持人:如果说医疗教授给了一点建议,我们再来看看中国特色的一个部门就是我们国家计生委,我们有请王才有先生,先问一下彭特兰先生,您知道中国的计生计划知道吗?
阿莱克斯•彭特兰:确实是一个很复杂的政策,也有好的一面,也有不好的一面。
主持人:这个工作一定非常不容易,因为你要用传统的统计,现在还要引进大数据的科技,这个耗力耗时能否跟我们介绍一下,让教授了解一下计生部门在做什么?
王才有:这是一个问题,我的背景是卫生部,卫生部和国家计划生育委员会刚刚合并,对于计生方面的数据采集是我的弱项,不便在这里讨论,我长期从事卫生这方面的工作,我们叫卫生统计信息中心。
主持人:我做一个开场,这样教授比较好了解,中国的计划生育从1970年开始的,到了现在这么多年,人口减少了,因为这项政策减少了4亿,但与此同时,我们也可以想象政府部门推进这项政策或者统计真实的数据,要耗费大量的人力、物力和财力,看到教授关于大数据,关于可穿戴设备的介绍,我们是不是能够借用这样的力量更好的帮助您的工作呢?
王才有:我们主题讨论的还是可穿戴设备在医疗卫生领域的应用,可穿戴设备作为信息采集的一部分,何老师讲了,主要采集人类健康信息,因为采集这些健康的信息,对于确定患者疾病的类型、种类以及治疗的方法是非常重要的,你像采集发烧的信息,仅仅采集体温的信息不能确定你是什么病的,从现在一些理论说,一个发烧的症状背后的疾病可能是四万多种,但是怎么能由发烧确定出四万多种得的什么病呢,如果小医生只是问问昨天吃什么了,穿什么了,可能确定你是否得了感冒。这是大数据在医疗领域里面的应用,我补充一下确实是非常广的,但不是说在计生方面的工作。
主持人:您的背景是统计吗?
王才有:信息,我是学信息技术的。
李兰娟:我们国家有很大的卫生规划,我是卫计委的专家组专家,我们对全城的健康信息采集,建立每一个人的电子健康档案,我认为未来的大数据,这是一个非常好的工作,电子档案中,婴儿检查、孕妇检查,中年、老年以及到临终的一个人一生的健康数据的记录,也就是刚才讲的个性化的健康记录,在中国变成了可能,这个数据比较可靠,有一定的标准衡量的数据,也有标准化的结构化的电子健康档案电子病历,这样一个区域数据中心的数据,将来对国家政策的制定,医保、医院管理、以及个人健康管理有很大的作用。
主持人:刚才您听了三位来自卫生健康领域的嘉宾的讲话,其实是在给您介绍中国在大数据医疗方面已经进展到哪些,已经准备了哪些,以及期望着什么,您觉得横向比较,跟美国现在的现状差距在哪里?我们可能可以攻坚的部分是什么?
阿莱克斯•彭特兰:这个问题很好。在欧盟,所有的这种规划委员会或者是规划组织他们都是可以使用大数据来获得更加准确的,更加快速的获取可用的数据,所以说对于大多数的国家来讲每三到十年,都会来去分析一下到底有多少的医生,有多久去看一次医生,通过这样的数据你就可以来回答很多的问题。这自然会给我们带来更高的透明性,更高的可靠性,无论是对政府还是说政府性的组织来讲都是如此,这可以在全世界任何一个国家来讲都是很重要的,不光是中国,因为你如果来不了解当前的情况的话,你是没有办法来去行动的,你必须要去了解这些情况,才能够有一些非常合适的反应,然后有足够的知识来去克服这些问题。这是非常必要的。所以关键的一点,我们现在知道中国政府有非常强的这个关于大数据方面的承诺,不光是在欧洲。所以说很多的差别在公司的层面。
我们说一些很重要的事情正在发生,我们听到中国的政府有决心要开始严肃对待大数据,我觉得不同的地方是在于在公司领域,在商业领域,中国的公司对于大数据来说,比较年轻,他们在起始的时候,他们不是百年老店,所以他们是刚起步的公司,他们有一个年轻公司的心态,但是在欧美,他们这个公司更加成熟,建立时间有一段时间了,他们的心态更多考虑是可持续性,他们还没有意识到,新的技术可能使得我们已有的公司会蒸发,比方说有些大的公司,十年前的大公司现在可不能算什么大公司了。所以说从20年之后可能又有其他的一些大公司出现。所以说在大数据的世界里面,到底我们的立足点在哪,我们如何和政府进行合作,如何进行分享等等。
主持人:我们站在政府的层面,除了大数据这方面技术的提高更重要的是有一个信念的增强,那就是透明度,还有就是它的公信力。对大数据所经营的中国企业,我们彭特兰教授发现非常的年轻,但是也可以说非常的不成熟,有点急于求成,是不是我们应该更好地去理解大数据的规范,甚至是我们可以颠覆更新我们现在的规则,比如说,我们不一定要对采集数据负责,但是一定要对使用数据的结果负责,比如说我们是不是要考虑避免大数据可能造成的垄断,但这些担心和这些经验是不是可以应用到中国的金融行业呢?我们问一下今天第四嘉宾,谭雅玲女士,您所在的金融行业在大数据方面您发现最大的困惑是什么?
谭雅玲:首先是跨度太大,我们的基础不足,这个主题告诉我们,大数据开启大未来,它是未来不是现在,中国的现在跟美国之间是不一样的,基础薄弱是我们的弱点,我作为金融人跟健康有关,跟卫生有关,我们得病的机率多了,得难病大病的机率多了,疑难症越来越多了,中国解决的是保健康、保安全,中国的经济才会有希望。所以我觉得如果从卫生或者是健康的角度,怎么把大数据对接到中国是要合理、公平,使我们的医务能够让老百姓得到福利。如果从金融这个角度来看,我们的不切实际应该是很多,金融本身可以归纳为四个字叫“信用、信誉”行业,信用和信誉要的是道德、责任和法律,这三块我们中国是有极大缺陷的,在美国借钱,借钱还钱是理所当然的,在中国借钱不还,这叫骗钱。中国的角度基础环节薄弱,我们做任何事情是跳跃式的发展,我们这个跳跃式发展,底下是空的,一旦顶端做不下去会塌下来的,美国底端是非常夯实的,这个角度来看我们应该警惕我们的风险不是盲目的大数据。
我经历的角度30年做研究,只有数据可以得出结论,但是我们要去想,我们的数据概念跟西方的数据概念有巨大差异,西方很多发达国家非常了解中国的状态,我可以讲我的经历也是一些故事。
主持人:谭院长说,中国数据概念跟西方数据概念有很大差别,您猜猜她指的数据差别是什么?
阿莱克斯•彭特兰:可能她过高的估计了西方的金融系统,金融系统在西方刚刚开始理解他们自己的一些情况,他们利用的一些测量也是很古老的,也未必是很好的,他们刚刚意识到他们还需要提高这种测量的包容度、准确度、及时度,你们也知道我们这边的金融系统的革命,中国的基础我想说是新,相对年轻,不是那么广泛,但这里也有一种好的东西,没有太多的陈旧的东西需要去除,这里面需要花很大的精力来去做这件事儿,有一个很全面的,一套测量,来测量到我们的经济。
主持人:大数据在金融行业最火的五个字是互联网金融,都是顶着大数据的帽子说,这可以解决中国金融最核心的问题,比如说风险评估,信息评估,是这样吗?
谭雅玲:互联网金融脱离了金融专业本身最基础一个东西,历练,金融本身是要经过市场的历练,只有历练了才相对比较有经验,不是任何一个人拿起金融就可以做的,风险管理是年年不断的积累能做到风控的,而不是说我看到一个财富,我看到一堆的数据我就能做风控的。所以从这个角度我们现在有的时候把金融过于简单化了,这样简单化可能在借用大数据的时候,不会得到你最终的安全保障,可能在一定程度上,我用一个比较极端的话来描述,投机取巧,成了这样的一种门道的话,对我们来讲就是不利的局面。所以我们现在处在一个生产力不足的阶段,我们是以经济为主,而不是到了金融的时代,所有的人都在做金融,如果没有实体经济再谈金融,谈金融大数据都是空洞的。
主持人:急功近利、投机取巧,李院长不同意了。
李兰娟:个别的不良现象,中国存在,美国也存在,并不是说美国都好,我们什么都坏,我认为我们中国大多数是好的。
谭雅玲:没有说美国都坏,美国高级化和现代化,美国精端化是超越全世界的。
李兰娟:我们很多还是超越他们的。
谭雅玲:我自己经历的角度,80年代、90年代他们跟我们打交道的时候,他们不跟我们讲故事了,这就是现实的竞争,国家的战略。
主持人:大家大部分是好的还是坏的呢?
阿莱克斯•彭特兰:确实是大部分还是好的。我们待会儿要进行第二轮的环节演讲,然后再进行互动。
主持人:我们看第一个问题,提问教授的,在未来的五年,个人计算终端手机将会降到1000块钱以内,全球70亿人口也就意味着将需要70亿个上网的终端,需要1.2亿个APP来服务,这是人类历史上规模最大的一次生产,在阿凡达的世界里面有70亿的人,有1.2亿个应用程序,人与人之间该怎么协调呀?是能扮演世界警察的角色让大家和谐呢?您笑了,觉得问题太难了,还是太简单了呢?
阿莱克斯•彭特兰:其实这个问题就好像说谁要掌控英特网一样,这两个问题本质是一样的,我们也不是说企业来掌控它或者是谁来掌控它,其实非常清晰的是这个软件是一种服务,服务的话,我们应该要更好的去找到它这个价值。所以我们应该要停止了,因为这不是我们要讲的重点。
主持人:非常的贴心,考虑到今天下午有三个环节。下面进入茶歇环节。
(三)
主持人:我们下一场的活动即将展开,请现场的各位嘉宾陆续就坐。还没有加入我们百度百家微信平台的朋友,可以随时扫码加入,这样就可以随时向嘉宾提问,我们可以在会议过程中帮您解答。
主持人:欢迎回到百度百家的The BIG talk,大数据开启大未来,我是艾诚,刚才在教授的演讲中,让我不禁联想起一个场景,是不是有一天早上,我起床需要做的只有一件事,就是睁开眼睛,因为我不需要思考了,微信会告诉我是谁,微博会告诉我我在想什么,邮件会告诉我我该跟谁交流,百度会告诉我我关心着什么,谷歌地图会知道我要去哪里,这样想起来是不是也挺可怕的,这样是不是也不是特别的科学。我倒是特别特别怀念经常犯错误,犯迷糊的一个人,这是我之所以为人的部分,我的可爱,我愿意为我的错承担责任,到底大数据会如何改变我们的生活呢,又会创造什么样的商业模式,我想在座的朋友都有这样一个问题接下来的时间交给我们的教授,让我们的教授开启第二部分的演讲,大数据、人性、组织的关联。
AlexPentland:上一段我的报告我说的可穿戴设备,以及它们告诉你有关你的信息,现在我给大家讲一下社会物理学,社会物理学有两百年的历史,科学革命的前夕就有这样一个概念,而且我们也有数学的理论来支持社会和组织是如何运作的。通过这种研究方式我们改进社会的和谐程度和运行的效率,以及创新性。这就是我这一节要跟大家讲的内容。我觉得真正的可穿戴设备的未来,不是衡量自己,而是要测量你和其他人的互动,测量你作为一个社会性的动物的方方面面,这是我们过去几年做的,那么就建造一个小的电子元件,像名牌一样这样大小,放在你的身上,他们可以传感到你,那么从传感器中得到的数据,我们就能够建立一些数学模型,我们可以通过这些模型告诉我们这种互动的方式比另外一种互动的方式要更好。这种方式更有利与建立互信,更好的做好决策。那么其他的方式不如这种方式好,有关于各个群体或者是说一个组织怎么样提高效率的这个方面有很多的理论,甚至是说一个国家,但是所有的这些理论都没有数据支持。
数据很小,那么举几个例子。大数据的诺言之一就是我们真正的能够了解我们自己,了解我们所在的组织,以及我们的文化,这是我这一节要跟大家讲的,我觉得这是我们非常兴奋的一点,而且我们刚刚起步。那么我们的做法首先是通过手机,因为每个人都携带手机,我们希望能够在手机上有这种嵌入我们所做的电子元件,因为它可以衡量我们的音调和手势,现在这个手机还没有这种功能,但是也许在不远的将来,手机对于你的社交环境的了解,比现在所知道要多得多。
那么,这是一种新的可穿戴的技术,大家肯定非常感兴趣,如果我们能够做到这一点的话,我们能够传感到人与人之间的互动的话我们能够实现一些什么呢?首先我们做的一件事,也是科学这个杂志上出版了,科学这个杂志是全球顶尖的科学界的杂志。那么我们雇佣了几百个从街上找来的人,我们把他们分成小组来解决各个问题。那么这些我们都是仔细的分组,而且仔细选择的难题。通过这种研究我们可以发现他们成功的原因,我们了解他们的智商和个性等方方面面。那么在这个过程中大家猜猜我们发现了什么,我们发现对于一个小组的智慧最重要的一点是人与人之间,小组成员之间一个沟通的方式。是不是每个人都积极参与了,是不是都贡献想法了。而不是长篇大论的的单人演说,是不是大家都互相了解,这三点都是非常重要的,就是说每个人的参与,每个人想法的贡献,以及互动,这三点比其他的任何的要素都要重要。
比如说小组成员的智商、个性、培训的背景,这些跟这前三个要素相比都是非常微不足道的。所以说我们发现了这个想法的交流,思想流对于一个小组,对于一个集体来说产生了一个所谓的集体智慧。事实上这相当于智商,你可以测量一个小组,一个集体的智商,通过看他的思想流是怎么样的,这非常基本一个概念。左侧这个小组有几个人主要的来进行演说,而第二个小组可能是大家发言的机会都是均等的,第二组更好。
那么我们知道这个呢并不是偶然的现象,因为我们可以给大家证明一下,要想改变一个集体的智慧,那你就需要改变他们的沟通方式。比如说我们找了一组工程师,一半是日本人,一半是美国人,我们观察他们开发新产品的过程,他们设计大项目的一个过程。那么在每天的最后,我们画一个图,像这样的图,大家可以看到跟第一天相比,就是说左上角的第一天,有一些人没有对小组做什么贡献,有一些人就是说占有了绝大多数的发言人,这并不是很好。所以说我们给他们的反馈是通过我们的可穿戴设备可以测量他们的行为,随着时间的推移,他们在这个方面做得越来越好,因为他们知道,如果大家都沟通的话才是一个很好的方式,所以第七天的时候你可以看到几乎每个人都是在做贡献的,都是在彼此互动的,这个时候这个小组的生产率是更高的。
那么我们也有远程的小组,也可以做到这一点。那么现在公司所面临的一个问题是如果是小组成员面对面的沟通是没有问题的。但是只要他们在远程进行沟通的话他们的合作就不是很有效率。所以说我们就做了这样一个现实,这个现实中你可以看到有四个人,两个人在一个位置,另外两个位置,另外两个人在另外一个地方,你可以看到其中两个人总是在说话,所以说这个球型就变成灰色了,因为这并不是一个很好的小组。很有意思的是如果把这些图片告诉这些人,他们就可以很快的改变沟通的模式,这个位就变成了位于中间的绿色的球,这就意味着这个沟通是非常具有包容性的,每个人都在做贡献,这就提高集体的智慧,如果说小组的行为能够达到右侧的这个图片的话,他们的智商更高,互信更高,表现也更好。还有一点是通过传感器返回的人与人之间的沟通,我们提供一个配方,提高集体的智慧,使得集体的工作效率更高,这不光是适用于小集体,大公司也是共用的,这个图片是德国的公司,有五个部门,管理、开发、销售、客户服务,这里我们可以看到有意思的一点是我们以前没有看到的,下面是电子邮件一个沟通。红色的是面对面的沟通的模式。所以我们可以看到很奇怪的一点,任何一个公司最有价值的一个东西是他们的想法,以及这些想法的沟通,但是全球没有一个公司是跟踪这些想法的沟通的数据。
那么,我们可以看到这个公司,我们跟踪了这个公司,他们一个沟通的方式之后,我们发现这个是最开始的时候的一个方式,那么,经理是发出很多的蓝色的邮件,然后有很多的会议,但是没有跟客户服务进行很多的会议的沟通。所以说就产生了灾难性的后果。他们这样的话每天和客户服务进行沟通,开会,看看出现了什么问题,这是很多的公司所经常重蹈的覆辙,这就是说明沟通的障碍。
这也是为什么这个公司效率低下的原因。通过衡量和测量这些沟通方式,我们可以给他们开出一个更好的药方,可以使得公司的生产效率更高,创意和创新更高。我们在几个公司中发现了两种主要的沟通方式,一个是红色的这种。那么这是指一个工作组内部的沟通,我们把它称之为参与。因为它是指彼此的参与是怎么样的,但是是数学一个测量,但是呢你完全可以通过直觉来测量这一点,也就是说每个人是不是都是在这个沟通的圈子里,那么彼此的沟通是不是充分的,所以这就是我们的,这一点做得越好,这个小组的生产率就越高。这个通常是公司生产率的一个唯一重要的指标。比个性、智商、工作岗位的时间和经验是更有重要的意义的。也就是说彼此的沟通,这个不是会议,这是在这个茶歇的时候,比如说走廊休息的时候,这种沟通,这是指大家彼此是不是足够的尊重对方来进行很好的沟通,这可能是占到生产率的40%的一个重要性。
另外一个方式是探索型的,也就是说这个是指他们是不是做了一些他们的老板没有告诉他们去做的。那么每一个组织都有一个组织的机构图。那么他们是不是这个跨越了他们组织的内部去跟其他的部门进行沟通的探索。
如果能够打破的话,那么这个组织就更有可能具有创造力和更有效率。那么比如说像在发展新药的时候会有博士或者是说生物方面的专家。那么这个过程创造一款新药的过程中,这个公司作为一个整体来讲是否可以打破这个界限成为一个关键,彼此之间要进行交流。他们比如说可以和销售,可以和这种高层都可以进行互相的交换意见。这样的话才能获得不同的观点,直接和他们的创新和创造是密切相关的。
这就是来改变社交关系的一种模式的变化,从而能够改善效率,以及创新,所以说在2012年这项研究获得了哈佛商业评论的年度大奖。并且还有在一些管理学院很多也都借鉴了这样一个概念,这是我们需要来注意的。
下面我再给大家一个比较实际的案例,那么比如说我们这个研究是一个呼叫中心,然后进行了他们这个沟通的一个类型的分析,这里我们发现了与其他人进行更多交流的这些人是效率最高一个人群,与其他人进行交流,在这个呼叫中心实际上是违规的,甚至是有可能为此被炒鱿鱼,但是还是有人会进行一些交流。当他们这样做的时候,他们谈的是比如说老板生气的时候,你做什么,如果说出现新的活动的话,你怎么做,在工作中有没有什么小窍门等等。
我们在与人交流的过程中改变了呼叫中心的规则。我们让呼叫中心,让大家随时可以进行一些休息,可以彼此之间进行交流,这样的话可以更好的来进行小经验和小窍门的交流,这样可以彼此进行支持。实际上他并不想呼叫中心做这样的改变,因为之前从来没有做过,但是我和他们的导师进行了交流,最后终于实现了这样一个目标,我们从原有的比较稀少进行交流的一种模式,转变为交流比较密的模式,一年内节省的一千五百万美元的成本,这个本身付出的支付却是零成本的。也就是说这样的可以让他们的员工更好的了解一些做工作的小窍门,我们看到在一些西药开发的公司,在一些这种白领的或者是说蓝领的工作人群当中都看到了这基本上是一个常有的模式。
除此之外我们还可以在我们日常生活中看到类似的情况,我之前给大家看过这么一张幻灯片了。它是一个购买类型的这么一个例子。也就是说一个人从数据库的角度,甚至是能够跨越到一亿多个美国人的这么一种信用卡记录模式的记录方式。大家可以看到人们可能去不同的地方,不同商店进行购物。但是你可以看到有一些商店比较小,那就是说人们通常不太去,那么有一些店比较大,说明去的人比较频繁。如果说我们进行一些分析会看到他们的参与和开发,还有包括他们的购物的类型,这个参与实际上是一个人们通常去的一个核心的内容,那么对于开发这个模式,也就是说通常人们去得比较少,那么非常有意思的是如果你对他们进行一个图表的映射的话,你会看到一个人可能从低收入的人群来讲的话,他们大多数是不断的持续在同一个商店来进行购买,他们的这个忠诚度就比较高。但是他们不太做很多的探索和发现。但是随着他们的收入往上提高,那么他就会做更多的一些探索购物。
实际上我们可以通过这种方式评估一个人的还债能力和通过做探索性购物的数目来评估一个人的收入,不光是如此,我们看一个城市的某一个街区,然后看到底在这一部分城市的这个角落他们做多少探索性的购物,通过这种方式就可以来预测在的三到六年里边的这个街区的财富的发展趋势。也就是说随着他们的探索加多,他们可能会变得更加的富余。所以说这是一种更加具有创新性的方式,好像我们现在有更多的探索性的集群,或者是说更加有效的,更具有生产力的方式,从而给我们导致更多的新的想法的诞生,所以这些都是总体的人类的特性。如果你想做更多的一些分析,让人们更多的进行参与,如果你想要更多的创新,那么你肯定要找到一些新的选择,这样的话我们可以用大数据的方式通过很多的方式来进行记录。
我这里给大家展示一下在社交网络上的情况,大家可能对这种数字的社交网络是非常感兴趣的,这是一个社交网络,是非常不同的,同时也是一个财务网络,所有这些人在网上进行股票的买卖,然后进行黄金或者是贵金属的买卖等等。因为这是一个社交网络,人们还可以彼此之间交换经验,彼此之间关注。比如说我认为它非常聪明,所以说我觉得我拿出一百美元,他买什么我就买什么,所以通过这种方式可以关注这个人,他算是我的财务顾问式的。然后我可以在这个网络里面,社交网络里面作这件事,这个问题就是说到底挣钱的最好的策略是什么?是读报纸,来自己分析浸种趋势还是说找一些人去关注他们,或者是说在社交网络上来关注很多的专家,所以说这对于社交网络来讲,他的作用就是说在于如何帮助我们做更好的决策,真正的问题是在于社交网络让我们变得更加聪明了,还是说经傻了。有了这样一个社交网络,我们就可以找到答案,你可以看到人们挣的钱多少,如果说变得更傻了,就会损失钱,更聪明了,钱就挣得多了,我们分析出来这样情况。
在底部这个位置,到底他们的社交程度有多高,到底有多少,接触到多少不同的一些想法,在左手边是相对来说比较孤立的,也就是说自己进行买卖,读报纸,来自己找趋势的人。那么在中部部分人群,某种程度上有社交性,在最右手边的这一端的人,他们是关注不同的人社交性很强。如果我们再看一下在投资回报率方面是这么一个曲线,如果是自己来做决策,通常是愚蠢的,别这么做。和每个人都进行交流,然后做财务决策,也是很傻的,不要这么做。
但是,找一小组人里边有不同意见的一些人,共同的构成,这会让你更加的有钱,因为通过这样做的人位于这张图表的中部可以比自己来进行交易的人多挣30%的钱。所以你可以看一下对比中部和孤立这部分人可以在探索更多这部分人,也就是说这里有一个峰值,如果你超过这个峰值的话,等于是你超过不同的意见,在你身边流来流去。所以说并不见得是一件好事。我知道可能大家吸收这些知识需要几秒钟时间。但是这是大家挣钱的模式。这也是哈佛大学商业评论的报纸上专门有讲过的这样一个研究,多年以来,可以被证实应该算是正确的,所以我觉得大家应该要注意。我们还可以做的非常有意思的一点,就是说我们把它叫做一种这种就是说雅典智慧的方式,在商业模式如果你太社交化了,每个人的意见你都去听,彼此之间都互相关注,这个时候人们挣的钱并不见得很多。但是呢,你拥有商业社交网络的人并不愿意这么做,因为如果你的客户不挣钱,就不会交费,不交费你也挣不到钱。所以我们会发现在一个比较混乱的群体状态当中我们做了一个非常有意思的试验,我们给客户发优惠券来打乱这样一个社交网络,让人们停止来去关注太多的人。
比如说我这里给你20美元,如果你不去关注那么多人,你只关注几个人,那么你就拿到20美元,我们总共送出四万美元,那么得到一个结果是怎么样呢?这个网络中好几百万的人在投资回报中获得了双倍的收益,那么就是说通过四万美金我们可以让一百六十万的人实现了投资回报的双倍发展。当然拥有这个平台的人他们是致命的。因为他们是从四万美元当中挣了一千四百万,他们中间肯定要做更好的一个对冲了。但是对于所有人来讲,都算是一件好事,你可能会问我说他们钱挣了两倍以后他们干什么呢?没几天之后又变傻了,又开始彼此之间进行关注了。
肯定的,这些事情也不是一次性能解决的。
这是来使用这种可穿戴设备最基础的个工作,就是说来感受这种关系,他们之间的这种参与和期待,然后人类群体的一种成功的反应春来,我们是不是可以使用它来设计更好的城市呢?答案是肯定的。所以如果我们看一下面对面交流的模式,那么我们这里也说过,面对面的模式更加重要,那么电子设备并没有改变人们太多的行为。我们这里要使用一些数学方面的概念,有一些人是离得比较近,有一些离得比较远,所以你们可以想象一下他们的参与和探索,这样的话你可以来从中找到一些等式。非常有意思的是,你发现你可以把一个城市或者是说一个州然后设置出你的这个社交的多样化,对于一个州或者是说一个城市来讲,到底与其他的不同的城市,其他不同的州之间有怎么样的关系呢,他们只是和同样人进行交流,还是说与不同的人进行交流,你可以想象一下,随着多样化的增长我们可以看到什么,GDP会上升,专利的数目会上升,新兴公司的数目也会上升。
所以说这是研究了美国15个州非常强的社会关系,进行社会学的研究。然后我们看到思想的多样化,就好象在小群体中一样,好像在公司里面也一样,在州和城市中也是同样的规律。如果你想让你的城市更加的富有,更加具有创新性,更多的一些新型公司出现你就需要更多样化的,与其他的地区的这种联系。当然了,你甚至可以做得更好,从美国150多个城市当中,从欧洲的150多个城市当中获得数据进行社交多样性的一个分析和计算,然后我们就发现你可以计算出来他们的GDP或者是说这个模式和我们刚才计算的这个模式是非常相近的。换句话来讲,他可以来使城市在创新和GDP方面进行同样的发展,这些是通过社会关系的模式相近的,如果想让北京更加具有创新性,你可能需要这个社交关系更加多样化,意味着我们的交通和基础设施需要进行改善。
那么在右手边是欧洲,另外一边是美国,我们可以看到在欧洲基础设施在交通方面比较差一些,不像美国这么好,所以说在城市当中的多样化,相对来说比较少,所以城市的发展,城市并没有像美国的城市在发展过程中变得更加的富有,那么快速的富有。所以说你在城市的工程师和设计者当中,我们当然一看到这个确实会影响到新公司的出现。
当然我们可以进行一个反向的研究,这么一个图表,在左手边是英国,在下部是社会的多样性,在纵轴上是社会经济百分比。那么也就是说GDP,死亡率,寿命以及犯罪率等等,这些总是会一起来上虾波动的。这张表格告诉大家的是,如果你告诉我你周边社区一个社会关系的话,我可以告诉你有多少个新生儿会死亡,你可以稍微思考一下,如果你告诉我说你周边的社区的一个沟通的类型的话,我可以告诉你你们的犯罪率,如果你告诉我你们的沟通的类型和结构的话,我可以告诉你你期待的预期寿命,我可以做一个非常好的预测,这是让人非常震惊的。
在右手边你可以看到的是来自于科特迪瓦数据,我们可以从开头数据中获得这样的分析,完全不同的一些内容,但是它是可以来预测到哪里的人生活得更差一些。所以说有一些地方和其他的社会如果比较隔离的话,那么总是会比较贫穷,总是不适合居住的地方,当点的密集性比较强的话就有更好的发展的潜力,就是这么简单。
还有一点是和谐,我给大家讲的是新的人之间的感应,也是我们可以从人和人之间的感应和关系来衍生出的一种方式,这种方式和经济思维方式是非常不一样的,通过经济的思维模式当中人是独立的,这种新的思维方式当中人是互联互通的,人的这种联系是最重要的。你可以做出来思考一种激励措施,从而实现经济方面增长的同时,来实现更好的社交惯例,我这里时间不太多了,但是我可以给大家简单讲一个例子,一个城市里我给人们一些智能手机,然后如果说他们比较,比上周用得比较积极的话我会给他们鼓励政策,我们另外一个城市也可以用同样的方式,你更加积极的话你的朋友可以获得奖励,他更加积极的话你也可以挣钱,这是一种社交的压力。就不同于这种只进行个人的激励,这种方式是比经济激励政策要有八倍以上的效率。所以说当我们来设计我们的城市和社会时候,如果使用经济激励的政策,不会取得更好的效果,更好的方式是使用社交的网络刺激,因为它会更加有效而且更加具有粘性,所以我会讲到这里,下一节我们讲安全和隐私。
(四)
主持人:谢谢。那么我们说中文,我说中文可以吗?我听完您这部分的演讲,我特别特别的期待未来我们可能因为大数据会活在一个什么不一样的时代,是不是下次您见到我,您只需看着我就知道我所有的秘密了呢?
Alex Pentland:我肯定不会知道你所有的秘密,但是肯定是我要会更了解你的反应,以及你对我信息的接受。
主持人:我需要一个什么样的东西你才能一眼把我看透呢。
Alex Pentland:我要知道你的专注力,你是不是处于兴奋的状态,这个兴奋可能是兴趣,也就可能是恐惧,以及你对我的信任赌和移情的能力。当你的神经系统在被唤起的状态的时候,你的行为会与平时不同,当你真正专注的时候,或者说感兴趣的时候,你的反应也是不同的。但是你更能理解我的感受的时候,你的移情度更高的时候,你会模仿我的行为。
主持人:我非常期待,如果有一天真的大数据到了,您所提到的标准的话,可能会有一个非常神奇的变化在我的身上,但是在我,虽然是一个非常微小的生命个体,但是在我们中国的各行各业,大数据也在悄然发生着变化,接下来的时间我们掌声有请三位嘉宾,首先欢迎的是中国工程院院士,国家信息化专家组咨询委员会的委员邬贺铨先生。我们掌声欢迎。第二位嘉宾是来自于国家统计局统计科学研究所经济统计研究室的副主任姜澍。第三位嘉宾是来自于北京信息化专家委员会秘书长彭凯。掌声有请三位嘉宾落座。
我们这个环节非常简单,如果上一个环节嘉宾之间产生了针锋相对,希望这个环节三位嘉宾可以和我们的教授之间产生针锋相对。先抛出问题好不好,女生优先。
姜澍:我来自于政府统计部门,我们政府统计部门这两年也是在考虑用大数据做官方统计。首先是做了一些研究,研究当中有一些具体的问题。
刚才教授也在说这个利用人的行为或者是说微观的思想流可以进行事件的推测,可是在政府统计中如果用这种个人的行为来预测一个宏观的经济产出,到底怎么样能够做到。比如说我们思考一个问题用互联网的搜索引擎,用大家的搜索行为来预测经济产出,但是互联网行为是属于一种个人行为,怎么样能够演化到对经济产出超级宏观一个判断?而且如果真的做到了的话我们怎么样,因为作为政府统计对数据要求有一定真实保证的要求,我们能不能信任这种数据的推理。
主持人:靠个人数据预测宏观经济,靠谱吗?教授。
Alex Pentland:那么在这种情况下的做法首先是你要知道比如说这个交通的基础设施的情况,以及使用的情况,也就是说大家的移动是怎么样的,可以用一些WIFI的热点来显示出人们交通互动的特点,这样的话就可以得到非常精确的数据。
当然首先这个技术要保证靠谱,要有相关的标准。但是精确的获取数据,现在并不是特别困难。但是需要做一些调整,但是是可以实现的。
主持人:您觉得教授已经完全回答您的问题了吗?
姜澍:是的,差不多吧。
我还有另外一个问题想问,就是说有一种关于大数据的流行观点,大数据注重的是这种相关性,而对因果性不做特别强调,这样的话我们对数据的分析结果就缺少了一种解释的能力。因为我们不知道原因,那么在这种情况下如果说统计或者是说政府统计想要去对这个数据结果进行分析的话,我们政府作为这种官方,能不能信任这种只注重相关关系,从数据表面的建模得出来的数据关系。
主持人:这个我也是好奇大数据告诉我们是什么,而不告诉我们为什么?
Alex Pentland:一般能够揭示因果关系,一般情况下不揭示,而且要做到这一点就要定期进行校准。比如说你控制疾病的话,你来预防疾病的蔓延,但是首先你要对照这种小地区的黄金标准来进行核准和校准。那么然后在外推到整个社会,使用这种小地区测试的结果来外推,这个结果还是比较可靠的。
主持人:来请我们邬贺铨院士,您对教授的问题是什么。
邬贺铨:刚才教授讲了交流和探索,这种思想流会改变这种包括人群的富有的状况。但是我知道在一些国家的大城市里边,有贫民窟。贫民窟里面的人交流探索可不少,他们不比富人区少,但是这种交流探索并没有改变他们贫困的状态,这是为什么?
主持人:这是一个很简短的问题,教授您有回答吗?
Alex Pentland:我们现在有的数据显示在非常贫困的地方,其实他的思想流是非常糟糕的,通常的情况是因为他们没有钱来进行互动,没有钱和其他的社会份子进行沟通,因为他们很贫困,通常有很高的犯罪率这也就是说大家的沟通是非常差的,因为大家充满了恐惧。当然不同的国家的情况也是不一样,我们也不了解,我们至少知道美国和英国的数据,还有某些非洲国家的数据,还有某些欧洲国家的数据,这些是统一的,但是并不是在全国各地都试验过,测试过。可能文化也是因素之一。
主持人:邬贺铨院士对这个回答满意吗。
邬贺铨:我认为交流和探索有一个前提的条件,在什么样的群体环境里,否则的话不是简单的靠交流和探索所能改变一个人的命运的。
主持人:您同意他的说法吗?
Alex Pentland:如果你说的是少数民族,一个是我们觉得光沟通,比如说电子沟通,他的效果不够,还是说需要有面对面的沟通。比如说学校或者是超市等等,面对面的沟通才能够有效果。那么其中被破坏一个因素之一,破坏这种沟通的因素是民族的紧张关系。所以说这两个民族之间的恶意沟通并不会导致好的结果,所以我们说理论是有前提的。那么对总的原则来说至少要进行一些试验。
主持人:我们今天现场的嘉宾要给您一点压力,您来自北京信息化专家委员会,您能代表现在众多的住在北京的朋友,北京的交通、医疗、空气,能不能通过您问我们教授一个问题,能不能用大数据改变我们更好的生活。
彭凯:是,我也想向教授请教的是北京大城市病,如果利用大数据的技术为北京市政府的科学决策进行有利的建议。教授在美国进行研究,能不能把美国的大城市或者是州政府在利用大数据方面,政策法规和案例方面对北京有没有什么好的建议。向教授请教。
Alex Pentland:那么我们这个数据可以帮助我们来改善交通和提高GDP,也就是说我们希望有人口的一个混合,这样的话提高我们的创新能力,来提高GDP,其实可以模拟的,像地铁的线路一样,可以把这个标准进行最大化,和这个标准来使用,也是新生事物,并不是完全证明的。
主持人:您能不能举一个例子给我们。
Alex Pentland:最好的一个例子是苏黎士,那么他的人口也是不断的增长,他们的目标是一个是要增长GDP,另外是保持文化。所以他们安装了非常昂贵的一个轻轨系统,所以说有人还可以居住在小村落里,一个村子就几百人,可以步行到杂货店或者是上学,但是60%的人口可以用轻轨每天去远的地方,去市中心工作,所以这样的话我们的沟通的强度是比全球任何一个城市都是要高的。当然了,根据理论的是我们应该产生有非常强的社会支持的这种村落。但是同时的话创新性在这个城市中的创新性又很高,所以这是一个很好的组合。这是一个例子。
主持人:今天经过三位嘉宾的讨论,我们知道大数据最重要的核心是预测,无论是帮助政府还是企业,可以发现更好的商业模式和更好的决策体系。也许是但凡是听完今天教授演讲的朋友,可能或多或少会动一个念头,这个念头是不是我们要换一份工作,找一找跟大数据相关的企业呢?这个时候问题就出现了。如果你现在想找工作,HR肯定会说给我你的微博账号吧,或者是说他会主动搜,在百度上搜你,微博上搜你,甚至是偷偷潜入你所有的朋友圈,从今以后所有的秘密都不再是秘密,这个合理吗?这又带出一个新问题,大数据时代我们的安全和隐私到底谁来保护,教授,您觉得呢?每次和教授聊起来这个问题的时候,他就收起的笑容,陷入了沉思,所以您作为世界权威的大数据研究中心,这对你而言是不是最大的挑战。
Alex Pentland:这个是问题之一,这是我们下一节要讲的内容。
(五)
主持人:现在我们用热烈的掌声请回我们的教授回到舞台中央来进行第三部分的演讲。请您回到讲台上进行您的演讲。
Alex Pentland:下面我开始讲吗?
主持人:是的。
Alex Pentland:好的,我看一下。前两节我们讲了可穿戴设备和对你的测量,另外我们说了你和其他人的互动以及互动如何来进行测量。我们的主持人刚才也说了,人们考虑这个问题的时候一提到隐私和安全大家很担忧,因为这个数据是非常敏感的,可以不当的进行应用,也可以很好的进行应用,我记得在中国,大家也很担心,担心各个公司会用这种数据来剥削消费者。其实其他的地方也有安全方面担忧。所以说现在的问题是这是个人的数据,我的行为我跟其他人的互动。这种数据被认为个人的数据是驱动智慧城市核心服务的燃料。
所以说个人的数据在未来的经济发挥重要的作用。那么在这个达沃斯世界经济论坛中我帮助他们做这件事,我们可以看到很多的跨国企业和各国的监管机构的代表,以及一些游说团体,他们都认为个人信息时代已经来临,个人数据会使得这个互联网变得非常小。所以说随着新的互联网技术的成熟会让我们更好的使用这些个人数据。那么,这些个人数据的量太大了,虽然不可能完全实现所有个人数据被少数人所掌握,但是我们还是会问这样的问题,谁会控制我们数据,过去五六年有这样的讨论,六年之前我们在达沃斯召开了这样的小组的讨论,我们着急了各个公司和政府的首脑,这里也可以看到其实达沃斯论坛是这样的。其实并不是一个非常高端的会议室,看起来还有点狭小。但是他们的参会的人员还是亿万富翁和跨国公司的老总。所以说这个活动现在进行,这是唐宁街十号的照片,这是英国首相所住的地方,这是唐宁街十号首次对外开放的活动,这是我主持的活动,这个讨论中我们都在问这个问题,就是说能不能找到一个解决方案,更好的控制个人的数据,使政府受益,使公司受益,使消费者和公民受益。
因为我们必须让这三者都能受益,才能够把个人数据很好的应用起来,那么,我们跟大家分享一下这些建议。历史来讲50年之前,我们一边是人,一边是比如说银行系统,本人要亲自到那里,拿到文书,在上面盖章,这样的话才能够处理你的身份和个人信息,都是有文本的,有纸质的文件的,人与人也是隔开的,现在不一样了,当时的信息传播并不是很广,也不是很快,但是60年代开始我们就有了电脑、电脑系统。这种就使得传统的路径变得更短了,那么你发你的一个照片,形象或者是说你的签名发到电脑上,那么就可以把这个中央数据库的信息进行调取,那么这个时候我们就会发现就像现在一样,公司掌握了你的个人的数据。那么,但是它从后门漏洞出去了,你不知道数据流到了哪里,你个人没有控制权,所以这是50年代或者是说60年代初的时候涌现一个现象。现在可能有几百个公司掌握了你个人的,非常隐私的数据,你必须要担心这一点,尤其是说考虑到现在个人的数据对经济的影响的作用是越来越大了。
那么我们要做一些什么呢,我们需要有监管的法律法规来控制个人数据的一个传输。那么使得它与传统的方式进行匹配,作为真来说我们的本性是要签名或者是说把一个纸质文件交给别的人,我们必须在这个电子,在现代这个时代,数字的时代也有这样一个本质,这样的话我们才能够了解的个人数据,才能够控制我们的个人数据。所以我们这个讨论在过去五六年,我们在达沃斯的讨论会议上,我们就意识到了个人的数据能够衡量你的资产的规模,比如说黄金、白银,或者是说股票等等的货币。这个个人数据是非常重要的。我们对个人数据处理,要跟处理前或者是说这个黄金、白银、股票一样小心和谨慎。所以说一定要建立一个法律的体系来对此进行监管、审计,给予人在这样一个个人数据链的经济中一个份额。
如果我们企业来说,比如说通知,你要如何知道别人在你身上获得数据,并且来使用它,还要同意,就是说做的前提你同意他们怎么做,或者是说使用你的数据来做什么,他们必须通过某种方式来告诉你,让你来理解,之前政府审核,或者其他的机构来进行审计,这个公司用你的数据做了他们承诺所做的事情,然后就是撤销。到底这个公司给你提供了个人数据是不是值得来提供给这个公司。但是你如果要求把它撤回的话是可以撤回的。所以说这些在欧盟和美国都已经做了很多的讨论,中国也有这种类似的讨论。
但是最核心的是给您作为消费者,你自己的数据想要发出的声音。
这也是一个银行业的基础,比如你把钱放在银行里存起来,从银行里收到的钱就进入到整个的财政系统,所以说你搜集这个数据金融不同的公司和银行,从而来运转整个的经济。所以这是整个的概念,最早你会觉得可能不太可能实现,但是后来我们发现情况其实不见得如此。我们可以在现有的系统当中一些相似的这种系统,比如说现在有这种SWIFT网络,是一种快速的银行转账系统,一天转账几十万亿美元,但是我们知道暂时没有受到黑客的攻击,你可以想象一下一天几十万美金的这么一个网络,但是还是比较安全的,对比因特网或者是内网来说这是非常令人称奇的,这是银行之间的网络,也是一个值得信任的网络。
他这种方式就是信息共享,或者说最小量的这种合法框架里面最小量的信息分享。然后我们在麻省理工也建立了一个类似的系统。当然了也有一些其他的要求其中一个是这个系统应该是分布式的系统,你不见得非要采取同样的这种系统,但是就像是VISIT和SWIFT的一样,应该说没有任何一个点可以受到黑客的攻击。在美国可能有人,比如说国防部的人会站起来说我们过去做的最错一件事就是把所有的信息放在同样一个地方,这样的话人们就知道该去攻击哪了,也就是说信息应该是分布式的存储,这是非常重要一个原则,对我们的商业系统和银行系统来讲,也是我们未来系统发展一个方向。
所以说在麻省理工我们建立了这样一个系统,本来叫做开放PDS或者是OpenPDS的系统,是一个个人的上,我不会把所有的元素都研究一下,我们知道有类似的公司可以给客户提供服务的数据。大家在接下来会讨论这些内容,这里的关键是在于它是一个安全的网络,给个人这种能力去识别这种信息的使用方式,同时是一个合法的网络,使你更好的控制和审查你数据使用方式。
所以说这是很有可能能够实现的,更重要的一点是由这个公司来支持的,大家没有听说过这个公司,但是主要是网络的一种密钥的公司,过去的25年里面他们一直做这个方面的工作。那么现在在我的这个团队中,我们也是开发了一个这种个人数据的这么一个协议,使得因特网更加的安全。我觉得这也是非常的现实和非常好的一个解决的方案。
我们用这些大数据创造了一个网络,在不同的地方进行实践,比如说意大利的地区,意大利的电信公司也是部署的这个网络,来控制个人信息,这个不像是我或者是在座各位一样,不像美国或者是欧盟,但是如果你在那里你就可以控制自己的信息,比如说一些年轻人或者是老人可以帮助他进行控制,通过这种方式可以来更加安全的来进行信息的分享,比如无论是与公司还是说与其他人进行信息的分享,因为现在我们有这么一个框架可以让你至少知道到底是在发生些什么,然后保证地的信息的安全性。
我给大家举一些例子,也是说用我们可以做的事情,首先你可以进行个人的事务的一个这种量化,那么你自己是带着这种可穿戴设备,那么你可以对你可穿戴设备提供这种数据然后他的安全有信心,因为他不会提供给其他人,在你未经许可的情况下提供给其他人。这个数据以前不是由你控制的,是由设备制造商来控制的,现在我不想这么做,由我自己控制,至少我要告诉制造商他可不可以用。至少有一点是可以做到,就是说我们可以选一组人,比如说他们会有一些这种创伤后这种PDSD这种创伤症,有一些犹豫,你可以通过这种方式测量他人的一个健康情况,看看现在的状况。你要担心一下如果这个你不要进行很好的控制的话,一些公司获得你的健康和你的精神状态的话实际上是不完全的。但是我们这里做的是让人们有自己的数据的控制,可以让他们来进行自动的,安全的与他们朋友之间进行分享。
所以这是大多数的年轻人,比如说有一些朋友,你可以来分享你自动分享你们的这种情绪状态信息,然后我们还可以让一些有这种精神疾病的人群可以共同的来进行分享,这是另外一个例子,比如说一些年轻的家庭,那么你在周末和孩子们一块儿玩点什么呢?当然你想了解一下其他的小孩儿在哪,你们也可以过去跟这些孩子玩。当然很多人不愿意把自己孩子的位置发在网上的,如果发在网上可能是很危险很愚蠢的。
现在你可以有一种安全网络,你可以来实现这种非常的,了解到你朋友的孩子在哪?这样的话你就可以也去那个地方。这样的话年轻的家长们就可以对此感到非常的感兴趣,可以来进行个人的这种信息的分享整个网络给你的能力。
最后一个例子,来分享一些财务数据,有多少人会和别人分享你的这种信用卡信息,或者是说支出信息,可能这个答案是零,因为你感觉不安全,但是这个系统的确是安全的,这样的人们可以有这么一个习惯去问一下,比如说别人的家庭花多少钱在交通上,花多少钱在食物上,多少钱在孩子身上和其他的方面等等,这样的话可以和其他的朋友对比财务的支出,这样的分享是安全的。
那么下一步或者是说可穿戴设备里面的下一障碍是我们应该能够来进行很好的控制,用一种安全的方式在我们的想象意图中,从而从中受益,不见得让公司去获益,来为你提供价值,大数据最终带来更好的生活。好像我们今天的百度百家的主题一样,在可穿戴智能面向所有人的时候,这里我们有一本书叫做《社会社交物理学》,差不多一个半月之后我们中国也会出版,我也是希望大家期待一下这本书,谢谢大家。
主持人:再次为我们的教授鼓掌,我们休息五分钟的时间。请教授到后台稍坐休息,休息五分钟。
大家可以关注一下百度百家微信公众平台来提交您的问题,我们即将开始快问快答五分钟后再见。
(六)
主持人:我们有一个问答环节,可以从观众那里获得提问。我们现场的同传需要有一点时间,我们可以让观众思考一下。下面一个环节。
非常感谢您刚才的精彩的演讲,对我们来讲非常的有鼓励性,然后今天我们看一下我们观众的提问。从大屏幕上选取我们今天现场互动的问题。
首先来看第一个问题,我们都知道计划经济失败一个主要的原因是政府通过计划配制资源的手段而没有通过市场经济、自由经济。那么您觉得通过大数据的应用是否会形成一个完美的计划经济的来临,也就是说这是一个非常关键的问题。
Alex Pentland:我觉得答案很可能是否定的,我觉得还是比较难的,是这样对与经济向一个好的方向去影响,如果你想想一下大数据,你可以非常快速向一个正式方向去发展,比如说我们规划一件事去做它,但是如果我们不知道在三年,四年里面做这件事是不是对的,那就很糟糕了,如果你做这件事,然后一个月的时间里边就能发现这是一个不太好的想法,你就可以很快的弥补他。
主持人:你怎么确保它能朝正确的方向发展呢。
Alex Pentland:你需要经过非常仔细的测量和快速的测量,这可能会导致就业率的提高,下个月是不是能有一些数据,然后下个月你又知道它是上升还是下降了,如果是下降了的话这个想法就不是很对了。
主持人:现场有朋友有问题,来示意我,一句话来表达。
提问:我这里有一个问题向教授请教,有人说大数据是未来是最重要的这种生产资料之一,我不知道教授是不是认可把这个大数据就是说提到这么高的这种高度。就是说人类在每次生产率剧烈变革的时候,代表了先进生产力对生产资料的争夺都会引发战争,我想问一下,教授认为怎么样才能和平公正的利用大数据。
主持人:一个非常好的问题。
Alex Pentland:真的,我完全没有听到,我是尽可能的来回答一下。
我觉得这个问题在于通常呢我们在没有任何的了解的情况下就要做一些事情,有的时候我们并不知道,比如说内部的沟通或者是说怎么样的能带来好的结果还是不好的结果,很多东西管理得不是特别好。
主持人:我想我们要重复一些问题,有没有可能大数据会领导一场世界大战,有一组数据会引领一场世界大战的到来。
Alex Pentland:你说世界大战,无论你在想什么,你到底什么意思给我解释一下。
主持人:我的意思就是说,大数据是不是和财富一样,每个人都想获得大数据,更都想更大强加更加富有。
Alex Pentland:数据重要是因为数据跟你相关,它来自于你的公司、朋友和国家。
主持人:教授是一个和平主义,乐观主义,您看问题有一定太激进了,现在我们通过组织和个人之间通过共享数据来进行更有效,更美好的社会,我们看看现场还有什么问题,举手示意我。
提问:谢谢,第三排第二位。谢谢教授,我想知道苹果正在要推出一部iWatch,我想知道市场上对iWatch非常看好,我想知道这个iWatch会成为市场的转折点吗?第二个我们知道这些年可穿戴设备发展特别快,发展这么快,是不是需要什么技术,有什么技术需要迫切的攻克呢,谢谢。
Alex Pentland:苹果的产品,可能成为一个转折点,因为我知道很多其他的公司必须把它作为一个标准,并且超越它,所以你会看到健康的产品,你会得到校准和非常好的准确的结果。所以我觉得,我有理由认为,有着苹果的智能手机的出现会改进我们的可穿戴产品。当然会有一些技术,比如说像传感器或者是说VOSI等等,还有电池的寿命,将是成为这个主要的一个瓶颈之一,因为当我们在这个可穿戴的设备的时候,我们的局限性就在于它的一个电池,电池的寿命,如果说电池改进了,那么电路用电量减少了,你会有更多一个灵活性。
那么,另外一点是是像低功耗的蓝牙,这样的话我们就会有非常灵活一个构架,这个构架里面可以潜入很多的模块,否则的话这个是不可能的。这个技术可能会突破,一两年之前不是这样的。
提问:教授你好,我想问一个可穿戴领域大数据的问题,我们知道单纯少量数据根本无法形成气候,这需要可穿戴打破这个各自为政的孤立局面。使这个数据在云端彻底的分享,形成一个海量的大数据,我们现在可以看到苹果和谷歌这种科技巨佬,他们所做的事情是建立一个生态化的平台,而小的一些创业科技公司所做的也是在互相的抱团取暖,来分享数据。对此您对这种现象怎么看待的?您认为成就“大数据”的“大”有什么样的更好的建议和解决方案。谢谢。
主持人:这是关于大数据的垄断的问题,大企业,大政府垄断数据,中小企业如何去做呢?
Alex Pentland:我并不认为大的公司正在垄断,或者是操纵这样的数据,但是他们的起点是很好的,他们占有先机,之前我想说的一点是现在有很多种类的大数据,比如说这个物联网类的大数据,还有谷歌和苹果肯定在这个方面是没有什么先机的,任何的这种搜索引擎的公司可能都没有占有先机,如果说可穿戴设备的话,当然这些公司是对此感兴趣的,我知道在美国和欧洲,如果说想垄断的话,肯定会有这个政府的一个监管。因为他们用这么大量的数据,通过这种社交网络的,还有搜索引擎的数据,所以肯定会很敏感的。肯定这个市场会引入竞争,另外一件事你要记住的是他们并不是全球唯一的大公司,所有的全球大公司都有大数据,他们也都是以这种你可能没有听到的方式来参与到大数据这个社会中,你知道很多的大企业他们会有这个三四亿的客户,所以说他们都是竞争者,如果说把两个加在一块儿来就会超过Facebook和谷歌。
主持人:我们现场再问最后一个问题。我们看第三排第六号,对吗?
提问:我的问题跟可穿戴设备相关的,就是说如果谷歌利用他的规模优势做一款比如说19美元的手环,这个手环具备了其他主流手环的大部分的功能,谷歌很大规模推广这个手环,这个对于行业算是一种促进还是损害?
主持人:其实这个问题还有一个中国的背景,你知道最近中国的小米推出一个白菜价格的手环,79元人民币。所以说这样的推广对穿戴设备是好还是坏呢?
Alex Pentland:很清楚这吸引了人们的注意力,同时,肯定是校准,也是很差的。我觉得如果你说这个医疗方面的应用,我们还是要建立好这个医疗系统,这个医院的系统,他们来出售自己的这种相关的应用,但是这个中国的环境和情况我是不太了解的。
像美国的公司如果说想用可穿戴设备应用在医疗或者是保险领域的话,你会发现会有几十,几千万的,甚至是几亿的产品只在一个国家内就有这么多产品进行销售,这会大大颠覆这个市场了。他们的校准也应该是大大提高的。
那么如果说跨大洋的话肯定是更多的参与者,都会参与到这个市场中。所以我们不能关注大的IT公司,也有很多的其他大型公司,很难说未来会发生什么。
主持人:我们现场掌声感谢教授今天的现场演讲。今天和教授的对话让我意识到大数据并不是冷冰冰的世界,像您一样,非常的温暖,非常的智慧,给我们提供了很便捷的生活状态,大数据让我们感觉到人类的作用是不可替代的,可能会给我们预测,提供的仅仅是参考答案,绝对不是最终答案。感谢您关注百度百家,我们期待下期再见。
相关链接
AdTime:从《商海通牒》看大数据金融
http://tech.163.com/14/0714/21/A155SO1600094OJK.html
大数据金融爆发:公募推指数基金抢滩
http://tech.163.com/14/0707/01/A0H16409000915BF.html
