查看原文
其他

演讲 | 大数据专家涂子沛:数据智能的前景、挑战和阴影

2017-08-22 军观察


有态度 | 有深度 | 有力度的原创型产业新媒体


编者按】:由数据与机器学习驱动的数据智能,在互联网公司产品(如搜索、内容分发及电商推荐)发挥重要作用,以成为公司核心竞争力。在这方面,大数据专家涂子沛和湖畔大学教务长曾鸣都曾深入研究。


涂子沛对于大数据带来的隐忧和风险,给予我们更多警醒——当我们在使用并共享我们的数据时,一方面我们从中获得个性化便利,但同时,我们时刻处于暴露之中,这大大增加了彼此的不安全感。更严重的隐忧也许现在才慢慢道来,且看涂子沛如何评说。


文 | 涂子沛,著名大数据专家、信息管理专家,阿里巴巴集团原副总裁,著有《大数据》、《数据之巅》。现担任中南建设集团董事、人民网股份有限公司独立董事、上海承泰信息科技股份有限公司独立董事、杭州树兰医疗集团独立董事、OMAHA基金会理事长、上海真爱梦想公益基金会理事等职务。受聘为浙江省特聘专家、中国大数据产业生态联盟主任委员,中国大数据学院荣誉副院长、中山大学客座教授、中国人民大学客座研究员。

整理:数据观


链接:湖畔大学教务长曾鸣:数据智能三步走,数据化、算法化及产品化

湖畔大学教务长曾鸣:新商业为什么商业越来越要求精准和智能?



大家好,我和大家有一个共同点:喜欢苏州。苏州的创新是有历史渊源的,苏州在这方面做了很多的工作,给海外的学人留下了非常深刻的印象。大概6、7年前,我来到苏州就感受到了苏州的热情、对人才的渴望、对时代浪潮的拥抱。


这次来,我有一个很深的感受:这是一个宜居的城市。宜居是怎么判断的?我有一个标准分享给大家:我觉得高楼太多的地方不宜居。苏州不是那么高,相对来说,你去看杭州的创新小镇,包括梦想小镇、人工智能小镇,他们盖的房子都是4-5层楼高,一栋一栋的,有很多绿化区,这就很像美国。美国的很多产业园绝对不是我们想的,一栋高楼树起来的那种产业园,首先是生活,把生活融进工作。前段时间我一直在想一个话题,一个城市生态环境、生活环境是怎么样的才最促进创新?我想,一个田园型的城市可能是一个最促进创新的环境。


1


今天我们分享的主题是数据智能。各位知道吗?数据智能的春天早就来了,严格的说,这是第二次人工智能的春天。


这次春天到底会是什么样子的呢?在几十年前人工智能的春天就来了,刚才我们提到的AlphaGo,这是围棋,实际上在九十年代的时候深蓝就击败了人类象棋冠军,早就击败了。人工智能战胜人一直不是一个新闻,60年代的时候,下跳棋人工智能战胜了人类,90年代下象棋击败了人类,围棋是什么情况?围棋是东亚这边很小的一个棋种,人家不玩,人家玩早就把它灭了。


大概在2015年的一次中山大学论坛上,我和一个围棋高手发生了冲突。那时还没有AlphaGo,我说要是人家玩围棋早就把这个灭了,当时在上千校友面前发生了争论,我们赌了1500万,没想到就几个月之后AlphaGo出来了。当时记者采访我,我说这没什么悬念。


我们的人工智能究竟表现在什么地方?按照人类智能来的这条主线其实我们科学家一直在研究,但是今天一个巨大的不同是数据量极其庞大。


比如微粒贷。微粒贷就在你的微信上,它根据你的数据判断究竟能不能给你贷款,利率是多少。为什么说它是人工智能?它要处理大量的数据,最智能的是,有些人的手机上有,有些人的手机上没有,它能够判断识别你需不需要贷款。


第二个我想举的例子就是阿里巴巴。现在80%的销售都是在手机上面。手机屏幕是非常小的,它可能只能展示10件商品。但是阿里巴巴做了一件事情,4.3亿用户每个用户打开来看到不同的商品。为什么?这是个性化。


我们说软件可以说是个产品,但是阿里把这个产品发给4.3亿人,每个人都不一样,这是智能吗?如果说这不是智能,还有什么是人工智能。


人工智能从字面上看,我们说是模拟的、人造的智能,但是我告诉你,人的智能是达不到的。为什么达不到?你想一下4.3亿用户,你要在他打开软件的一刹那计算完,还要给出一个个性化的界面,甚至这一秒打开的和10分钟以后打开的都不一样,人是没办法做到的,阿里请多少工程师都没办法做到。


阿里把这件事交给机器,这件事有什么帮助?帮助太大了。怎么大?你看到个性化的界面,意味着你看到的东西是你可能买或者想买的东西,跟看到一个4.3亿人统一的界面购买的可能性完全不同,我们做过一个研究,5倍。这就是数据智能。


2


数据智能是什么?在大量数据的基础上,加上一点逻辑,加上一点统计。


我们最早的智能在厨房里也能看到,电饭煲,选择煲汤还是煮饭,设定一下你就不用再跟进了,好这就是我们今天基于大数据的智能。这种智能来源于哪里已经很清楚了,来源于数据。


数据是智能的母体,我们能看到数据智能的社会在往前奔跑的时候,是以大数据为基础的。我们今天怎么描绘这个经济,说它是新经济、网络经济、知识经济,怎么说都好,但事实上,是数据经济。我们今天这个提法还不是那么普及,但是时代再往前走,所谓的新经济,其实就是以数据为基础的经济。


这个经济在干嘛呢?第一个,个性化。


阿里巴巴的个性化,每个人打开的界面不一样,微信的微粒贷,判断你需不需要贷款,需要才推给你。个性化还在延伸,比如延伸到制造业。


获得个人数据之后,我们在工业时代,大规模的生产导致的结果是什么?大家都穿一样的鞋,39码、40码,但是有几个人的脚真的是39码,真的是40码?绝大部分人的脚是39.66码、39.54码……落在正好这两个点上的很少。这是工业化的原罪,它把我们标准化了,我们没有办法穿到真正适合自己脚的鞋子。现在来了,获取个人数据,然后定制。人类个性化的需求被压抑了几百年,接下来我们要看到一个个性化的爆发。


大家可能都听过“红领”——定制化的西服。我在去年定制了一套,我定制了以后,我觉得真合身啊,没穿过这么合身的,穿了以后可能就不想再去穿大路货了。电影里经常会有穿衣服的时候有人来帮忙,你认为这是明星在耍大牌,事实上不是,定制的衣服真的需要有人帮忙穿,因为每个部位都是卡死的,但它又真的是合身的。每个人的身体事实上是不一样的。


红领集团在做的就是获取你全身20多处的数据,现在要做一个魔幻大巴,这个大巴里有8个摄像头,你换身紧身衣站进去,30秒全部数据取下来,然后它会把衣服邮寄给你。红领要在全国投放5000辆,在人流最密集的巡回。有意识的创新吧各位?当我听到这个想法时,他们在和浙江的一家公司在合资,技术正在突破。


大家想一想,如果它的东西直接就到取完你的数据然后寄给你,还要淘宝吗?这就是未来我们说的,从工厂到消费者到家庭。因为我获得了你的数据,我给你生产的东西是你最想要的个性化的,然后还可以直接快递给你,那淘宝就没有了,颠覆还在继续。


3


数据是什么?我感觉数据是水,数据像涓涓细流一样,你每天都在产生、每时每刻都在产生,一点一滴。数据要发生作用就必须要汇集,但是怎么汇集数据,这就是问题。


比如淘宝,它要做好这件事就要收集你点击的数据、浏览的数据、消费的数据,除了这些数据之外,它还想收集你更多的数据,因为收集得越多它判断得越准。微粒贷,一样的,它要判断一个人的信用要不要更多数据?它要判断一个人的经济状况,要判断一个人究竟是屌丝还是白领还是公务员,它才能更好的信用服务,所以它要汇集数据。但是问题来了,我们今天数据汇集的前提完全没有经过我们消费者自己的同意,就被汇集走了,这就是问题。


无数商家在背后汇集我们的数据,但是最应该说同意的那个人,那就是消费者,从来没有表过任何态。怎么办?国家最近在出台政策,打击非法数据采集链,有几家新三板的公司都受到了重创,最新的财经正本专题都在讲数据产业怎么办。


好,我们再讲一个例子。现在的个性化保险所带来的问题是什么?个性化的保险需要汇集多少数据。原来的保险就是A计划、B计划、C计划,一谈,大家买的保险都差不多。现在,因为我能收集到你大量的数据,所以我能给你量身定做一个个性化的保险方案。好,这就有问题了,什么问题?大数据收集全的公司、算法好的公司把那些优质的客户都吸走了,他一看,你的信用不好,你出事的几率高,他就不卖给你。谁的大数据做得好,谁就能把优质客户收割掉,但是最应该买保险的恰恰是哪些容易出事的人。


因为有大数据、人工智能,最应该买的人反而买不到。所有保险公司都会说no,我想卖给不出事的优质客户。好,这就是一个社会问题,数据带来了很多歧视,他收集了大量的数据,甚至有些可能是错的,他基于错误的数据选择给我们贷款、选择提供各种各样的商品。比如说,你是一个未婚妈妈,你去买保险,他知道你是未婚妈妈和他不知道你是未婚妈妈是完全不同的。甚至你喜欢红车,它的算法就会给你减一分,为什么?数据自有理由。


决策的权力交给了数据,自动运行,得出的结论真的科学吗?


再接下去说,淘宝。我们觉得这种个性化真的好,非常好啊。我们第一页就能看到我们想看的商品,但是这种个性化也在产生问题。因为个性化,显示的同一件商品的价钱不一样。为什么?因为我的大数据计算得出,一个人很喜欢这件商品,标价100块都想要,另一个人可能标价80都不要,这就是价格歧视,这是商家梦寐以求的价格歧视。实体经济时代,在百货商场标一个价格所有人都看到了,有人愿意出101你也只能卖100。但是今天,每人一个屏幕,同一件商品,可能有不同的价格。


4


你觉得离谱对不对?但是我告诉大家,这已经在发生了。


怎么发生的?我举一个例子——机票。机票有很大的掩饰性,因为机票是动态的,一个小时前和现在的价格并不一样,它有一个很好的理由:动态定价。但事实上,每个人看到的机票价格都不一样。


滴滴,有人就感觉,我上次加了价,现在不加价就打不到车了,本来3秒就把这个情况反馈给你,现在是3.5秒、4秒,让你等不及就加价,我们不知道滴滴的算法是怎么回事。


我们要审查,我们经信委要成立专门的部门,对人工智能政策进行审查。不审查,这样下去我们不知道会发生什么。我们今天的数据是怎么回事?他们用了我们的数据,但是这个数据是错的,我们也不能进行修改,在错的数据上不断的做决策,怎么办?这就是我们今天所面对的问题。


所有的商家都在汇聚数据,那么这个数据能不能买,能不能有个数据淘宝,在上面自由地交易?我的结论是,数据不是石油,不能一桶一桶的卖,这样肯定是不行的。


我们说数据共享,其实数据共享是个伪命题,因为数据极其容易复制,一共享就复制了,复制了还要共享吗?就自己玩自己的了。


那些电话推销的人、卖数据的人,也在做大数据研究,一看你的公司有数据两个字就打电话过来:我们这边有个某某省社保的数据,10万块钱你要不要,说不要,再过半个月,5万要不要,再过几天1万。为什么?因为他花10万买了这个数据,卖5万,只要多卖两个人就赚回来了,所以价格越来越低,越来越低,最后到1万,但是这些数据真正的所有者应该是我们的公民、我们的市民,他们没有说任何话,在整个过程中。


5


数据智能会产生这么多的问题。我们看到我们的商业在奔向一个浪潮——个性化,个性化的未来十分清晰,因为商家掌握了你的数据,能够给你一个最想要的东西,另一个大潮是——智能化。这两个大潮是我们今天看到的商业浩浩荡荡的两个大潮。但是在这其中,还有很多问题。


数据不是石油,数据是土壤。一粒土啥也干不了,一盆土可以种花,更多的土可以盖房子。房地产是宇宙第一大产业,但是未来,数据才是真正的宇宙第一大产业。


演讲系列:

杰夫·伊梅尔特写给GE的最后一篇博客:我在CEO岗位上学到了10件事

侍乐媛:CPS生产系统平台在离散型和流程型行业的不同应用案例




更多独家观察和原创文章,造奇新媒体,为您奉献真知灼见。详见:截止2017年7月7日的历史[分类]文章链接






     

               【造奇智能产业新媒体】      



国内第一家正式成立并开展运营的智能制造产业新媒体机构,聚焦工业4.0与智能制造时代的价值创造,以“深度影响智能制造进程,守望智能制造产业成长”为使命,联接产业企业、大学、研究机构、政府、资本等产业核心力量,通过创新和融合力量,提供深度观察、行业洞见、丰富资讯于一体的原创型、产业新媒体平台。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存