摘要:首先我们看看大数据的概念。2008 年《Nature》先提出Big Data 的概念,后来主要由IBM 和麦肯锡把大数据概念做起来。
很多重要的问题都需要多元数据的混合。我举三个问题:
第一个问题是未来我们整个中国最好物流的布局是什么,怎么样让我们物流的成本降低。
另外,华为、大唐电信、中兴等公司关心在5G的网络时代中国的基站怎么建,每个基站副站要怎么建,我们要不要建流动基站,要不要建车载基站等。这些基础设施的投入都是千亿、万亿级别。
还有一个问题是整个中国交通路的布局是什么样,中国走城镇化的道路走了这么多年,未来城镇化到底是什么样趋势,是从东部往西部集联,还是在几个点选择中心城市,再用卫星城市带动整个中国发展。还是说中国要走一些网络化、扁平化,未来这些中心超大城市要消失掉。
这三个问题的解决都来源于我们要预测未来中国的整个人群人口的分布情况,以及未来中国有钱的人、商务的人和普通的人分别的分布情况,还有不同年龄结构的人口分布情况,在全国的尺度,省的尺度,城市的尺度及小区的尺度。
像这样的问题,任何划一小块过来都是一个对商业上都有大的好处,但这种大的问题的解决绝对不是一个单一的数据可以解决的,我们需要运营商,需要腾讯,需要淘宝很多地方,也包括我们各个政府来做。
我们讲这个例子实际上是想说正是这些数据的外部才会产生更大的价值。
像做房地产的要想一下,一座房子最大的问题是要考虑的是进不进入这个城市。如果是全国范围,这是第一考虑问题。第二考虑的问题是,拿哪个地方未来会发展什么规划,不要把别墅修在高铁旁边,那基本是没有戏的。
同样的道理,当你房子修好之后,你怎么定价,怎么找你的消费群,在哪个地方打广告,找什么样的代言人,广告效果怎么样,这一切完全可以从数据完全定量化的。
房地产我们做得比较少,我们做得比较多的是金融方面。金融方面我们给企业和个人做预售信,包括信用卡的发放,因为在互联网上申请一个信用卡,填的信息非常少。
比如说中信银行的审核率在20%—25% 之间,换句话说每五个人在互联网上填,它有四个人会毙掉,因为你的信息比较少。它不可能说针对一个个人信用卡我去找大公国际,鹏元征信拿真实信息。我们在他网上签订一个代码和我们的数据打通,因为我手头有2亿人购物的数据,和2亿人个性化资讯的数据,通过这样一些,几乎通过50%的网购在买什么东西,他的消费情况,消费价格等等。这个时候就可以给他补充很多信息,做很多这样的事。
另外,我们有一家企业——百分点科技做电子商务的大数据的应用,这家企业是IDG、名力基金共同投资的。他主要给电子商务提供一些个性化推荐。
比如一号店,我们基于你的购买推荐一些东西。我们还做导购,你买了360、QQ 的导购栏,要在上面投放我们自己的广告,赚取差价。我们也做电子邮件的营销,比如给库巴,陀陀公社做一些个性化的业务营销。
这里面有一些技术是比较独特的,比如我们在做推荐的时候实际上是打通了所有的数据,换句话说,如果你到耐克,阿迪达斯去看了很多篮球鞋,但最后觉得贵没有买,当你到这个网站的时候,我们直接就给你一些相对便宜,但类似款式的李宁的篮球鞋。去年在我们平台上可以追踪到的销售大概是5千亿,我们是仅次于淘宝的第二大平台,人数也是比较多的。淘宝大概有5亿人,我们有2点几亿。
在个性化E链里面我们有比较独特的一些技术,比如我们发出去的E 链,实际上你每一次打开它都变了。比如今天你去沱沱工社买了一些生鲜食品,收到一封E链你没有打开它,过了两三天,如果推荐不变的话,这个特惠和优惠已经消失不在了,但是你打开邮件的一瞬间,我们直接和主通电脑有一个响应,你拿到的是最近的购买记录,最新的消费,所以你的邮件,我们叫lini—Email(音),永远是活的邮件,不是死的邮件。
【大数据时代的投资布局】
最后讲一下整个大数据的投资。做大数据的公司有四五百家,其中一百多家拿到了投资。我们把中国和美国一百多家放在一起,大概分基础设施和应用产品两类。
基础设施分成四块(采集、存储、分析和计算),应用产品主要是行业垂直和应用分析。国内做基础设施的创新是非常少,比如做存储、计算加速,平台,新的数据非常少。基础设施方面投资可能比较大,行业垂直之内的比较小,这是平均而言。
国内大数据创新泡沫更大,因为我们接触特别多的过来的计划,绝大部分都不是大数据,仅仅技术上我们都能知道,它仅仅是捆绑了一些概念或者有一点点数据。在座有投资想法的,遇到大数据的投资还是要小心一点,很多其实都不是大数据。尤其是行业垂直的应用比较危险——很多都是以前传统的模式,只是套了一个大数据名字而已。
整个国内大数据的投资落后国外大概一年半左右,这是我们把国外投资的公司所在的方向错位的比较,发现错到一年半的左右的时候,跟国内的投资整个Pearson关联是最强的,所以我们基本上可以说国外领先了我们大概18个月。起步来说也大概领先18个月。国外大概在2010年中起步的,而国内是在2012年初起步的,18个月还可以追赶。
大家做产业布局,如果你们是投房地产有关产业,我建议如果有机会的话可以和我聊,也可以通过孵化的形式投一些房地产大数据公司,这个公司实际上就成为你公司的一个战略资源,其实投一个孵化公司只有几百万,对于房地产来说不大。这家企业实际上和你们企业有很密切的业务网络,它能够做一些比如整个房价地价的预估,判断,包括精准的营销,品牌的宣传,广告验证,它实际某种意义上说是看成你们数据营销的一个部门,但它是独立的公司。
如果要投整个大数据企业,这些东西要关注:
第一,数据本身有没有稀缺性、独立性。
举个例子,很多投资方把大数据公司捆绑在淘宝上,淘宝现在相对在走一个比较封闭的趋势,它把流量封在自己里面,不放流量出去了。后来百度把流量提高了,这时候如果你单一依赖新浪,或者单一依赖淘宝或者百度流量话,那你受到的限制就会非常大。所以我们希望数据要么稀缺,这个数据只有你才有;要么独立,你是自己的产生数据,要么你有多个来源,依赖一个太单一了。
第二,数据要流动起来,能够给你投给其他的企业服务,比如这家可能为你的房地产其他部门服务。还有如果你投了多家的话,这些数据是最好互补的,能够一加一产生大于二的价值。
硬技术创新的投资更有价值。有两个风险,一个是数据积累作用的滚雪球作用,一般需要几年时间才能积累,所以早期企业的成本要控制起来。另外一个风险,一般来说我们投的我做孵化、天使,早期做得比较多,一般商业运作比较欠缺,小的投资团队技术可能很好,但怎么从垂直领域找到商业出口这比较困难。
我给大家几个建议。投大数据的公司,多看数据价值,而不是看财务报表;多看早期的团队,而不是看后期的团队,早期的团队带来的价值增量和创新更多,更有趣。
投轻资产,不要投重资产的项目。尽量关注传统行业,而不是新兴行业,这个可能很多人觉得很怪异,因为像移动互联网这样的信息行业,第一竞争非常激烈,第二里面的人都会大数据,大家都是大数据,淘宝、阿里巴巴、百度都是大数据。所以在这上面只不过包含新的概念,公司的本质创新它有,但不是有飞跃性的提高。
但反过来,在农业,工业,制造业,食品安全,包括金融,保险,房地产,这些行业还有能源,材料,这些传统行业里面如果有比较清楚的商业模式用大数据,它能带来的创新是从0到1的飞跃式创新,价值更大。这个趋势是大家抵挡不了的。房地产抵挡不了,其它行业也抵挡不了。
胜利是青睐有准备的头脑,希望大家尽早做好准备去拥抱这个时代的到来,而不是抵抗他。
(作者为百分点科技首席科学家,瑞士弗里堡大学物理系哲学博士、电子科技大学教授、互联网科学中心主任)