大数据的问题06:大数据预测得准吗?

2015-11-26 17:55| 发布者: Fuller| 查看: 3864| 评论: 0|原作者: 张玉宏|来自: 北京勺海市场研究公众号

摘要: 这个系列故事全部是反思大数据,每个故事都会给大数据玩家一种刺痛感,上一篇《点球成金——数据流PK球探,谁更重要?》虽然也在说大数据失效的故事,但是明确人掌握大数据的分析师的价值和地位。今天这个故事触及大 ...
       这个系列故事全部是反思大数据,每个故事都会给大数据玩家一种刺痛感,上一篇《点球成金——数据流PK球探,谁更重要?》虽然也在说大数据失效的故事,但是明确人掌握大数据的分析师的价值和地位。今天这个故事触及大数据核心目标——预测,看看大数据怎样再次被“黑”的。


大数据都是骗人的啊——大数据预测得准吗?

       从前,有一头不在风口长大的猪。自打出生以来,就在猪圈这个世外桃源里美满地生活着。每天都有人时不时地扔进来一些好吃的东西,小猪觉得日子惬意极了!高兴任性时,可在猪圈泥堆里打滚耍泼。忧伤时,可趴在猪圈的护栏上,看夕阳西下,春去秋来,岁月不争。“猪”生如此,夫复何求?根据过往数百天的大数据分析,小猪预测,未来的日子会一直这样“波澜不惊”地过下去,直到它从小猪长成肥猪……在春节前的一个下午,一次血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊……惨叫嘎然而止。


       这则“人造寓言”是由《MacTalk·人生元编程》一书作者 池建强 先生“杜撰”而成的。池先生估计是想用这个搞笑的小寓言“黑”一把大数据。

       我们知道,针对大数据分析,无非有两个方面的作用:
     (1)面向过去,发现潜藏在数据表面之下的历史规律或模式,称之为描述性分析(Descriptive Analysis)
     (2)面向未来,对未来趋势进行预测,称之为预测性分析(Predictive Analysis)。把大数据分析的范围从“已知”拓展 到了“未知”,从“过去” 走向 “将来”,这是大数据真正的生命力 和“灵魂” 所在。

       那头“悲催”的猪,之所以发出“大数据都是骗人的啊”呐喊,是因为它得出了一个错误的“历史规律”:根据以往的数据预测未来,它每天都会过着“饭来张口”的猪一般的生活。但是没想到,会发生“黑天鹅事件”——春节的杀猪事件。

       黑天鹅事件(Black Swan Event) 通常是指,难以预测的但影响甚大的事件,一旦发生,便会引起整个局面连锁负面反应甚至颠覆。读者可阅读纳西姆·尼古拉斯·塔勒布(Nassim Nicholas Taleb)所著的畅销书《黑天鹅》,来获得对“黑天鹅事件”更多的理解。

       其实,我们不妨从另外一个角度来分析一下,这个搞笑的小寓言在“黑”大数据时,也有失败的地方。通过阅读知道,舍恩伯格教授在其著作《大数据时代》的第一个核心观点就是:大数据即全数据(即n=All,这里n为数据的大小),其旨在收集和分析与某事物相关的“全部”数据,而非仅分析“部分”数据。

       那头小猪,仅仅着眼于分析它“从小到肥”成长数据——局部小数据,而忽略了“从肥到没”的历史数据。数据不全,结论自然会偏,预测就会不准。

       要不怎么会有这样的规律总结呢:“人怕出名,猪怕壮”。猪肥了,很容易先被抓来杀掉。这样的“猪”血泪史,天天都上演的还少吗?上面的小寓言,其实是告诉我们:数据不全,不仅坑爹,还坑命啊!

       那么,问题来了,大数据等于全数据(即n=All),能轻易做到吗?要想知道答案,请阅读《颠簸的街道——“n=All”只是一个幻觉?


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2024-3-29 09:12