发布者:发布时间:2016-04-14浏览次数:431

 

新思维的崛起

——《大数据时代:生活、工作与思维的大变革》

151130060 陆重伊

绝对是新的思维。大数据这本书读起来令人荡气回肠。谁又能想到竟然有这样的做法,把全部的数据都收集起来,还可以快速地进行分析,得到预想不到却又与现实吻合得可怕的结论。谷歌公司的可以快速地发现疫情并向卫生部门报告,大选的调查可以不再是单纯的抽样检测,不再像原先那样,不同的抽样调查方式得到不同的结果,众说纷纭。“大数据”这一思想告诉我们,要用整体的、全部的数据,不再禁锢于样本能否代表总体这一伤脑筋的问题,直截了当地在全部的、海量的数据中寻求解答。

人类的认识在向前推进。过去的人们只知道物质,而古典物理学的发展下,能量这一概念被提出,看似虚无缥缈,却无处不在。质能方程e=mc2便是对物质与能量关系的最好诠释。而信息论的提出,将信息提升到与物质、能量平起平坐的地位。我还选学了另一门悦读经典的课程——《信息简史》(詹姆斯·格雷克著),书中描绘了人们从古至今便在对信息的利用中成长,并不是从当下的计算机才开始的,从语言的产生开始,人类便苦苦地探索着信息的收集、利用与分析方法。但科技的限制下,人们无法收集“大数据”,更不用说对“大数据”进行处理与分析。巴贝奇与阿达想要制造一台可以处理信息的机器,他们知道自己要处理的不只是数,机器进行的也不是表面上的数学运算,而是在处理信息,处理这一看似虚无缥缈却又实实在在的东西。“大数据”时代来了,我们有了计算机,更准确地说是有了能够进行海量数据计算能力的计算机。由此,人们的处理分析方式改变了,思维也必须进行着革命。

“大数据”震撼了人们。古典经济学里,无论是微观还是宏观的经济学,总是离不开图标,经济学家满足于用一些公式来绘制图像,而后求交点,你看,那便是平衡点。或者求极值,用上一版面的公式,拉格朗日极值之类的求解方式,得到了看似令人满意的结果。然而事实告诉我们,这样去从事经济,必然要失败。因为经济是复杂的,是多方面的。我还阅读过另外一本书叫《混沌及其应用》(黄润生著)。它告诉我们,世界是非平衡的,非平衡是物质存在的基础。也就是说假如世界处于平衡态,那么世界只会死气沉沉。经济学上也是如此,传统经济学中的平衡态永远都不可能达到。一切都在变化当中,而这其中非线性起着非常重要的作用,非线性是这个世界如此丰富多彩的前提。我们再也不能像传统经济学那样构建一个可以进行计算与分析的数学模型,然后去求解了。我们要拓展,要革命,改变自己的思维方式。“大数据”应运而生。

“大数据”很复杂,但基本思想确实简单的,要去看相关性,而不看因果性。抛开思想禁锢着我们的因果关系分析,不是用a推导bb再去推导c。而是观测过去,利用大数据分析当a发生时,c有多大可能也会发生。这边是概率的思想,看起来不怎么牢靠,但在实战中,这种做法却屡屡获得成功。如开篇一样,谷歌公司将得到的数据同过去对比,发现当时的搜索情况与过去流感爆发时的搜索情况非常相似。不再强求因果关系,而是寻找事物间的相关关系。这里涉及到一个争议。书中认为可以用相关关系来“抛开”因果关系,而译者却认为因果关系将一直存在。

我认为,这样的争议没有必要。以前读过逻辑学的书籍,书中将逻辑分为形式逻辑与非形式逻辑,形式逻辑即是像三段论一般的严谨推理,只要前提与论证过程是正确的,结果必然是正确的。但在非形式逻辑中,人们更像是对生活中的种种现象进行归纳。用可能的因果关系,即相关关系来探究万物。“大数据”这样的统计学做法只是人类寻找相关关系的一种方法,我们不知道谁是因,谁是果,但我们知道这两者相生,知道他们存在着关系,而实用的角度来说,这便足够了。传统的因果分析并没有消亡,正相反,大数据让我们找到了更多的因果关系。

此书提供了非常多的案例来论证大数据的威力。从开篇的谷歌公司预报流感,再到航海图的绘制,美国的人口普查,都向人们昭示着大数据分析的力量所在。我是化院的,那么大数据又是否能运用于化学中呢。我想可以做到。相比起物理,化学对实验依赖更重,很多东西不是靠推导而是靠实验得来的。试想有一天,化学工作者可以通过实验中记录的大数据来完成化学分析,诸如进行材料性能的预测等等,想必是大有可为。化学结合上数学与计算机,正式当下方兴未艾的交叉学科。即是对传统化学研究方法的冲击,又是对化学的有力补充与先进发展方向,何乐而不为呢。

大数据并不一定要计算机才能参与。航海图的绘制便是在人工分析船员的日志而得到的。但有了计算机,有了运算性能强的计算机,我们可以做到的很多很多。因此南大的基础学科大类培养是有它的道理的,仅仅专注于化学本身,不顾数学与物理、计算机,也许可以成为很好的化学工作者,却不能成为优秀的化学开拓者。今后计算机在科研中的作用会越来越大,而大数据分析也只是其中的一个方面。

当然大数据也存在着风险。预报的结果究竟是否可信,收集信息的过程会不会导致隐私泄露,而大数据得到的结果会不会被用于不法用途。试想恐怖分子学会了大数据,流氓有了文化,带来的危害更大。大数据是一门新兴而又潜力巨大的技术,怎么使用由人类决定。未来的某一天,当大数据分析变成大一新生的必修课程时,再来回首现在,将有万千感触。