谷歌大数据揭示真实人性?

《每个人都撒谎 – 大数据、新数据和网络能告诉的真实的我们》的作者并非知名作家也不是著名学者,而是一位年轻的数据专家,塞斯 斯蒂芬 – 达维德维茨(Seth Stephens-Davidowitz)。塞斯是一位经济学博士,却钟爱通过大数据分析来了解人和社会的真实心理。2012年他找到了自己数据分析的“宝藏”,因为谷歌将自己的庞大数据库通过“谷歌趋势 – Google Trends”向公众开放使用。在通过分析大量的公开的“谷歌趋势 – Google Trends”数据,塞斯博士得出的结论是:美国人在撒谎,因为谷歌数据分析出来的美国人对“性”、“种族歧视”、“女性”等很多敏感问题上公众公开的态度和调查和他们私下使用谷歌搜素的情况大相径庭。

美国同性恋调查数据分歧很大,有分析认为是高达10%,也有数据认为美国的同性恋比例大约在2% – 3%,但是通过对谷歌数据的海量分析。很多和同性恋性需求相关的关键词告诉我们美国的男性同性恋比例应该在5%左右。同时有趣的是,美国女性搜索“我的丈夫是不是同性恋?”这样的问题要比搜索“我的丈夫是不是有外遇?”这样的问题的比例要高10%!

美国是一个”性为中心–Sex Obessed’的社会,也就是人人都想表示自己“性感”的社会,但是美国人“性”福吗?书中的研究结果显示美国社会强烈的“性焦虑”,以及远比表现出来的“性”趣要少得多的实际“性生活”。由于政治正确的原因,在美国社会是不能公开表示有歧视性的观点的。但是,谷歌的数据显示在私下,人们的搜索显示惊人的阴暗面。例如,“黑人”的词汇会大量和“愚蠢”、“粗鲁”等词汇相关,同时人们会使用早已经被唾弃的“Niger”等有歧视性词汇来搜索。而“犹太人”会和“魔鬼”、“坏人”等词汇相关起来。

在目前的大环境下,可以想象“穆斯林”也不能幸免。“穆斯林”关键词是和“恐怖分子”这样的词汇大量相关。在美国San Bernardino枪击案后,因为袭击者的名字看起来像阿拉伯名字,像过激的搜索“杀死穆斯林”这样的词语再次出现了一个高峰。

《The Guardian》对书作者塞斯 斯蒂芬 – 达维德维茨 的采访中,记者问到一个关键性的问题:你的研究结果会改变你对人性的看法吗?我们是比我们意识到的更黑暗和陌生生物吗?塞斯博士回答道:是。我开始就有一个黑暗的人性观,我觉得现在变得更黑暗了。我认为人们自我为中心的程度是非常令人震惊的。他补充道:当特朗普成为总统时,我所有的朋友都说他们很担心,因为他们非常关心移民和穆斯林禁令,夜不能寐。但是从谷歌数据中可以看出,在特朗普当选的时候,焦虑没有上升。当人们在凌晨3点醒来时,他们的搜索是关于他们的工作,他们的健康,他们的关系 – 他们不关心穆斯林禁令或全球变暖。

在纽约时报畅销书《我们自然的天使》的作者史蒂文·皮克(Steven Pinker)给《每个人都撒谎》的前言中,史蒂文写道:在二十一世纪初的任何一天结束时,搜索互联网的人将会产生8万亿兆字节的数据。历史上史无前例的信息数量惊人。数据可以告诉我们,我们是谁?我们的恐惧,欲望和行为,以及我们做出的有意识和无意识的决定。从深刻到平凡,我们可以获得令人惊讶的关于人类精神的知识,不到二十年前,似乎是无法估量的。

大数据对人类自我认知的影响只会随着时间产生越发深远的影响。大数据,就目前时段来说,主要是谷歌公开数据的分析还只是冰山一角。媒体、新闻学以及社会研究目前对大数据的分析和应用远远落后于商业领域,可以想见如果更加深入地应用大数据来挖掘社会和人性,媒体和新闻学会更加接近那个所谓的“真实”。但,如果这个“真实”的黑暗面远比虚伪的人性表现得要大得多呢?(文/沈二,来源:RCI)

发表回复