Home 舆情研究实验室媒体报道 祝建华:大数据的真实与误解

祝建华:大数据的真实与误解

E-mail PDF

2014第五届中国传媒领袖大讲堂于7月5日至19日在上海交通大学举办。本届大讲堂邀请50多位传媒领军人物,一线编辑、记者、主持人和著名专家学者,为来自海内外160余所高校的350余名学子讲授传媒业改革创新的经验与教训,帮助学子们了解传媒业界和学界的最新发展动态,深化对传媒业和新闻传播学科的认识。以下为香港城市大学媒体与传播学系教授祝建华7月7日上午在第五届中国传媒领袖大讲堂上的演讲。

祝建华教授演讲的主题为:《从大数据到数据新闻》,主要包括大数据的真实与误解;数据新闻的前世与今生;数据新闻的善用与误用。

关于“什么是大数据”这个问题。祝建华引用了IBM的“4V”理论:海量(volume)、 快速(velocity)、多样(variety)与价值(value),引申到中文含义也就是“多、快、好、省”四个字。祝建华对当前学术界存在的一些关于大数据的观点误区进行了辨析,为大家提供了真实的大数据信息,传达了最前沿的大数据理念。

祝建华对当下普遍认为“数据量(即个案的记录数)越来越大”的观点表示认同,但关于“数据量越大越好”、“数据信息(即个案的特征)越来越丰富”的观点,提出了质疑。他认为,数据量大是好事,但是并不是数据量越大越好,这其中存在一个边际效益递减的问题。

至于为什么大数据的信息反而不丰富这个问题,祝建华说,“传统小数据,个案不多但变量丰富;理想的大数据,海量个案海量变量。但是现实中的大数据,海量个案极少变量,现在社会的数据更多的是‘胖数据’。”

祝建华还提出,当下有一种观点认为“处理大数据的技术已经成熟”,这言过其实,适用于大数据的统计分析方法还在襁褓之中。他说,“现在所用的统计分析方法是100多年前发明的,这些经典方法以小数据的正态分布为前提,对大数据并不合适。这是大数据技术尚不成熟的一个重要标志。”

针对种种观点与误解,祝建华总结道,“大数据是真的,但是现在我们对大数据的了解、处理能力还有待提升。”(杨倩)