在人类利用信息的历史上,共发生了5次媒介技术革命,每一次媒介革命都催生了一次数据大爆炸,并推动人类文化实现跨越式的发展。
历史学家伊丽莎白·爱森斯坦发现,1439年前后,古腾堡发明印刷机以后(第三次媒介革命),1453~1503年,这50年大约有800万本书被印刷出来,比1200年前君士坦丁堡建立以来整个欧洲所有的手抄书还要多。换言之,欧洲的信息存储量花了50年才增长100%(当时的欧洲占据了世界上大部分的信息存储份额),而如今大约每3年就能增长100%。
这次媒介革命产生的数据洪流之猛烈,是前几次媒介革命难以企及的。美国电影《阿凡达》的制作团队动用了将近40 000个处理器,电影制作过程中产生的数据量达到了3PB,而同期的美国国会图书馆存档网络数据大小不足100TB,也就是说制作一部《阿凡达》产生的数据量相当于30个美国国会图书馆的数据量。这仅是数据大爆炸的一个缩影。我们正在经历一场前所未有的数据大爆炸,不仅数据的容量在扩大、数据的种类在增长,数据产生的速度也在日益加快。
表3–1 五次媒介革命
媒介革命
时间
内容
第一次媒介革命
人类史前时期
语言的出现:语言促进了人类思维能力的增强,并为人们相互交流思想、传递信息提供了有效的工具
第二次媒介革命
公元前3500年
文字的出现:文字作为信息的载体,可以使知识、经验长期得到保存,并使信息的交流开始能够克服时间、空间的障碍,可以长距离地或隔代地传递信息
第三次媒介革命
15世纪
印刷术的普及:书籍、报刊成为重要的信息储存和传播的媒体,打破了知识的垄断,极大促进了信息的共享和文化的普及
第四次媒介革命
19世纪中期
电话、广播、电视的发明:利用电磁波传播信息,突破了时间和空间的限制,使声音、画面的传播瞬息万里
第五次媒介革命
20世纪中后期至今
计算机与互联网的使用:数字化、多媒体和网络化快速推进,人类进入信息社会,信息对整个社会的影响逐步提高到空前重要的地位,信息量、信息传播的速度、信息处理的速度以及信息应用的程度等都以几何级数的方式增长
媒介革命是形成数据大爆炸的重要原因。联合国报告认为,与经济社会发展有关的大数据一般都具有以下特征:(1)数据是数字化产生的,可以进行数字化存储并通过计算机处理;(2)数据是被动产生的,来自人们日常生活和活动中的数字化服务;(3)数据是自动搜集的,在产生的同时被搜集并存储;(4)可对数据进行空间或时间跟踪,如移动电话的呼叫位置和时间;(5)数据是被实时分析的。这些特征使巨量数据的采集成为可能。在传统的数据采集方式下,例如通过登记申报、人口普查,要获得这样规模庞大、形式多样的数据是根本无法想象的事情。