“登月”计划(3)

然而不管怎么说,谷歌的“登月”计划与美国太空总署的月球旅行还是有很大差别的:没有一个竞争对手愿意与它在图书搜索计划上展开竞争。在20世纪60年代,空间探索成为冷战的延伸,美国和前苏联在很多科技领域里势均力敌。然而,在2002年和2003年,在谷歌神不知鬼不觉地开始其图书搜索计划的时候,没有其他的公司愿意同它进行一对一的较量――完成这项计划所需要的大量资金足以使其他公司望而却步。

谷歌在这一计划上占尽先机不单是因为它拥有雄厚的财力,更是缘于那些曾经试图将书籍数字化的公司在这条路上没有走得很远。最早承担这个艰巨任务的是由迈克尔?哈特(Michael Hart)在1971年开始的“古登堡计划”(Project Gutenberg)。那时扫描仪和个人电脑还没有出现,所谓的数字化只是将键盘连接到摆在伊利诺伊大学的材料研究实验室里的大型电脑主机上进行数据存取。哈特向一些接触过电脑而且有空余时间的志愿者寻求帮助,他们愿意将公共领域内的重要文学作品的全文录入电脑(他们用不停地打字的手指诠释着“数字”对于“数字化”的意义)。随后,个人电脑的出现使这些志愿者的工作速度得以大幅度提高。

“古登堡计划”一直回避所谓的“权威版本”,认为“在一般读者眼中达到%的准确度的收录文章才是最受欢迎的”。这个计划没有办法很好地涵盖全世界的文学作品:到2002年,该项目仅仅完成了约6300本文学作品的数字化工程,而且所有这些都是完全以纯文字的形式录入,无法体现原书图片所阐释的意义。“古登堡计划”的目标是使纸质文学作品能够更广泛地被接触,其初衷无疑是很崇高的;但该计划固有的局限性之一就是:它被接受的前提必须是读者既不需要也不想要除了纯文本之外的任何东西,同样能给读者带来阅读体验的一些细节,比如字体的变化、书名和标题,以及图书在设计上的微妙特点等,统统被剥夺了。

在传统的出版界眼中最适合完成这项大规模的行动――将所有的图书数字化的机构非美国国会图书馆莫属。到1990年,扫描技术的不断发展带来了数字化成本的大幅度下降,于是国会图书馆开始了他们的数字化计划,几乎将除了纸质书籍之外所有类型的传媒产品都进行了数字化,包括文件、动画、录音、照片。其目的是要建立一个数字化的、记载“美国记忆”的历史资料库。

最雄心勃勃的图书数字化项目始于2001年。当卡内基?梅隆大学收到了美国国家科学基金会(National Science Foundation)为“百万图书项目”提供的50万美元基金时,这项计划正式启动了。为了能够将尽可能多的图书进行数字化,本着“少花钱、多办事”的原则,他们不惜大费周章地将图书运到印度和中国进行扫描。然而,当他们向美国的图书馆提出,要他们提供其馆藏图书并允许将这些图书打包进集装箱,再通过风险很大的海上运往国外进行扫描时,遭到了图书馆的拒绝。遭拒的原因不言自明。布鲁斯特·卡尔(Brewster Kahle),这个在1996年建立了互联网络档案馆(Internet Archive)的互联网创业者――就像他自己说的那样――“跨出了历史性的一步”,因为他将花费了50000美元从堪萨斯市公共图书馆(Kansas City Public Library)购买的15万册藏书无偿捐赠给了“百万图书项目”。

读书导航