“登月”计划(12)

谷歌的图书索引被存放在一个网络世界称为“仓筒”的强制封闭的空间里。经过一段时间后,克兰西和他的从事谷歌图书搜索计划的同事们发现,他们不断积累的图书信息可以迅速地凭借某些新方式变得有用――可以让用户将信息带出所谓的“仓筒”供自己使用或分享。2007年秋,谷歌为用户设立了图书书目的“个人收藏”,这个收藏既可以被搜索,同时又能够与他人分享。谷歌提供了一种新的工具,使用户有机会将公共空间内图书中最喜爱的语句或选定的段落以图像格式复制下来,然后把图像粘贴或嵌入到另一个网页上。而且,在公共空间内的文学作品中提到的某个地理位置,可以在由谷歌提供的地图上找到,这就要依靠谷歌的另一项服务――Google Earth,直接把一个又一个的“仓筒”联系起来。

谷歌图书搜索最重要也是最突出的进步,是其对于最新出版的图书的搜索获得了大众的肯定。2007年之前,使用Google来搜索一本书是极易“偶尔碰到或错过”的,并且多数情况是会错过。然后,很突然地,谷歌似乎能够拿得出任何一本正在印刷中的书。谷歌声称,被扫描过的图书数量仍旧不大。截止到2007年9月,只有大概100万册图书可以进行网上检索。这个数字距离它扫描世界书目数据库中的3200万册图书的宏伟计划相去甚远,而且如果按照他们原来设定的10年目标,他们只剩下8年的时间来完成该项目。有点不可思议的是,谷歌已经获得了最近出版作品的一些精彩封面。它是怎么做到的?

2007年5月,谷歌悄悄地做出了自实施“登月”计划以来最大的一次改变:通过利用从世界各地的网上图书馆提取来的有价值的公开图书信息,谷歌为那些还没有进行全文检索的图书添加了书目列表。一夜之间,Google Books在将它们进行扫描和检索之前,就添加了所有正在印刷中的图书书目。

这些图书被放置在谷歌的检索结果网页上,并标示出“无法预览”的字样。为了同已经存在的“全文阅览”(指在公共版权里的图书)、“部分预览”(指那些尚在版权保护期内的图书,谷歌只被获准在它的“图书伙伴计划”中展示这些图书的某一部分)以及“片断欣赏”(指那些处在版权保护期内,谷歌无权展示其内容的书籍)加以区别,谷歌提出了“无法预览”这样一个范畴。

“无法预览”书籍的词条虽然只是些占位符,但他们所提供的信息远远超过了“干巴巴”的检索卡片。比如,参考网页清单、在线图书评论、已编入索引目录的图书引用、在谷歌学术搜索中检索到的学术著作引用等。在它实现了从其他的“仓筒”――当然包括其中最大的一个――“万维网”上面获得大量有关图书的有价值信息的梦想之后,谷歌就可以向用户提供任何一个有具体名称的图书丰富详细的补充资料,而且还不会侵犯书籍的版权持有人的合法权益。

人们不得不佩服谷歌员工的智慧,他们利用谷歌庞大的信息资产,使人们对图书目录卡以外的世界多了很多了解。同时,人们也很困惑,为什么谷歌如此愚蠢,如此急于建立自己的藏书库,在没有获得版权持有人许可的情况下坚持声称自己拥有将正在付印的图书数字化的权利。由反对它的出版商和作家协会提起的两件诉讼案仍在进行中。2008年初,美国联邦地方法院主审法官约翰?E.斯皮莱佐(John )将提交即决审判动议的最后期限定在了2009年4月,审判的时间则更加延后。

谷歌在2007年用来为任何一本书创办用户化网站而准备的条件在2004年时就都已经具备了。谷歌图书搜索的经理人或许是没有看到在公共版权内不同的“仓筒”之间存在着各种交叉结合的机会,因为这种逐渐递增的改进过程无法像近乎不可能的“登月”计划的刺激场面那样令人兴奋。

随着28家图书馆的参与,谷歌图书搜索计划(Google Book Search)正在默默地、不断地深入。2008年2月,密歇根大学图书馆成为第一家拥有在线图书达100万册的图书馆(总页数达到361441145)。项目进展虽然比谷歌当初的“登月”计划显然是慢了一些――仍旧有650万册图书躺在各个大学的图书馆里等待被扫描――但已经看到了尽头,大学希望能够在“下一个10年的前半段”完成这个项目。

法律问题尚待解决,但“物流”问题似乎已经被摆平。谷歌一直在努力地将全世界出版过的文本转存到它的数字仓库里。

下一章

读书导航