独步天下的谷歌算法(2)

在谷歌创办时,佩奇和布林还不必有隐私方面的担忧。他们一心一意地钻研如何让评定网页的过程自动化。他们的方法无疑优于雅虎依靠人工编辑来维持一个用人手挑选的网站指南引擎的运行。谷歌取代雅虎进而赢得领袖群伦地位的故事的启发性就在于,谷歌在计算机的应用方面比那些大公司更加灵巧。

谷歌依靠搜索引擎起步,它只能从事检索和分析网页的单调工作。2000年,公司与当时比自己大得多的雅虎公司达成了一项交易――为雅虎的用户进行网页搜索。这对谷歌的财务而言算不上一宗大买卖,也无助于树立起自己的品牌。雅虎的用户甚至不知道谷歌才是提供搜索结果的“批发商”,而是以为这些结果都是雅虎找到的。但是这笔交易使谷歌得到了某种比销路和品牌意识更具战略价值的东西:它为谷歌提供了大量的搜索查询的第一手资料,这是谷歌改进搜索技术急需的原始材料,有了这项内在的能力,就可能将数据量的增长转变为搜索结果质量的提高。

随着收集的信息越来越多,佩奇和布林的技术也变得越来越“聪明”,自然,俩人迟早会开始思考如何着手处理无所不包的原始数据。如何使用这些没有相互联系的具体信息,在当时还没有被当作最迫切的问题。先收集,后分析。如果这些信息还没有被数字化,那么谷歌就不计成本将其数字化。谷歌最早的网络经验体现在它比任何公司都更具有搜集更多信息的智慧上,它以多种方式让搜集信息的规模受人喜爱,产生交叉检索、相互参照的更加密集的集合,贡献出世界上复杂程度最高的搜索结果。

谷歌比它的主要竞争对象雅虎和微软更早就认识到,一个将所有信息全部网罗殆尽的系统,依靠人工是根本无法完成的。正如人类的思维要依靠协调发展的神经系统内的连接一样,数字化的信息搜集也要依靠以软件带动的相互对接,而不必介入人工。软件的算法固然是由人制定的,但最终产品的复杂程度远远超过了人类凭借手工所能达到的水平。

在公司建立的过程中,佩奇和布林运用了许多不同的算法。但在哲学定义上,这些不同的法则却不属于物质范畴:谷歌的所有算法都可以说属于总的算法的组成部分,所谓“算法”就是软件公式的简化形式,谷歌的创立者们以为它们是解决任何现存问题的最好手段。他们对算法的力量坚信不移,因而采取了一种颇引人争议的推论:由算法所导致的结果无需以人工介入的方式进行编辑、调整甚至触摸。对于处理世界上的所有信息的系统进行调节的唯一途径是将一切过程都自动化。算法也可以用手动的方式加以调整和改进,但是修补过程只能由算法在进行搜索之前自行完成。一旦他们允许对算法进行复评,并在搜索完成之后用搜索结果来修补,这种人工介入就会使系统变慢,使它步履蹒跚。在谷歌,实现规模至高无上,而这必须依靠完全自动化的过程。

在谷歌成立之初,算法的力量在搜索业界并未得到广泛的赞赏。在雅虎-谷歌结盟时期,谷歌似乎不想对任何人摆出竞争姿态。在它的早年,即上世纪末和本世纪初,谷歌还没有找到明确的发展方向,也无法使人相信自己是一家能够将全世界的信息都组织起来的公司。倒是雅虎牢固地树立了作为值得信赖的信息来源的形象,似乎完全有可能将自己的任务完成好。作为门户网站,雅虎是许多网络用户在线访问的第一个地方,而且公司提供了一目了然的服务和信息。这使它成为用户必须访问的最可靠的网站。它提供的内容包括电子邮件、分类广告、游戏、新闻、体育、天气、股票行情以及管理员认为能吸引访客进来并使他们留下来的一切信息。

读书导航