独步天下的谷歌算法(1)

任何人都可以召唤谷歌主页并动员起谷歌搜索引擎的全副力量,而不必为登录提供任何个人信息。性别、种族、年龄、受教育程度、职业――一切都不必公开。搜索引擎只搜索它所接收的词语,以及连同搜索请求一道传过来的不起作用的网络地址。

谷歌之所以拥有回应匿名提交搜索请求方面的技术,源自其创始者们致力于尽一切可能从网络站点而非用户方提取信息。所谓算法就是为解决具体问题而设立的一套规则:它是用于构建复杂的计算机软件的基础材料。谷歌的PageRank算法就是用于对网页的链接进行分析,辨别某一个页面同其他页面何者名气更大。谷歌的搜索引擎不需要了解用户的任何情况,而只需猜测当搜索语词被键入时用户的心里在想什么。

若能在匿名搜索领域成为一种核心力量,将对谷歌有着极大的帮助,而且这种帮助的方式还是谷歌在创办之初未曾预料到的。随着在线世界以指数次幂的规模持续扩大,在线收集的个人信息飞速增加,用户们已经不安地看到一个又一个公司或蓄意或无意地释放了一些被用户当作个人隐私的信息。隐私每泄露一次,人们的提防心就加重一次;于是用户们希望得到承诺,使他们的个人信息受到切实保护。令谷歌感到幸运的是,它的搜索服务不需要了解用户的身份就可以开始工作。

谷歌的搜索方法借重数学模型,不需要个人信息,因而它提供的广告是由搜索内容决定,而不是由人工提交的,这样就能保证广告服务对象的身份不致泄露。谷歌的这种方式使它在与Facebook等社交网站的经济效益竞争中处于有利位置,因为后者向广告商提供的是接近具体用户目标的机会,而谷歌出售给广告商的只是接触被用户视为个人敏感信息的机会。

谷歌优于其社交网络竞争对手的地方在于毋需了解其用户的个人信息就可以完成网络搜索,不过,这个优点却被它在除搜索以外的其他许多服务项目上的扩张行为抵消了;在这些服务――如它的电子邮件服务Gmail――中,谷歌所获取的资料是极其私人性的。谷歌知道,用户们也许会担心它的雇员可以随意偷看谷歌用户的电子邮件。这个问题不仅谷歌有,微软、雅虎以及美国在线的雇员也可以在用户私人的电子邮件中乱翻,而且这几家公司的服务器所处理的电子邮件信息比谷歌要多得多。所以被担心陌生人擅自阅读他们个人信息的电子邮件的用户单独挑出来,这对谷歌的确有点儿不公平。就谷歌而言,它为了让公众放心而采取的措施无论如何也不能完全令人信服。谷歌说,只有一小部分职员被允许接触由Gmail保存的电子邮件,因此它们不会泄露。但是,令人不太放心的是,公司还规定了一些特殊类别的用户,他们的电子邮件是放在谷歌的雇员禁止进入的地方,“无论他是公众人物,还是某个具体公司雇员,还是谁的熟人”。这能禁止电子邮件被陌生人当作消遣物来阅读吗?为维护这一规定而制定的惩罚措施――解雇――足够严厉吗?能有效杜绝这种行为吗?规定公布后,有违规行为被查处吗?如果某个用户的电子邮件被偷,他能得到通知吗?

正如谷歌所断言的,这类担心是没有事实根据的,对某些公司安全缺口的担忧使人们对所有保存用户个人资料的公司都产生了不信任感。尽管2007年的一篇文章报道了Facebook的雇员(而非谷歌雇员)偷看了用户的资料(据推测可能是为了检查可能的候选人的日期),有的人篡改了电子邮件信息,还有的人更换了用户的文件夹的照片,但谷歌的私密性保护措施也受到了越来越多的怀疑。

读书导航