独步天下的谷歌算法(9)

《华盛顿邮报》媒介评论家霍华德?库尔茨(Howard Kurtz)用带有讽刺意味的口吻对谷歌的逻辑依据进行了解读:“谁会需要记者呢?当你可以利用易于被滥用的计算机制作一个称心的新闻网站的时候,谁还会把钱花在爱发牢骚的、以自我为中心的、迷恋401(K)条款 的人身上呢?”严格说来,库尔茨的批评在当时是放错了地方――在网络威胁面前立刻感到饭碗不保的不是记者,而是编辑。但短短几年之后,连整个报纸行业也陷入了可怕的财政困境,“谷歌新闻”应对记者职业的消失负间接的责任。通过将用户直接指向具体的在线新闻文章,“谷歌新闻”及其他同样入侵新闻领域的网站扮演了将报纸订户诱拐到电脑屏幕上读新闻的角色,而且让读者将时间主要花在浏览谷歌新闻网站而不是浏览报纸网络版主页。随着印刷版订户的消失,传统上为新闻采访提供资金的广告商也就消失了。报纸网站上在线广告的增加无法完全弥补其印刷版的亏空,报纸行业的临时解雇现象越来越严重。

算法的确需要微调。有一次,一个公司报纸的发行量不知何故登上了商业新闻网页中新闻特写的顶部。还有一次,谷歌冷酷无情的算法在2003年2月1日犯了一个重大的错误,导致了严重的负面后果:那一天,航天飞机哥伦比亚号在返回途中解体,导致全部7名宇航员死亡。由于没有估准这个事件的重要性,算法当天允许这条消息从新闻网站的主页上一度消失。

其他的反常现象也不时出现。2005年,谷歌对它的公式做了调整并申请将其加入到算法专利中,算法可以考虑更多的因素,如新闻机构编制的特写的平均长度,新闻部门的人员数量,报纸自办网站的访问量,接入这个网站的国家的数量等。结果得到了改善,反常现象(几乎)消失了。(新泽西州的一名15岁高中生在2006年写了一则假新闻,称他已经成为谷歌最年轻的雇员,“谷歌新闻”竟然不辨真伪,也收入了这则新闻。)

在组织新闻的竞争中,谷歌的算法和雅虎的人工新闻编辑进行了对决,然而,谷歌并没有取得胜利。它的算法虽然有所改进,但并不意味着已经赶上了雅虎新闻网站的质量。说“谷歌新闻”是一个劣等网站,并不是因为它偶然有一天表现不佳,算法被指犯下了人工编辑决不会犯的错误;“谷歌新闻”的低劣表现在即使是它最好的日子也从未有过“雅虎新闻”指导新闻选择的精益求精的态度。访客数量上的差异也反映出两家的不同由来已久:在开办4年后,“谷歌新闻”的访问量只及雅虎新闻网站的30%,后者仍是Web中最有人缘的新闻网站。在这种情况下,当算法遭遇人类时,人类获胜。

新闻的性质决定了新闻并不能显示出算法随着数据的增长而自动日益复杂化的真正威力。在网站中,维护人员赋予算法的是一种额外的高明之处:一旦它们在自己的网页中加入在其他网站上发现的新闻网页的链接,就可以对Web网页进行检查。谷歌“蜘蛛”搜集的页面越多,算法所集中的链接就越多,它赖以做出的判断就越具权威性。但具体到新闻,由于算法只能对新闻的组织进行判断,却不能将成千上万的人阅读新闻时所做的判断搜集起来,因而,算法对新闻而言,其智慧就赶不上它在搜集新闻报道时所达到的那种引人注目的高度。而新闻报道又有时效性,先出者不断被后出者所替代,这就使得算法缺乏考察用户点击率的数据基础,所以它就不能持续地保持敏锐的判断力。

读书导航