《永无止境:Google传》第2章 初来乍到(3)

1999年年末,Google加速了争取市场主导地位的进程。新闻媒体随即开始渐渐关注这个真正好用的搜索引擎,网络用户也开始口耳相传,纷纷告诉亲朋好友试试Google搜索。更多的用户意味着更大的需求,更大的需求意味着需要更多的机器。为了提高搜索响应能力,吉姆和史威墨马不停蹄地工作。不幸的是,计算机突然出现供货紧张。在网络狂潮的最高峰,计算机供应商都忙于应付他们的大客户,根本没有心思理会Google这种小公司突然提出的采购请求。全球性内存条短缺更是让这种情况雪上加霜。本来Google公司的硬件系统一直都不是很可靠,现在越发显得难以招架。

这个问题的部分原因在于Google建设的硬件系统本身就有缺陷。

“买机器的时候便宜就好,坏了也不用管它。如果出了故障,可以先置之不理,不行再设法修复。”按照硬件设计师威尔·怀特德的说法,这就是Google的硬件建设策略。怀特德是2001年进入Google工作的,他告诉我:“使用便宜的散件,展现极强的故障容忍能力,开发对硬件环境要求不高的软件,这才是天才的理念。”不过,只有在能买到零件修好机器,并且还能持续添置新机器的前提下,这个办法才行得通。不然,就得提高现有机器的效率,省去购买新设备的麻烦。

Google的第一批服务器就是如此匆忙地组装起来的,以至于主板上的焊点都与托盘上的金属部分接触,因而Google工程师们想出了在中间加上软木垫片来绝缘的办法。这个办法看似廉价而不可靠,但却能防止CPU(中央处理器)短路。接下来,拉里把关注焦点放在如何更加高效地利用空间和尽可能地削减昂贵部件上。拉里、乌尔斯以及另外几个工程师卸下了机柜上的所有零件,在装有软木垫片的托盘上重新布局,搞得就跟积木玩具一样。他们的目标是每个托盘上至少插放4个CPU。往下,在8英尺高的金属柜架上,每个插槽都要塞入一个托盘。因为服务器通常并不连接显示器,他们干脆把占地方的显卡去掉了。这招挺好,只是千万别出毛病。一旦出现故障,维护人员就无法查出毛病在哪,因为坏了的CPU跟显示器根本无法连起来。哦,倒是也可以想办法连上显示器,不过那就不得不在机器运行时强行插上显卡,因为拉里把电源开关也都去掉了。

“为什么要关掉服务器?”他疑惑不解地问道。大概就是因为带电插拔显卡容易导致主板短路,因而烧坏了整台机器。

工程师们把4个CPU插在一个托盘上,就没有办法从前面连到里边的CPU。技术人员维修插在里边的CPU时,不得不把托盘从机架上抽出来,但是由于托盘放得非常紧凑,以致拉出一个托盘会导致上下相邻的两个托盘跟着滑动。又因为各自的连线彼此缠绕在一起,所以拉出一个托盘就会引起整个机架上的所有设备跟着停机。

这就是我有机会对Google还在跳动的心脏实施搭桥手术的缘由所在。我和同事们的任务是逐一断开以前的连线,然后用服务器托盘架侧面塑料管槽里紧紧绑在一起的线重新连接,连线不再从机架托盘的前面经过,这样会使得托盘更容易抽拉。即便是营销人员,也知道怎么捆绑电线。因此,公司也鼓励我们到服务器的托管机房里大显身手。

“99连线节是为全球规模的无障碍信息交流打好基础,它会提高世界上所有有情众生的知识水平。”我向妻子保证。

妻子克丽丝滕看着我,沮丧地摇摇头。她是专修前苏联历史的博士,担任教授职务。她对胡说八道特别敏感,能够一眼看穿。克丽丝滕尽量对我表示支持,但是母亲的本能让她首先考虑的是三个孩子,她现在担心的是孩子们今后将很少能看到他们的父亲。“你的工资收入已经大幅减少了,现在周末还要去加班。你要知道,报社还希望你回去呢。”

 

读书导航