Google PR

SEO实战密码：60天网站流量提高20倍昝辉

PR是PageRank的缩写。Google PR理论是所有基于链接的搜索引擎理论中最有名的。SEO人员可能不清楚本节介绍的其他链接理论，但不可能不知道PR。

PR是Google创始人之一拉里佩奇发明的，用于表示页面重要性的概念。用最简单的话说就是，反向链接越多的页面就是越重要的页面，因此PR值也就越高。

Google PR有点类似于科技文献中互相引用的概念，被其他文献引用较多的文献，很可能是比较重要的文献。

1．PR的概念和计算

我们可以把互联网理解为由结点及链接组成的有向图，页面就是一个个结点，页面之间的有向链接传递着页面的重要性。一个链接传递的PR值决定于导入链接所在页面的PR值，发出链接的页面本身PR值越高，所能传递出去的PR也越高。传递的PR数值也取决于页面上的导出链接数目。对于给定PR值的页面来说，假设能传递到下级页面100份PR，页面上有10个导出链接，每个链接能传递10份PR，页面上有20个导出链接的话，每个链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数，发出链接页面的PR值，以及发出链接页面上的导出链接数目。

PR值计算公式是

PR(A) = (1-d) + d(PR(t₁)/C(t₁) + … + PR(t_n)/C(t_n))

· A代表页面A。

· PR(A)则代表页面A的PR值。

· d为阻尼指数。通常认为d=0.85。

· t₁...t_n代表链接向页面A的页面t₁到t_n。

· C代表页面上的导出链接数目。C(t₁)即为页面t₁上的导出链接数目。

从概念及计算公式都可以看到，计算PR值必须使用迭代计算。页面A的PR值取决于链接向A的页面t₁至t_n页面的PR值，而t₁至t_n页面的PR值又取决于其他页面的PR值，其中很可能还包含页面A。所以PR需要多次迭代才能得到。计算时先给所有页面设定一个初始值，经过一定次数的迭代计算后，各个页面的PR值将趋于稳定。研究证明，无论初始值怎么选取，经过迭代计算的最终PR值不会受到影响。

对阻尼系数做个简要说明。考虑如图2-29所示这样一个循环（实际网络上是一定存在这种循环的）。

外部页面Y向循环注入PR值，循环中的页面不停迭代传递PR，如果没有阻尼系数，循环中的页面PR将达到无穷大。引入阻尼系数，使PR在传递时自然衰减，才能将PR计算稳定在一个值上。

2．PR的两个比喻模型

关于PR有两个著名的比喻。一个比喻是投票。链接就像民主投票一样，A页面链接到B页面，就意味着A页面对B页面投了一票，使得B页面的重要性提高。同时，A页面本身的PR值决定了A所能投出去的投票力，PR值越高的页面，投出的票也更重要。在这个意义上，传统基于关键词匹配的算法是看页面自己说页面内容是什么，基于链接的PR则是看别人怎么评价一个页面。

第二个比喻是随机冲浪比喻。假设一个访问者从一个页面开始，不停地随机点击链接，访问下一个页面。有时候这个用户感到无聊了，不再点击链接，就随机跳到了另外一个网址，再次开始不停地向下点击。所谓PR值，也就是一个页面在这种随机冲浪访问中被访问到的概率。一个页面导入链接越多，被访问到的概率也越高，因此PR值也越高。

阻尼系数也与随机冲浪模型有关。(1-d)=0.15实际上就是用户感到无聊，停止点击，随机跳到新URL的概率。