image.png
刚才我们所作的初始化PR值的⽬的为假设上⽹者等概率的浏览已有的⽹站,下⾯的我们的上⽹者开始他第⼀次的上⽹体验,我们可以由概率矩阵和初始值向量得到该上⽹者第⼀步之后的概率分布:
image.png
这⾥我们需要注意的是,概率矩阵M是不变的,M只与⽹站的链接情况相关,⽽与过程⽆关。我们尝试迭代30次、50次、100次,可以发现PR值稳定不变了:
image.png
3、算法存在的问题以及相应的解决⽅法
Q1:终⽌点问题
该问题的产⽣是由于某个⽹站节点并没有指向别的⽹站的链接了,也就是死胡同。如下图:
蒜蓉小龙虾的做法image.png
夏雨袁泉
违的拼音由图中可以看到,⽹页C没有任何链接到其他⽹页的出链,故该⽹页节点是个死胡同。
东莞旅游
泡沫之夏剧情介绍同样,我们按照上⾯的⽅法可以写出他的概率矩阵:
image.png
李维嘉的女朋友是谁
但是有趣的是,当我们进⾏了30次或以上迭代后(其实不⽤这么多次),所有的PR值都为0了。有点线性代数基础的同学很快就可以反应过来这个矩阵乘法的问题。映射到我们的实际场景下:当我们的上⽹者进⼊该⽹站时,发现该⽹站没有其他⽹站连接选项或者被该⽹站的⼀些⼩把戏糊弄住了,他会怎
么做呢?会傻乎乎的⼀直呆在该⽹站吗?当然不会。按照绝⼤数⼈的正常⾏为习惯,会在地址栏中随机输⼊⼀个其他的URL进⾏访问,⽽不是就跟这个"死胡同"⽹站去较劲。那么我们的解决⽅法也就应运⽽⽣了:
A1:给死胡同⽹站加出链
既然该⽹站没有出链会影响算法最后的输出结果,那么我们就模拟⼈的正常思维⽅式,给这个⽹站节点等概率的设置出链,出链的⽬标为所有⽹站包括其本⾝。如下图