社会环境下网页重要性的研究
图3.3 VB运行结果图
26
社会环境下网页重要性的研究
27
社会环境下网页重要性的研究
图3.4 PageRank的计算结果
由上式可以看出,每一个第i+1次的PageRank值都是基于上次的PageRank值重新计算的。具体的迭代次数在实际中是无限的。循环次数越多,计算结果越收敛于(越接近)网
28
社会环境下网页重要性的研究
页的真实PR值。数据的精度设置越高则循环次数就越多[12],但是实际上将网页的PR值按大小排序无需太高的精度,可以区分出网页PR值大小就行,这样对PRin的精度要求也无需太高,精确到小数点后十五位就足够。上面的循环运算的计算结果越来越趋向一个值,根据计算结果,第十六次的循环计算已经收敛到小数点后14位,我开始定义的数组数据类型为双精度(Double)占8个字节,16位的最高位数已经被突破,再下去的循环计算已经没有意义,在另一方面也反映了我的算法具有无限的精度,循环次数越多则精确位数越多,所以我的算法在精度方面是完全符合要求无可挑剔的。但是循环次数少就达到收敛效果不是说明我的循环次数设置那么高是多此一举,因为上面是属于最简单的模型,达到收敛所需的次数当然是最少的,同样的算法对于互联网数以亿计的网页和访问者,运算量是巨大的,循环次数更是非常巨大,上面只是简单的模型,目的是使读者更加理解我设计的算法,同时也验证了我的算法的正确性。
3.2.5 matlab编程验证算法收敛
上述过程本质上可以表达为特征向量的计算,首先每个访问者在i领域的PR值可以表示一个矩阵,即一个N行N列的矩阵(N为整个网络访问者的总数,j为i领域所有的网页数)为了方便计算,开始时可以给每个元素的值都设为
1N。
1?1111?,,,,....,?NNNNN???11111?,,,,....?,?NNNNN???11111,,,....? PRin=?1???n×n= ?,?NNNNN??................................???1??1111,,,....,?NNNNN?????
设Zijn为一个随机矩阵它的横向表示同一个网页被不同访问者访问的次数,纵向表示同一访问者对同一领域不同网页的访问次数
?Zi11,Zi12,Zi13.....,Zi1n???Zi21,Zi22,Zi23.....,Zi2n??Zijn= ?Zi31,Zi32,Zi33.....,Zi3n?
??.......,.........,.......,......,......???Zij1,Zij2,Zij3.....,Zijn???同理设Kijn为一个随机矩阵它的横向表示同一个访问者不同网页的Kijn 。纵向表示不同
29
社会环境下网页重要性的研究
访问者对同一个网页的Kijn
?Ki11,Ki12,Ki13,......Ki1n???Ki21,Ki22,Ki23,......Ki2n??Kijn=?Ki31,Ki32,Ki33,......Ki3n?
??........,........,.........,.....,.....,???Kij1,Kij2,Kij3,......Kijn???PRin=
?j(Kijn×
?nZijn×PRin×Kijn) (3.1)
因此?Zijn×PRin×Kijn可以用矩阵运算表示为((Kijn.*(PRin.*Zijn))*L)
n(在matlab数学矩阵运算中,对于行列数相同的矩阵A和B,A.*B表示A与B的各元素对应相乘,所得的结果作为结果矩阵相应位置的元素。
举例:??1,2??5,6??1?5,2?6?[13]
?.*??=??) ?3,4??7,8??3?7,4?8?
?1???1??其中L为N行一列的矩阵列向量?1?
???...??1??? (Kijn.*(PRin.*Zijn)与L相乘,相当于数学表达式的求和符号?,在这里L起到的作用
n是求和,L的各元素的值为1,相乘之后不改变值的大小,其起的作用相当于+号,将(Kijn.*(PRin.*Zijn)的行元素相加,所得的结果为j行1列的矩阵。 上式可以用矩阵相乘表示为 ((Kijn.*(PRin.*Zijn))*L)=
30
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库Google网页排序算法中PageRank值(6)在线全文阅读。
相关推荐: