77范文网 - 专业文章范例文档资料分享平台

Google网页排序算法中PageRank值(8)

来源:网络收集 时间:2019-04-01 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

社会环境下网页重要性的研究

图3.5 Matlab运行结果图形

上面四条收敛曲线的点分别对应每次循环计算得出的PRin的值,从左往右分别表示PRi(1)、PRi(2)、PRi(3)、PRi(4)。四条收敛曲线反映了改进算法计算的PRin值最后是收敛的,验证了原先的推理,因此算法最后收敛成立。同时说明上面设计的改进算法是可行的。

36

社会环境下网页重要性的研究

3.3 网页PR值的计算方法

3.3.1 计算网页PR值的理论基础

最后结合每个访问者对网页Pij的访问次数和投票情况来计算网页Pij的PR值:Zijn为访问者对网页Pij的访问次数,因为搜索者总希望找到权威的网站,权威网站里面的内容相对准确,怎样找到权威网站呢,PRin×Zijn表明访问者本身的PR值较高,访问的次数越多,表明网页受关注的程度越高,则网页自然应该排在前面,PRin×Zijn是访问者n对网页PR值计算中的权重,这个权重越大,则访问者n对网页Pij的PR值影响越大,但是我要做的工作是网页的权威性内容的正确性决定网页排名,网页是否权威还要考虑访问者对网页的投票,在这里不同于计算访问者的本身PR值(即访问者在专业领域的学术水平)需要事先获取访问者对网页的投票的被认同度,现在要获取的是访问者对网页的评价,这个与网页内容的被认同有关。PRin×Zijn作为一个权重,影响网页PR值,其起的是正面影响还是负面影响还要看访问者对网页的投票评价如何。[14]

因此设一个系数Hjn,Hjn表示访问者对网页内容的投票评价(访问者n对网页内容的认同度),Hjn为0到1之间的数,1表示访问者完全认同网页的内容,0表示访问者完全否认网页的内容,Hjn的值越大则表明访问者越赞同网站的内容,当网页没有投票栏或者有投票栏但是访问者没有投票时Hjn取0.5。

访问者对网页Pij的内容的认同度

Hjn = 50 %,网页没有投票栏或者有投票栏但是访问者没有投票时 0 ,访问者没有访问网页j

为了继续计算每个网页的PRij我们必须获取Hjn信息即每个访问者对网页Pij的内容的认同度,在权重PRin×Zijn的基础上再乘以认同度Hjn就可以客观反映网页本身的PR值。因此网页的PR可统一用下式表示:

PRij=?nPRin×Zijn×Hjn (3.7)

对于非分类网页的PR值,可以先将非分类网页分到各个相关领域计算,再取各个相

关领域的PR值的平均值就可以综合反映网页的PR值。

为了继续验证上面算法的正确性,下面继续用上面的简单模型进行计算,首先给Hjn设置数据如下图:

37

社会环境下网页重要性的研究

3.3.2 建立数学模型

图3.6

上图3.6中的数据就是相应的访问者对网页内容的认同度

PRij=?nPRin×Zijn×Hjn (3.7)

PRin×Zijn表示访问者对网页的关注度[15],这里可以看做一个权重,网页的受关注度高低并不可以反映网页的权威性和正确性,如果大部分访问者对网页的评价很低,就算网页的受关注度越高,它的权威性越低,因为越多的人不认同网页的内容。相反如果大部分访问者对网页的评价很高,网页的受关注度越高,它的权威性越高,因为越多的人认同网页的内容。这说明PRin×Zijn只是一个权重,并不可以决定一个网页的权威性和正确性,而PRin×Zijn×Hjn就可以客观地反映了访问者n对网页Pij的权威性和正确性的贡献,将每个访问者的贡献值相加就可以得到一个网页的PRij,因此PRij=

?nPRin×Zijn×Hjn

38

社会环境下网页重要性的研究

对于非分类网页的PR值计算只需将不同领域计算得的PRij相加除以涉及领域数即可。即:

PRij= (?n,iPRin×Zijn×Hjn)/K (3.8)

K:非分类网页涉及的领域数

根据收敛算法的计算结果PRi(1)> PRi(2)> PRi(3)> PRi(4),其中PRi(2)与PRi(3)比较接近,两者和PRi(1)相差不大,而PRi(4)比其他三个小很多因此考虑前三者即可,可以知道粗略由PRi(1)PRi(2)和 PRi(3)决定PRij,三者的PR值较大,根据PRij计算公式可以知道网页的PR值主要由三者的评价决定,访问者1的评价为2>1>4,访问者2的评价为3>2,可以看出仅仅由以上两个访问者难以比较4个网页的PR大小,由于访问者3的PR仅次于两者,所以网页的PR大小还要考虑访问者3的评价,访问者3的评价为3>1。根据上面3个访问者的评价结合每个人的PR可以得出结论:网页PR值排名为:3>2>1>4,即Pi(3)> Pi(2)> Pi(1)> Pi(4),如果公式

PRij=

?nPRin×Zijn×Hjn (3.7)

算出的结果和上面的结果相同则可以说明上述的算法是正确的、可行的。

3.3.3 Visual Basic编程验证算法的正确性

为了继续验证算法的正确性,下面继续沿用上面计算的PRin的程序结合图3.6的Hjn 用VB编程和matlab编程计算PRij,上图标示的数据Hn设置情况结合计算出的PRin可以明显看出网页PRij的排名,便于检验计算结果是否正确。

VB编程如下:在上面计算PRin的基础上再添加一小段程序变成以下程序: Private Sub Command1_Click() Dim H(1 To 4, 1 To 4) Dim Pi(1 To 4)

H(1, 1) = 0.2: H(1, 2) = 0.5: H(1, 3) = 0.2: H(1, 4) = 0.6: H(2, 1) = 0.5: H(2, 2) = 0.3: H(2, 3) = 0.5: H(2, 4) = 0.4

H(3, 1) = 0.5: H(3, 2) = 0.9: H(3, 3) = 0.6: H(3, 4) = 0.5: H(4, 1) = 0.1: H(4, 2) = 0.5: H(4, 3) = 0.5: H(4, 4) = 0.3 Dim m, n, l, i, j, k, o Dim PRi(1 To 4) Dim Zi(1 To 4, 1 To 4) Dim Ki(0 To 4, 1 To 4) Dim C(0 To 4) Dim T(0 To 4)

39

社会环境下网页重要性的研究

Dim PR(1 To 4, 1 To 9999) Dim P(1 To 4) Dim G(1 To 4)

Zi(1, 1) = 3: Zi(1, 2) = 0: Zi(1, 3) = 1: Zi(1, 4) = 2: Zi(2, 1) = 1: Zi(2, 2) = 4: Zi(2, 3) = 0: Zi(2, 4) = 3: Zi(3, 1) = 0: Zi(3, 2) = 2

Zi(3, 3) = 2: Zi(3, 4) = 0: Zi(4, 1) = 2: Zi(4, 2) = 0: Zi(4, 3) = 0: Zi(4, 4) = 1 PRi(1) = 1 / 4: PRi(2) = 1 / 4: PRi(3) = 1 / 4: PRi(4) = 1 / 4

Ki(1, 1) = 0.7: Ki(1, 2) = 0.5: Ki(1, 3) = 0.2: Ki(1, 4) = 0.1: Ki(2, 1) = 0.4: Ki(2, 2) = 0.5: Ki(2, 3) = 0.5: Ki(2, 4) = 0.1

Ki(3, 1) = 0.5: Ki(3, 2) = 0.5: Ki(3, 3) = 0.5: Ki(3, 4) = 0.5: Ki(4, 1) = 0.8: Ki(4, 2) = 0.5: Ki(4, 3) = 0.5: Ki(4, 4) = 0.2 For m = 1 To 200 P(1) = 0 P(2) = 0 P(3) = 0 P(4) = 0 For j = 1 To 4 o = 0 For n = 1 To 4

C(j) = Zi(j, n) * PRi(n) * Ki(j, n) T(j) = o + C(j) o = T(j) Next n For n = 1 To 4 Ki(0, n) = 0 G(n) = Ki(j, n) * T(j) Next n For l = 1 To 4 P(l) = P(l) + G(l) Next l Next j For k = 1 To 4 PR(k, m) = P(k) Next k For n = 1 To 4 PRi(n) = PR(n, m)

40

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库Google网页排序算法中PageRank值(8)在线全文阅读。

Google网页排序算法中PageRank值(8).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/561234.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: