77范文网 - 专业文章范例文档资料分享平台

数据挖掘中关联规则集的优化(2)

来源:网络收集 时间:2021-09-24 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

设初始规则集∑的子集∑t,由定义4可知,规则集∑7是矛盾的,当且仅当∑7u{x}FYit∑7

则的前、后件可以写为i。Ai:Ai3.. (称为正事实公式)或7

i1

u{x}卜]y.规

7iz

A]i3.. (负事实公式).本文讨论的规则和事实公式

都可以转换为特定形态的子句集.正关联规则对应的子句集中的子句包含1个正文字和1个或多个负文字,如7i。V

i2

i3V…V

7ik

Vi蚪1.负关联规则对应的子句集中的子句包含2个或2个以上的负文字,如1ilV

i2

V]i3V…

V1讧,.正事实公式对应的子句集中的子句只包含1个正文字,如is.负事实公式对应的子句集中的子句只包含1个负文

字,如7

it.可以借助归结原理判定∑7u{x)卜y且∑7

u{x}卜]y.

为方便说明问题,文中后面讨论的算法均采用下述示例作为辅助说明.例中给出了15条关联规则,并相应地给出了它

们的兴趣度,其中包括3条负关联规则.设关联规则集∑包含15条规则如表1所示.

表1

关联规则集∑包含的15条规则

兴趣度

0.60.50.60.70.60.60.6

关联规则

口A6一d

关联规则|Il一,z咒 0

兴趣度

0.50.6

Ⅱ’c口一ic41de—f氏gf—hg—i^一1

j一五0.7点一f奄一fZ—m研+7砚A]0

0.60.50.60.6

0.6

2.2找出关联规则集∑中的所有极小矛盾集

采用一般归结过程进行归结时,会产生许多无用的和重复的子句,浪费时间和空间.由此,必须考虑压缩初始子句集以

及选择1种合适的归结策略,尽量避免无用的子旬出现.对于文中的问题,∑U{x}中可能存在多个矛盾规则集合,所以归

吉首大学学报(自然科学版)

结过程的停机条件不是出现空子句,必须重新确定程序的终止条件.

第31卷

对于每个事实公式x,首先将∑U{x}中的所有公式转化为子句形式,然后对其进行归结.文中采用纯文字删除

法[”6]对整个子句集进行处理可以非常有效地缩小归结空间,提高效率.

过程1:删除包含纯文字的子旬.

考察文中的例子,假设对∑u

U)进行处理.删除处理前包含17个子句:{J,1JV惫,-3志v

z,]zvm,]mV]行,1,,l

V]o,1五Vf,]fVh,]hV忍,]珂Vo,]hV]f,]eVf,]eVg,]gVi,]口V

c,]c

V]d,]aV]6Vd}.

删除处理后只包含10个子句:{j,]JV正,1可以看出,对子句集的压缩幅度是很大的.

Vz,1zVm,]mV]n,]mV]D,]惫Vf,]fV^,]hV起,1行VD}.

(1)子句集的归结.支持集策略[卜6]是Wos等提出的一种归结策略,它在一般归结过程中引入了某种限制条件,这种限制条件代表一种启发信息,因而有较高的效率.对于文中的问题,可能得到空子句的子句集中必定包含由事实公式所得的子句.可以将事实公式看成目标公式的否定而采用支持集策略进行归结,以便得到备选矛盾规则集.具体由过程2实现.过程2的停机条件是归结过程无法得到与初始子句集和归结过程中已经得到的子句不同的子句.

过程2:支持集策略归结.

对于文中的例子,对所有事实公式测试之后,可得到下述备选矛盾集:{七一Z,Z—mm一],lA]D,七一,,,一^,h一

咒),(惫_’Z,l一研,优一]咒A]o,忌_’厂',斗h,h一竹,行一0},{歹一点,量÷Z,Z啼in,m斗]咒^]D,忌斗厂,,一h,h一行),{j—k,量一Z,Z—m,优一]竹^1o,惫一,',一h,h一,l,雄一0},{g—i,,一h,h一1i},{e一,^g,g—i,,一^,h一

i},{口一c,c一1

d,n

Ab—d}.

(2)极小矛盾集的产生.可以接着从上述备选矛盾集中产生≥:中所有的极小矛盾集.首先将所有备选矛盾集按其基数

由小到大排序.从首个集合开始,逐一比较该集合与其后的集合,如果该集合是后面某集合的子集,就删除后面的这个集合.再从第2个集合开始重复该操作,直到末尾集合.最后余下的集合都是极小矛盾集.具体由过程3实现.

过程3:从备选矛盾集产生芝:中所有的极小矛盾集.

输入:F-Queue(备选矛盾集rI)

输出:F-Queue(∑中所有极小矛盾集rn)

方法:将所有备选矛盾集ri按Iril由小到大排序;j=1;

while(finished=false)

return

{if(rj是队尾)thenfinished=true

else{逐一比较rj与它后面的所有元素rk

if(rJ∈Fk)删除rk;j++;}}

r-Queue

下面给出的算法1将通过调用上述过程对初始关联规则集∑进行处理,产生∑中所有的极小矛盾集.算法1:产生∑中所有的极小矛盾集.输入:∑(初始关联规则集)输出:r(∑中所有的极小矛盾集)方法:p_--∑中所有前,后件构成的集合;置空队列一;

forP中的每个元素X

{call过程2;

过程2的输出加入队列一;})if队列r’非空then{call过程3,

retum过程3的输出r;}

else

return

{call过程1(∑U{X});if过程1的输出非空

NULL;

对于文中的例子,得出≥:中的极小矛盾集包括:{五一z,z—m,m一]咒^]D,忌一,,,一.Il,h—n),{g—i,,一h,

h一1i},{a—c,c一1d,口Ab—d).

2.3修正关联规则集≥:

为得到一致的关联规则集合,最简单的方法就是在每个极小矛盾集中删除1条规则.为了尽可能少地修改初始规则集,

对≥:中所有的极小矛盾集进行预处理,目的是删除最小数目的规则实现在每个极小矛盾集中至少删除1条规则.

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试数据挖掘中关联规则集的优化(2)在线全文阅读。

数据挖掘中关联规则集的优化(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/gongwuyuan/1249330.html(转载请注明文章来源)

相关推荐:

Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: