设初始规则集∑的子集∑t,由定义4可知,规则集∑7是矛盾的,当且仅当∑7u{x}FYit∑7
则的前、后件可以写为i。Ai:Ai3.. (称为正事实公式)或7
i1
u{x}卜]y.规
A
7iz
A]i3.. (负事实公式).本文讨论的规则和事实公式
7
都可以转换为特定形态的子句集.正关联规则对应的子句集中的子句包含1个正文字和1个或多个负文字,如7i。V
V
7
i2
i3V…V
7ik
Vi蚪1.负关联规则对应的子句集中的子句包含2个或2个以上的负文字,如1ilV
7
i2
V]i3V…
V1讧,.正事实公式对应的子句集中的子句只包含1个正文字,如is.负事实公式对应的子句集中的子句只包含1个负文
字,如7
it.可以借助归结原理判定∑7u{x)卜y且∑7
u{x}卜]y.
为方便说明问题,文中后面讨论的算法均采用下述示例作为辅助说明.例中给出了15条关联规则,并相应地给出了它
们的兴趣度,其中包括3条负关联规则.设关联规则集∑包含15条规则如表1所示.
表1
关联规则集∑包含的15条规则
兴趣度
0.60.50.60.70.60.60.6
关联规则
口A6一d
关联规则|Il一,z咒 0
兴趣度
0.50.6
Ⅱ’c口一ic41de—f氏gf—hg—i^一1
i
j一五0.7点一f奄一fZ—m研+7砚A]0
0.60.50.60.6
0.6
2.2找出关联规则集∑中的所有极小矛盾集
采用一般归结过程进行归结时,会产生许多无用的和重复的子句,浪费时间和空间.由此,必须考虑压缩初始子句集以
及选择1种合适的归结策略,尽量避免无用的子旬出现.对于文中的问题,∑U{x}中可能存在多个矛盾规则集合,所以归
吉首大学学报(自然科学版)
结过程的停机条件不是出现空子句,必须重新确定程序的终止条件.
第31卷
对于每个事实公式x,首先将∑U{x}中的所有公式转化为子句形式,然后对其进行归结.文中采用纯文字删除
法[”6]对整个子句集进行处理可以非常有效地缩小归结空间,提高效率.
过程1:删除包含纯文字的子旬.
考察文中的例子,假设对∑u
U)进行处理.删除处理前包含17个子句:{J,1JV惫,-3志v
z,]zvm,]mV]行,1,,l
V]o,1五Vf,]fVh,]hV忍,]珂Vo,]hV]f,]eVf,]eVg,]gVi,]口V
c,]c
V]d,]aV]6Vd}.
删除处理后只包含10个子句:{j,]JV正,1可以看出,对子句集的压缩幅度是很大的.
k
Vz,1zVm,]mV]n,]mV]D,]惫Vf,]fV^,]hV起,1行VD}.
(1)子句集的归结.支持集策略[卜6]是Wos等提出的一种归结策略,它在一般归结过程中引入了某种限制条件,这种限制条件代表一种启发信息,因而有较高的效率.对于文中的问题,可能得到空子句的子句集中必定包含由事实公式所得的子句.可以将事实公式看成目标公式的否定而采用支持集策略进行归结,以便得到备选矛盾规则集.具体由过程2实现.过程2的停机条件是归结过程无法得到与初始子句集和归结过程中已经得到的子句不同的子句.
过程2:支持集策略归结.
对于文中的例子,对所有事实公式测试之后,可得到下述备选矛盾集:{七一Z,Z—mm一],lA]D,七一,,,一^,h一
咒),(惫_’Z,l一研,优一]咒A]o,忌_’厂',斗h,h一竹,行一0},{歹一点,量÷Z,Z啼in,m斗]咒^]D,忌斗厂,,一h,h一行),{j—k,量一Z,Z—m,优一]竹^1o,惫一,',一h,h一,l,雄一0},{g—i,,一h,h一1i},{e一,^g,g—i,,一^,h一
1
i},{口一c,c一1
d,n
Ab—d}.
(2)极小矛盾集的产生.可以接着从上述备选矛盾集中产生≥:中所有的极小矛盾集.首先将所有备选矛盾集按其基数
由小到大排序.从首个集合开始,逐一比较该集合与其后的集合,如果该集合是后面某集合的子集,就删除后面的这个集合.再从第2个集合开始重复该操作,直到末尾集合.最后余下的集合都是极小矛盾集.具体由过程3实现.
过程3:从备选矛盾集产生芝:中所有的极小矛盾集.
输入:F-Queue(备选矛盾集rI)
输出:F-Queue(∑中所有极小矛盾集rn)
方法:将所有备选矛盾集ri按Iril由小到大排序;j=1;
while(finished=false)
return
{if(rj是队尾)thenfinished=true
else{逐一比较rj与它后面的所有元素rk
if(rJ∈Fk)删除rk;j++;}}
r-Queue
I
下面给出的算法1将通过调用上述过程对初始关联规则集∑进行处理,产生∑中所有的极小矛盾集.算法1:产生∑中所有的极小矛盾集.输入:∑(初始关联规则集)输出:r(∑中所有的极小矛盾集)方法:p_--∑中所有前,后件构成的集合;置空队列一;
forP中的每个元素X
{call过程2;
过程2的输出加入队列一;})if队列r’非空then{call过程3,
retum过程3的输出r;}
else
return
{call过程1(∑U{X});if过程1的输出非空
NULL;
对于文中的例子,得出≥:中的极小矛盾集包括:{五一z,z—m,m一]咒^]D,忌一,,,一.Il,h—n),{g—i,,一h,
h一1i},{a—c,c一1d,口Ab—d).
2.3修正关联规则集≥:
为得到一致的关联规则集合,最简单的方法就是在每个极小矛盾集中删除1条规则.为了尽可能少地修改初始规则集,
对≥:中所有的极小矛盾集进行预处理,目的是删除最小数目的规则实现在每个极小矛盾集中至少删除1条规则.
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试数据挖掘中关联规则集的优化(2)在线全文阅读。
相关推荐: