类似算法:对某个对象而言,从对象集合中找出与其相类似的对象的算法.
以下列出各算法的方程式,并对各个符号一一说明.
χi=(χi1,χi2,......,χip);
χj=(χj1,χj2,......,χjp);
(χmax,χmin是χ的最大值和最小值)
cmn: if (χmn= = 0) then {cmn= 0 ;} else {cmn= 1 ;}
以下的计算结果为d的时候,值越小表示二者越类似;计算结果为r的时候,值越靠近1表示二者越类似。
① 平均尤库里多距离的二乘法
② 平均距离法
③ 最大值距离法
④ 二值距离法
⑤ Dice Coefficient法
rij=2 x|Kij|∻(|Ki|+|Kj|)
⑥ Jaccards’s coefficient法
⑦ 皮尔森相关法
γij= Coυ(χi,χj) σiσj
⑧ 限定皮尔森相关法
γij= Coυ(χi,χj) σiσj
⑨ 斯皮尔曼相关法
⑩ 改良二值距离法
MapI (χmn) = cmn
MapU (χmn) : {
if (χmn= = 0) {
MapU (χmn) = 0;
} else
if (χmn in topN ) { //如果为重要属性
MapU (χmn) =BIG; //BIG是大于”1”的定数。
}else{
MapU (χmn) = SMALL; //SMALL是小于”1”的定数。
}
}
dij=1∻rij
ii :群(Clustering)算法
即将相类似的对象归为同一个群的算法.
以下涉及的7种群算法都将分两步实现.
第一步:对各个基本要素,使用10种距离计算值之一求出二者之间的距离.距离最近的两个
基本要素成为一个新要素.基本要素被称为叶,新要素则被称为分支.
第二步:实行递归处理.利用以下的方程式计算出与新要素间的距离,进而生成新要素。
下面用到2个基本方程式,方程式和系数的不同组合形成7种不同形式。
dxc=αadxa+αbdxb+βdab+γ|dxa –dxb (1)
dxc2=αadxa2+αbdxb2+βdab2+γ|dxa2 –dxb2 (2)
方程式表示从a和b出发,生成新要素x,并求出与要素c的距离。
① 群平均法
利用方程式(2)。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说申报材料高新技术企业项目可行性分析报告(7)在线全文阅读。