77范文网 - 专业文章范例文档资料分享平台

几种多元统计分析方法及其在生活中的应用[1](2)

来源:网络收集 时间:2018-12-06 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

方法 a、: a,,. P 7 空间性质

最短距离法 0. 5 0.5 0 -0.5 HI缩

最长距离法 0.5 0.5 0 0.5 扩张

类间平均距离法 nJriB ?/./\0 0 保持

重心法 〇/;/?? - n,:/1,, / nl 0 保持

中间距离法 0.5 0.5 -0.25 0 ^

2. 2. 2基于等价关系的聚类方法

由离散数学中关于关系的描述我们知道,定义在集合Z = ^[;c,,x,,上的关

系如果具有自反性、对称性和传递性则被称为等价关系.设义是一给定集合,

尤?,是它的子集,如果满足[9】:

X! nXj 二 (j), V/,7 = 1,2,\,/ 半 j

X^yjX^Kj^--KjX^=X

则集合尸=, ,?,X《被称为集合的一个划分,而,被叫做这

个划分的块.若是集合上的等价关系,对于任意一个元素X, 可以构造一

个X 的子集,叫做X,对于的等价类,[x,],, = e X,Kx.RXj\\.

对于这种集合,它具有下列性质:

(1) x, e[x丄;

(2)如果 Xy e [x, \\,则必有[xy. = [x, L ;

(3)若 X广[x^ L,但?生 V. L,则必有 k ]r。L = .

由此可知,集合Z上的等价关系7?所构成的类,两两互不相交,而且覆盖整

个集合JT .我们得到如下定理:集合X上的等价关系R所构成的类产生集合X的 10

个分量是反映同一特征A,而只有一个分量反映另一特征B,欧氏距离计算出來的

结果将绝大部分反应特征A,而弱化了特征B,而马氏距离去除了相关性后,据规

避了这个缺点。通过式(2.1)我们可以看出,当C为对角阵时,各特征分量相互

独立,同时,我们还发现,欧氏距离其实就是协方差矩阵C等于单位矩阵I时的

一个特例。可以看出,在这种条件下模式样本集的概率分布不仅各分量之间不相

关,而且其密度函数的等高线为圆(或者超球面),即各分量方向上的密度分布是

均匀的

需要指出的是,计算协方差矩阵是计算马氏距离的关键所在,但是我们只有

在模式集给定的情况下,才能计算出协方差矩阵,遗憾的是这个条件很难实现。

角度相似性函数定义为

‘士^^ (2-2)

是模式向量;C与X之间的夹角余弦,也就是X的单位向量II与X的单位向量 * ‘ ‘ /IW ‘

II之间的点积.夹角余弦的测度反映了几何上相似形的特征,它对于坐标系的 /KII

旋转及缩放时不变的,但对位移和一般的线性变换则并不具有不变性的性质.

Tanimoto测度是将夹角余弦度量进行细小的修改后得到的,主要用于具有{0,

1} 二值特性的情况[”。其具体定义为

共有的特征数目 , xlx, = ;Cf或;Cj.中占有的特征数目之总数 一

不过,相似性测度函数的共同点都涉及到把两个相比较的向量X和X的分量 k j

值组合起来,但怎样组合并无普遍有效的方法,对于具体的模式分类,需视情况

作适当的选择[8]。

在谱系聚类算法中,每次迭代中形成的聚类之间以及它们与各个样本之间的

距离,有多种不同的准则函数[7]。

1.最短距离法[9]

假设A和B是两个聚类,则两类间的最短距离定义为

j | a e A,b e b] (2—4)

式中,(力表示A类中的样本X。和B类中的样本之间的距离.表示A类中所

有样本与B类中所有样本之间的最小距离. 8 第2章聚类分析及其应用实例

£(? -^j)

?=I 广' n. (2-14)

Jpr 叫 pr 又 J\

这里,七=—XX.i,■^J ~ ~ X ^A . S k=\\ S

4.指数相似系数 5

r\—文e' si (2-15) S k^\\

这里,是第A个特征的方差,

=-^(? ‘ k = \\’2,?,S (2-16) “M

5.最大最小法

^min(x?,x^J r, (2-17)

Jmax(x?,x^J /c=l

6.算术平均最小法

Emm(x?,x^J

r? = ^ (2—18)

Z k = \\

7.算术平均最小法

Emin(x?,x^J

r,丨- (2-19)

舍t(?+?) L 人--1

8.几何平均最小法

Emin(x,,,x^J

r, = ^ (2-20 ) y s ^^ k=\\

9.绝对值指数法 12 笫2苹聚类分析及K:应用实例

一个划分,此划分叫做Z关于的商集,记做例如,同余关系i?‘对整数集/

产生的商集就是模C的剩余类[9]:

///?,={[0],,.,[lL,..,[c-4.}

由上述讨论可知,在给定集合Z上定义一个等价关系,就决定集合;r的一种

划分.显然,这样的划分是硬分割,我们可以把这一概念推广到模糊关系上来[9]。

由于模糊等价关系及是论域与自己笛卡尔乘积jxl上的一个模糊集合,

而模糊集合的任何a(0 S a S 1)截集及?都是X X X上的一个普通集合,即为X上的

普通等价关系,也就得到了关于X中对象元素的一种分类.当〇由1下降为0时,

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库几种多元统计分析方法及其在生活中的应用[1](2)在线全文阅读。

几种多元统计分析方法及其在生活中的应用[1](2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/348496.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: