基于K-means聚类算法的客户价值分析研究(2)
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:
或QQ:
处理(尽可能给您提供完整文档),感谢您的支持与谅解。

步骤1:初始化聚类中心c
i,i=1,…,c。典型的做法是从所有数据点中任取c个点。
步骤2:用式(3)确定隶属矩阵U。
步骤3:根据式(1)计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,则算法停止。
步骤4:根据式(4)修正聚类中心。返回步骤2。
该算法本身是迭代的,且不能确保它收敛于最优解。K-means算法的性能依赖于聚类中心的初始位置。所以,为了使它可取,要么用一些前端方法求好的初始聚类中心;要么每次用不同的初始聚类中心,将该算法运行多次。此外,上述算法仅仅是一种具有代表性的方法;还可以先初始化一个任意的隶属矩阵,然后再执行迭代过程。
3 K-means聚类算法在客户价值分析中的应用
3.1 算法描述
本文所用的K-means算法,其聚类的数量k是在算法运行前确定的(这是很多聚类算法的典型情况),先从样本中随机捡取k个聚类中心,再根据欧氏距离把每个点分配到最接近其均值的聚类中,然后计算被分配到每个聚类的点的均值向量,并作为新的中心进行递归。具体的算法是这样的:假定数据点D={X1…….Xn},任务是找到k个聚类{C1……Ck}:
伪代码如下:
for k=1,…n,令R(k)为从D中随机选取的一个点;
while在聚类Ck中有变化发生 do
形成聚类;
for k=1,….,n do
Ck={X属于D|D(Rk,x)≤D(Rj,x) 对所有j=1…..k,j≠k};
end;
计算新的聚类中心;
for k=1,….,n do
Rk =Ck内点的均值向量;
end;
end;
3.2 测试数据及运行结果分析
K-means算法在本文中主要是对客户的现有价值和潜在价值进行聚类分析,从而对客户进行分类,最后根据行业的特定规律和方法分析聚类的结果,产生最终的分析报告。
该算法所使用的测试数据格式如表1所示。其中,sort为每组数据最终所归属的类别,id为每个客户的代码,sco1为客户的现有价值,sco2为客户的潜在价值。
表1 算法测试数据格式
字段
数据类型
字段大小
必填字段
默认值
说明
Sort
文本
20
是
客户类别
Id
数字
整型
是
递增,主键
Sco1
数字
整型
是
0
现有价值
Sco2
数字
整型
是
0
潜在价值
图1为利用K-means聚类算法分析出来的结果。其中,上面是客户分析界面,是对客户价值分析的图表显示,横坐标(x轴)为每个客户所属的类别,纵坐标y1(红色的竖条)为客户的ID,y2(绿色的竖条)为客户的现有价值,y3(蓝色的竖条)为客户的潜在价值;下面是客户价值分析的列表显示,除了包含图表显示的内容以外,还显示了客户的一些基本数据,可以清楚的了解到每一类中每一个客户的详细信息。
从图1可以看出,聚类的个数k值为3,希望把客户划分为三类,从下面对客户价值分析的结果可见:
第0类客户现有价值和潜在价值都相对很高,而且之间的悬殊很小,基本上趋于平衡;
第1类客户现有价值很高,但是客户的潜在价值偏低,而且客户的现有价值和客户的潜在之间的悬殊很大;
第2类客户现有价值和潜在价值都相对很低,之间的悬殊的差距介于第0类和第1类之间。
从一个企业的运营发展来看,第0类客户是最有价值的客户,这也就是创造那80%利润的20%的客户;第1类客户目前的情况下对整个企业的盈利来说还是贡献很大的,但是从这部分客户的潜在价值来看,是最容易流失的一部分客户;第2类客户可能是任何企业的客户中绝大部分的一批客户,这批客户的流动性是最大的,也是最不稳定的一批客户,他们可能是暂时的对企业的产品感兴趣,但是可能又马上转向了另一家企业的产品。
图1 利用K-means聚类算法分析客户价值结果图
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说计算机基于K-means聚类算法的客户价值分析研究(2)在线全文阅读。
基于K-means聚类算法的客户价值分析研究(2).doc
将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
下载失败或者文档不完整,请联系客服人员解决!