移动决策 数据挖掘 决策树
技术/
应用Technology/Application
结果进行反复评估、调整树结构、训练学习,最终
维系挽留
挽留任务管理
营销策略制定
选择出最佳的树结构和训练经验值。
(三)应用系统的实现
结果展现分析系统
1.什么是流失用户(churncustomer)
流失原因分析
离网倾向名单
用户属性KPI分析
流失可分为自发流失,强制流失和预期流失三种。自发流失是用户出于自愿的,决定把他们的业务挪到别的地方。强制流失,是公司(而不是
生
分类边界规则调整
决策树模型
产系统
属性简约处理
分类分析数据预处理
服务状态记录
离网用户定义
分类分析数据输入
数据接口
用户档案记录用户缴费记录用户消费记录
用户)终止该关系时发现———最常见的原因是欠费。当用户不再属于一个产品的目标市场时,预期流失就会发生,如用户工作地点更换搬迁至其它省份城市。只有区分清楚不同的流失用户,并由不同的部门针对不同的流失用户采用不同的维系措施,才能真正达到保持现存用户、提升用户的持久性并充分挖掘其盈收潜力。在此处我们的流失定义为自发流失和预期流失用户。
图1分析系统结构图
2.数据抽取与属性简约
根据流失用户的定义,从生产系统数据库中抽象出与用户流失相关的属性,从而建立模型。生产数据库中每位用户的信息主要包括用户基本信息,用户账务信息和客服信息,每种信息都是由一系列用户属性构成。为了使分类模型更具可调控性,能输出更具代表性的用户分类,必须用户的属性数量进行简约。由于属性之间存在着依存关系,造成一定的信息冗余重叠,若将用所有的属性来构造模型显然是很繁琐的,过于复杂的分析不但未能使分类准确率得到提高,同时会降低分类分析结果的可理解性,维数过多甚至会造成导致挖掘任务不可行,这显然不“维数灾难”是我们想得到的结果。我们需要通过属性简约算法,使用过滤、概化等方法剔除信息重叠的属性因子数据,最终锁定关键属性因子,作为模型的输入数据进行挖掘。因此,我们需要通过整理用户的自然属性(姓名,性别,年龄,职业等)和行为交往圈子属性(月均话费,短信数量,套餐选择、等),根据联通业务的实际情况,初步设定影响用户流失的数据属性可以分为用户资料数据、通话行为数据、通话消费数据三大类32个指标。
中进行相关分析建立预测模型,结果展现系统分为三个部分———根据已有数据进行模型的测试得出流失原因分析并生成流失用户KPI指标生成以及利用预测模型进行离网倾向用户名单的生成,用户根据提供的结果进行决策支持,制定出挽留策略及实施挽留任务管理。
(二)项目实施流程
项目实施流程如图2所示,首先从商业逻辑理解着手,定义用户离网流失的标准,从生产数据库中进行数据确定,作为模型预测输出的参照标准;数据准备包括用户属性KPI的抽取和分类预处理(属性简约);在模型建立的前期阶段,采用了主成分分析、多元方差分析、因子分析等统计方法进行数据特征的归纳和探索。以生产系统的历史数据为依据,归纳出已发生离网认定的用户行为共同点,为模型内部各个决策边界的建立提供依据。模型建立是反复的过程,对每次分类
商业理解数据理解
3.利用决策树建立模型
发布
数据
练
次训
学习
数据准备
决策树工作的过程是:用一个带有流失类标记的训练数据集来构造决策树,然后可以用一个另外的测试数据集来检验生成的决策树的正确性,如果分类错误概率在可以接受的范围内,就可以利用该规则对流失用户进行分类预测。决策树算法的核心问题是选取在树的每个决策边界要测试的属性,争取产生最大信息增益的属性因子,最终能够选择出最有助于分类实例的属性。
建立模型
多
模型评估图2
项目实施流程图
中国新通信
80
CHINANEWTELECOMMUNICATIONS
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库基于决策树的数据挖掘技术在电信用户流失预测的应用与研究(2)在线全文阅读。
相关推荐: