文献标识码: A
DOI:10.16157/j.issn.0258-7998.183235
中文引用格式: 石元博,张鑫明,黄越洋. 移动用户维系挽留系统中K-means算法应用[J].电子技术应用,2019,45(2):5-8.
英文引用格式: Shi Yuanbo,Zhang Xinming,Huang Yueyang. Application of K-means algorithm in mobile user retention system[J]. Application of Electronic Technique,2019,45(2):5-8.
0 引言
伴随移动运营商4G技术逐渐的应用成熟,运营商相互之间的竞争压力日趋白热化,存量用户的争夺逐渐成为运营商提规模、增效益的竞争核心[1]。为了能将原有客户顺利转化为新用户,并根据客户的特征和行为对客户的保持程度进行预测,制定有效的客户挽留和赢回策略并实现盈利是每一个运营商亟需解决的问题。
近年来,数据已经渗透到每一个行业和业务职能领域,逐渐成为生产经营的重要因素,数据挖掘、数据分析迅速成为各大行业的热门词汇。数据挖掘引发的用户需求的极大满足,使得传统运营商发展模式面临巨大挑战和危机[2]。
通过对用户行为精准分析,搭建数据挖掘营销模型对用户进行聚类,实现网络、终端、业务统一适配[3],有助于完善落实用户全生命周期维系管理体系,加强用户消费监控,协助用户解决套餐消费不匹配问题,提升用户对业务依赖性,提升用户忠诚度和稳定度,提高用户对移动服务的期望、提升用户感知增强用户黏性。
1 维系挽留系统模型建立
1.1 系统应用对象分析
用户细分是对于用户维系挽留的数据进行分析的一个必要手段,有利于后期数据矩阵的建立,用户细分步骤如图1所示。
在移动用户营销中,用户价值和用户的稳定程度是判断该用户维系的关键指标,因此在做用户分类时以这两个指标为用户细分属性,按照资源保障优先级由高到低的程度将用户分为:黄金客户、高位客户、波动客户、低端客户、潜力客户和跳骚客户6类。通过聚类方法对移动用户进行聚类,明确分群用户及用户资源配置原则,将有限的资源优先投放给最有价值的用户,得出聚类后的用户类别如表1所示。
随着通信市场严重饱和,用户流失较为严重,其主要原因表现在两个方面:(1)各个运营商之间竞争以价格属性特征竞争激烈;(2)用户对业务模块满意程度不高。
1.2 数据准备
用户在使用移动通信业务时,如在网上营业厅上进行费用详单查询、话费查询、业务充值等,这些行为都会以半结构化的数据方式记录在中央服务器的Web日志和交易记录中,通过数据提取和预处理后建立数据仓库,为用户数据的分析和维系挽留系统的数据挖掘提供基础数据。用户数据分析主要采集的用户数据信息包括:存量用户的基本信息和用户的交易记录。数据属性包括:(1)存量用户基本信息,即用户手机号、用户姓名、用户状态、用户入网时间、近3个月出账收入等属性信息;(2)用户交易信息,即产品ID、用户通信号码、业务类型、预存交易金额、浏览次数等属性信息。
当用户数据属性确定之后,按照属性建立用户数据矩阵,矩阵以价值作为主轴,结合稳定度,构建交叉矩阵,并以客户编码标识,结合用户规模、收入规模占比分析,对交叉矩阵用户进行合并,通过重要-紧急的矩阵管理,判定资源保障优先级。其中,存量用户交叉矩阵如图2所示。
矩阵数据形式如下:
(1)存量用户属性矩阵Vm×n
存量用户信息矩阵主要包括用户的自然属性,代表了用户的一般性质,其具体的表现形式为:
其中,vi代表为一个可维系用户,总共有m个可维系用户;vij为可维系用户i的第j个属性,共有n个属性。
(2)用户兴趣信息矩阵Pm×k
在用户B2C模式下,用户通过Web进行交易,交易及浏览的次数不同,代表了用户的兴趣度,分别为兴趣度进行加权赋值,将兴趣度分为三类:一般、有兴趣、非常有兴趣。通过用户的兴趣等级进行用户兴趣信息矩阵的建立。
其中,dij是第i个可维系用户对第j次交易的感兴趣等级程度,值为一般、有兴趣、非常有兴趣。通过以上的矩阵的构建可以将每一个用户的情况唯一地表示成一个向量,可以通过向量的计算来分析用户的性质。
1.3 基于B2C环境下的模型的建立
用户行为分析是指企业通过对用户的存量自然属性、用户兴趣行为轨迹所表现的特征进行分析,来了解用户的消费偏好,分析用户流失的原因,判定用户获取渠道,管理用户的满意度及预测用户的忠诚度,并制定用户维系挽留计划[4-5]。
根据以上的定义,可以构建一个基于B2C模式下的用户行为分析框架,如图3所示,完整的用户行为分析过程如下:
(1)用户和电子商务平台的交互过程;
(2)数据收集、整理过程;
(3)知识获取过程;
(4)数据挖掘过程;
(5)决策优化过程;
(6)维系挽留系统。
建立一个可以可靠预测用户行为的维系挽留模型,首先需要数据源并进行预处理分析,然后经过参数确定后进行预测识别,在识别的过程中进行聚类分析和数据挖掘,将预测结果建立决策树,最终给出维系挽留的预测结果[6]。
2 数据挖掘算法在系统中的应用
2.1 数据分析
在维系挽留中,数据挖掘的应用主要表现在以下几个方面:
(1)获得新用户
通过数据挖掘可以针对不同用户的兴趣程度、消费习惯、消费倾向和消费需求等用户购买属性来对新用户进行促销。
(2)维系挽留住老用户
数据挖掘技术中的分类算法则可以将所有的用户分为不同的种类,可以完全做到为不同的用户提供完全不同的产品服务来提高用户的满意度。
(3)对老用户进行交叉销售
对老用户进行交叉销售,预测用户的下一个购买行为。
数据分类工作的目的就是学习训练出分类模型,利用该模型可以将数据库中的数据项目映射到预先设定好的某个类别中,具体来说:给定一个数据库D={t1,t2,…,tn}和一组类C={C1,C2,…,Cm},分类问题是去确定一个映射f:D→C,每个元组ti被分配到一个类中,一个类Cj包含映射到该类的所有元组,即Cj={ti|f(ti)=Cj,1≤i≤n,ti∈D}。
2.2 K-means在维系挽留系统中的应用
K-means算法是一种得到广泛应用的聚类算法,该算法也称为k-均值算法[7]。k-均值算法以k为参数,将n个对象分为k个簇,每个簇满足低耦合高内聚的特性,即使得簇内部的属性元素具有较高的相似度,而簇与簇之间元素的相似度较低[8]。
2.3 数据准备
在维系挽留系统中,本文需要对用户的消费习惯和行为等特征进行分析,进行聚类。本文利用运营商在某一阶段的用户数据对其进行学习,给出聚类数据样本,如表2所示,为后续的数据细化分类工作的推进提供参考依据。
然后,从数据库中选取数据样本,如表3所示。
按照K-means算法对上面数据表中所给出的企业用户进行聚类分析。在此实例中主要对用户的收入、ARPU、是否合约捆绑、是否渗透和有效语音交往圈总人数进行分析,根据它们之间所存在的潜在关系得到相应不同的类,并且从结果当中得到相应的聚类规则。本文希望从分析的结果中能够得到以下一些用户的属性类别:其他属性和收入大体相关;合约捆绑和是否渗透基本一致等显著特征的类别。这些属性类别可以使企业的决策者们能够根据数据的分类进行相应营销策略的制定和实施。
2.4 K-means聚类算法实现
本文采用C#语言对K-means算法进行实现,将表3所选取的50名消费用户作为数据输入建立用户样本数组,数组元素个数n=50;将所有数据划分为5类,即簇数数组个数k=5;按照欧式距离公式将用户划分为最近的均值聚类中。然后进行递归,直到运算完成。算法流程图如图4所示。
程序运行开始后,首先调用子程序LoadPatterns(char*fname)进行装载数据,同时将数据转换成Pattern[i][j]数组;接着调用子程序InitClusters()进行簇中心的初始化过程,将选取数据样本中的前k个样本作为初始的聚类中心;然后程序将进入主控程序RunKMeans(),它将比较每个对象和各个簇中心的距离,将数据对象分配到与簇中心距离最短的簇中;然后再根据对象的分配重新计算簇的中心,如果簇中心不再发生变化,即ConFlag=True,则聚类已完成,否则继续递归运算;最后运行子程序ShowCenters()和ShowCluster(),输出聚类中心和每个簇成员的数目,程序结束。
3 数据测试及分析
通过对算法的实现发现将数据样本输入得出结果基本与分析一致,加大样本数量对用户进行分析,还可得出用户消费能力和消费意愿,结果分布如图5所示。
由图5可见,用户消费能力呈现平均分布情况,高端客户平均分布在49元~73元之间,低端客户用户数分布最多的区间位于10元~12元之间。消费意愿普遍高于用户消费能力,说明用户具备极大的消费潜力。特别是高端用户消费能力明显增强。
4 结论
本文首先建立用户维系挽留系统,并利用数据挖掘算法对用户特征进行挖掘聚类。另外,对算法进一步实现,最后,采用运营商实际产生数据对算法进行验证,表明分类结果真实可靠。
参考文献
[1] 郭光亮.江苏联通客户维系与挽留策略研究[D].上海:华东理工大学,2011.
[2] 沈伟,高尚,梅锋.建立基于生命周期的维系挽留系统[J].通信企业管理,2013(1):76-77.
[3] 刘晨,孙秀杰,李响.电信企业客户维系挽留应用数据挖掘探讨[J].商场现代化,2008(24):29.
[4] 叶晟,庞贵泳.基于BCS数据仓库的广西联通存量维系系统[J].广西通信技术,2014(3):34-40.
[5] 刘志超,王雷,谷垒,等.基于数据挖掘技术的客户流失预警模型[J].微计算机信息,2011,27(2):176-177.
[6] 文笃石.基于数据仓库的客户挽留系统[J].微型机与应用,2015,34(18):11-13.
[7] 张杰,卓灵,朱韵攸.一种K-means聚类算法的改进与应用[J].电子技术应用,2015,41(1):125-131.
[8] 黄海新,吴迪,文峰.决策森林研究综述[J].电子技术应用,2016,42(12):5-9.
作者信息:
石元博1,张鑫明1,黄越洋2
(1.辽宁石油化工大学 计算机与通信工程学院,辽宁 抚顺113001;
2.辽宁石油化工大学 信息与控制工程学院,辽宁 抚顺113001)