r语言逻辑回归移动通信客户流失规律分析附代码数据

上传人:jin****ng 文档编号:110350978 上传时间:2022-06-18 格式:DOC 页数:11 大小:550KB
收藏 版权申诉 举报 下载
r语言逻辑回归移动通信客户流失规律分析附代码数据_第1页
第1页 / 共11页
r语言逻辑回归移动通信客户流失规律分析附代码数据_第2页
第2页 / 共11页
r语言逻辑回归移动通信客户流失规律分析附代码数据_第3页
第3页 / 共11页
资源描述:

《r语言逻辑回归移动通信客户流失规律分析附代码数据》由会员分享,可在线阅读,更多相关《r语言逻辑回归移动通信客户流失规律分析附代码数据(11页珍藏版)》请在装配图网上搜索。

1、移动通信客户流失规律分析1. 研究问题 通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失 预警系统,为客户关系管理服务。2. 数据来源某年度随机抽取的 1000 个移动通信客户。因变量是他们来年的流失行为(0 = 未流失, 1= 流失)。为了能够预测客户的未来行为,我们采集了下面这些来自当 年的指标:客户等级(区分 VIP 客户等级):1,2,3,4;主叫次数(%):7 日内日 均 主叫次数/90 日内日均主叫次数;被叫次数(%):7 日内日均被叫次数 /90 日 内 日均通话时长;费用(% ):7 日内日均通话费用 /90 日内日均通话费用。该数 据 存放在 csv 文件

2、mobile.csv 中。移动通信行业的现有企业中,一般情况下客户月流失率在 3%左右,如果静态 计算,则所有客户会在 2 3年内全部流失。在降低客户流失率方面,哪怕仅仅降 低 1 就意味着你至少可以有百万元的收入增长!客户是一个公司最宝贵的财富, 因此保持客户并增长客户就是头等重要的事情,同是又是很困难的一项任务。在 2011 年底,中国的人口已达 1347350000 ,同时手机量达到 1006923000 ,也 就是说中国的手机普及率差不多达到了 75%,现有的用户数几乎已经接近人口总数。 在一个如此成熟和饱和的市场中,开拓新用户的难度可想而知。根据美国市场营销 学会顾客满意手册的统计数

3、据表明,吸引一个新顾客所耗费的成本大概相当于保持 一个现有客户的5 倍,而且从传统意义上来讲,移动通信行业保留旧客户利润率为 开发一位新客户之 16 倍,尤其对于剩余客户市场日渐稀疏的移动通信市场来说,减 少客户流失就意味着用更少的成本减少利润的流失,这点已经为运营商所广为接 受。由此可见客户保持的重要性,也就是说保留旧客户比开发、吸收新客户更重要。 在成熟期的产品市场中,要开拓新客户很不容易。客户的忠诚度应该是一个企业能 够生存发展的最大资产之一,拥有忠诚度的客户,会因客户有学习的效果,而使企 业可以花费较少的成本来服务客户,降低了公司在服务成本上的支出,而且忠诚的 客户也会宣传正面的口碑效

4、应以作为他人的参考,进而替企业创造新的交易。因此本文试图通过逻辑回归模型来对某移动通信公司客户的流失数据分析,了 解客户流失规律,建立流失预警系统,为客户关系管理服务。3.读取数据,并且查看数据概况- 2 2 3 辜次况时次次时2/:!丨门冃丨-I话 ZT.云. =:-如通寒亠亠故通雯渝 j5 ? 5 , $ 5 $ $ ? 5i i I.I.u.rr.I 1.1l.l:;:-_ . j i :-.A.: :匸: 1 : :.j . l 7L. 11:.-.1(: 1.:-d .I. i-1.1-44 1 . -i 和.IT.LLil 1 . L J J L.门 i .L JI L .1 .

5、j cJ .l.i.:.1 .匚亍 1.1:; J. E: 1 . : -;: . Mm 丁)1 . d : 11 . JJ _.一:.I l. l 匚卜.1 . : . ;) . : I .3.945 1.315i (: i (: 0 :) i :) i :).4绘制变量之间的散点图attach(data)从上面的图中,我们可以看到各个变量之间的相关关系,其中主叫次数和被叫次数呈正相关关系,通话时长和费用也成正相关关系。然后绘制各个自变量和因变量(流失)的关系散点图,可以看到他们之间关系 不是十分明显,从次数和流失的散点图来看,可能有正相关的关系,因此进行逻辑 回归模型的分析。5. 建立逻辑

6、回归模型Ievels(data$ 流失)10II1split - sample(1:nrow(data),nrow(data)*(2/3)训练集data_train - datasplit, 测试集data_test |z|)(In tercept)2.31780.31377.389 1.47e-13 *客户等级-0.43110.1613-2.6720.00753 *主叫次数-0.65790.2393-2.7490.00597 *被叫次数-2.49360.3065-8.1364.07e-16 *通话时长0.15020.35420.4240.67159费用0.25790.18931.3620.1

7、7312Signif. codes:0 *0.001 * 0.01 * 0.05 . 0.1 Coefficients:1(Dispersion parameter for binomial family taken to be 1)Null deviance: 895.30 on 665 degrees of freedom Residual deviance: 672.74 on 660 degrees of freedom AIC: 684.74Number of Fisher Scoring iterations: 57. 优势比解释则客户等级每增加1个单位,客户流失的估计值变为exp

8、(-0.4311)= 因此,客户等级越高,客户流失越低则主叫次数 每增加1个单位,客户流失的估计值变为exp( -0.6579) 79,因此,主叫次数越高,客户流失越低则被叫次数 每增加1个单位,客户流失的估计值变为exp(-2.4936)= 3,因此,被叫次数 越高,客户流失越低8.Logistics 回归拟合的解释从输出结果可以看出 ,回归方程为流失=2.7885 -0.5801 客户等级-0.6756 主叫次数 -2.6843 被叫次数-0.5125 通话时长+0.7565 费用,变量和的统计量的估计 值分别为-0.5801,-0.6756, -2.6843, -0.5125 和 0.7

9、565,除了通话时长以外由对 应的值都比显著性水平0.05小,可得4个偏回归系p数在显著性水平0.05下均显 著不为零。因此,可以认为客户等级、主叫次数、被叫次数和费用对客户流失具有 显著的影响。进一步地剩余方差的估计值, deviance 统计量的估计值为898.52 ,说 明,回归方程效果较好。9效应的置信区间置信区间是给定自变量值后,由回归方程得到的的流失预测值(实0y际上是 的平均值)的置信区间;预测区间是实际值的置信区间,在这里称为预测区间。0y 0y预测区间要比置信区间稍大,命令与显示结果如下25中 97. 5 %(intercept) 2.27473363.6137797-1.0

10、0272393341573-1.3725962 -0.4055661-Z.5851576 -1.4647493 -1.666saaa -a.zzzz费用0. 38438671.281217410拟合优度与偏差混淆矩阵predictreal bad good0 177 221 34 101残差分析:残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验同时还可以找出离群点。命令语句为plot(lm.l),显示结果如下11. Logisti模型的残差:皮尔逊残差与标准化残差Predicted v-alues空 enp 亦(Drrglm(流失 )piflw(DuLle3p -plto一

11、pPredicted v-aluesglm(流失J一严航加庶distanceResiduals vs LeverageJQW0.00.10.20.3Lever-ageglm(流失)左上图是拟合值与残差的散点图,从图上可以发现,除去第3个离群点外,所 有点基本上是随机地分散在纵坐标值为-1 和+1 的两条平行线之间,这说明随机误差 项具有同方差性;左下图是拟合值与残差的标准差的散点图,其意义与上面类似; 右上图表明随机误差项是服从正态分布的,其原因是正态 Q-Q 图近似地可以看成一条直线;右下图的CooK距离图进一步证实第3个观测值是一个离群点,它对回归 方程的影响是比较大的,要根据具体问题,讨

12、论出现这一观测值的实际背景。12.联表的 Cochran-Mantel-Haenszel 检验 mantelhaen. test(table Cdatatrai砒客户等级,dataL_trai主叫次埶,dataL_train$涼尖)cochrmn-MiUTtEl-HaiEnsNEl testdata: tab!e(data_tra-in$户等级,data_t詁砒主叫次埶,data_trainS;:)Cochran-Mante! -Haenszel M-2 = 1926. 2 , df = 1815 a p-val ue = 0. 0343BCMH 统计量=1926.2,df=1815,P-va

13、lue=0.034.由于p值小于0.05,因此可以认为不同的客户等级客户流失和主叫次数之间不是相互独立的。13. 总结本文首先通过绘制客户流失与诸影响因素(客户等级 主叫次数 被叫次数 通话时长 费用)之间的散点图和计算它们之间的相关系数,可知客户流失与诸因 素之间存在比较明显的非线性关系,因此,为简化问题,通过R软件,建立了逻辑回 归模型.利用所得模型可对客户流失的因素进行探讨.研究表明,客户流失和货币供应量与人民币短期存款利率并不存在长期的稳定 关系.因此,这里只使用此模型对我国移动通信市场作出粗略的线性估计.我们猜测只 是由于影响客户流失的因素复杂,如通信公司的经营状况、客户心理等等,并

14、最终反映 在客户流失行为上来 ,表现在客户流失的高低.此外,移动通信市场是一个动态的过 程,客户作为通信产品的需求者与供应者,通过流失率来表达对价格水平的意见. 当 然,值得注意的是,客户流失并不是由上述因素来决定,还有其他的影响因素。通过回 归分析可以发现,客户流失与主叫次数、通话时长息息相关。由于移动通信市场是通信呼叫的场所。通信市场分析方法包括技术分析、基本 分析和演化分析,在此仅从技术分析角度来分析客户流失,比较片面的。更由于在 我国目前仍然以实体经济为主的经济模式之下,我国的移动通信市场仍处于青春时 期,虽然非常活跃,但同时受制于国家体制。随着经济的发展,未来的移动通信市 场前景将随着经济总量的提升而不断扩大其基本面,但同时必须关注全球经济、政 治的发展局势,把握国家宏观调控的尺度,不能单纯从相关影响因素的数据进行预 测。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!