电信.docx
- 文档编号:11373409
- 上传时间:2023-02-28
- 格式:DOCX
- 页数:20
- 大小:173.70KB
电信.docx
《电信.docx》由会员分享,可在线阅读,更多相关《电信.docx(20页珍藏版)》请在冰豆网上搜索。
电信
关于电信业市场信息分析问题
摘要
本文主要讨论了电信业市场信息分析问题,根据附件中给出的5000个客户资料,得出有价值的意见并提出完整的分析和操作报告。
首先,我们对附录中的客户资料数据进行预处理,利用EXCEL软件,得出5000个用户的各项服务总体情况,本地时长均值:
1970.06,长途时长均值:
113.20,短信次数均值:
57.48。
然后,采用快速聚类法中的K-均值法对总体进行聚类,分类结果为:
总共4类,A类65人,B类1654人,C类635人,D类2645人。
迭代次数为10次。
各类客户群具体情况见附录。
接着,对得出的分类客户群进行讨论。
依据各类的总体消费均值及各项分布图,得出对企业有意义的意见:
A类为保持客户,运营商应继续加强对该类客户的服务;D类为有发掘潜力的客户,运营商应提供一些套餐服务来吸引该类客户消费;B、C类差异相对不大。
在各类客户群下,再依据年龄、本地、长途等的不同设置相应的服务对策,以此来提高企业的收入及利润。
最后,我们对整个模型提出了评价及推广,使之适用范围更广。
关键词:
电信业客户资料聚类分析K-均值法消费度
一、
问题重述
1.1问题背景
近年来随着中国电信业的改革和重组,电信业市场环境发生了根本性的变化,中国电信服务市场逐步形成了从最初个别运营商垄断市场到数家大运营商主导、多家小运营商参与、新运营商不断加入的电信市场竞争新格局。
对于一个企业,客户是其生存和发展的根基,因此保持客户、吸引客户和充分发掘客户的盈收潜力是企业提高核心竞争力的关键。
如何通过提高客户的满意度及忠诚度,提升客户价值来扩大自身的收入及利润等问题,成为各电信运营商关注的焦点课题之一。
每个市场都存在着不同的消费人群,对于电信行业也是如此。
电信企业有着广大的客户群,这些客户千差万别。
对于不同的客户,他们的需求是千变万化的。
对于如此海量的客户数据应如何处理?
不同客户间的消费方式有什么区别?
对不同的客户群对应服务应有什么不同?
哪类客户群更应值得关注?
当运营商提供多种服务以吸引客户、谋求利润时,客户是否接受?
在多种服务之间,客户的接受程度是否存在某些尚未被人所觉的联系?
……
1.2需解决的问题
附录是经数据清理的某地小灵通5000个客户在3个月内的统计资料,在该资料中包含了这些用户的基本信息、通话时长、短信次数和所接受的增值服务。
现在,我们要解决的问题便是从这资料中得出一些对企业运作有实际指导意义的意见,向企业提出完整的分析和操作报告。
二、模型假设
1、假设附录中的5000个用户能够代表该地区的所有小灵通用户,且附录中数据都是真实、可信的;
2、假设该地的小灵通用户对各服务(本地通话、长途通话、短信等)的需求在短期内没有太大变化;
3、假设某项服务的消费度决定了该项服务的收益;
三、符号说明
符号名称
符号含义
第
个用户的年龄
第
个用户的性别,若是男性,
,否则
第
个用户三月内的本地通话时长
第
个用户三月内的长途通话时长
第
个用户三月内的短信次数
第
个用户三月内的有无彩铃,若有,
,否则
第
个用户三月内的有无来电显示,若有,
,否则
第
个用户三月内的有无灵群网,若有,
,否则
表示用户在第i项服务中的消费度
四、问题分析
要使电信企业扩大自身的收入及利润,关键在于客户。
因此,如何通过附录中给的客户资料发掘出有用的信息是解决这道题的要点。
如果某地的所有小灵通用户是一个总体,那么附录中的5000个小灵通用户便是该总体的一个样本,属于简单随机抽样,在该样本中,包含了用户的年龄、性别、本地通话时长、长途通话时长、短信次数、有无使用彩铃等随机变量。
分析处理附录中的统计资料后,我们能够得出这些用户年龄分布、性别比例、通话时长分布等,这些都是对所有用户的一个总体把握。
为了更好地分析不同用户的消费情况,需将用户进行分类。
我们考虑采用聚类分析的方法,对所有样本进行聚类。
得出用户各属于哪一类后,再对每一类用户的消费特点进行相应的具体分析,并对运营商提出分析和操作报告。
所有这些过程都离不开附录中的海量数据,要利用
来处理这些数据,必要时需要作出图表。
五、模型的建立与求解
运营商利用计划书和市场信息分析决定提供何种服务、对哪些服务宣传投资大些,而市场分析主要取决于需求和竞争力,本文主要是对需求进行分析,这些又都取决于用户的消费。
为了利用附录中的海量数据得到市场需求信息,我们首先对数据进行预处理,然后再建模求解。
5.1模型的准备
先将附录中彩铃、来电显示和灵群网三列中对应的“有”替换为“1”,“无”替换为“0”,以便于数据处理。
(1)年龄
利用EXCEL求出5000个用户的年龄平均值和方差:
利用EXCEL统计各年龄段的人数并作表格如下:
表一各年龄段统计表
年龄段
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
人数
12
676
2099
1407
551
178
72
5
然后作出柱状图如下:
图一年龄段柱状图
从柱状图中能够清楚地看出各年龄段的分布。
(2)性别
若是男性,
,否则
,则
利用EXCEL求出5000个用户的性别之和:
所以其中有3823个男性,占总数的比例为:
(3)本地通话时长
利用EXCEL求出5000个用户的本地通话时长平均值和方差:
利用EXCEL统计各本地通话时长段的人数并作表格如下:
表二本地通话时长统计表
通话时长
[0,
1000)
[1000,
2000)
[2000,
3000)
[3000,
4000)
[4000,
5000)
[5000,
6000)
[6000,
7000)
[7000,
8000)
人数
1729
1230
916
525
319
156
72
21
通话时长
[8000,
9000)
9000,
10000)
[10000,
11000)
[11000,
12000)
[12000,
13000)
[13000,
14000)
[14000,
15000)
[1600,
1500)
人数
15
9
3
2
1
1
0
1
然后作出柱状图如下:
图二本地通话时长柱状图
从柱状图中能够明显看出各通话时段人数随通话时间急剧减少(但在后面有点小波动)。
(4)长途通话时长
利用EXCEL求出5000个用户的长途通话时长平均值和方差:
利用EXCEL统计各长途通话时长段的人数并作表格如下:
表三长途通话时长统计表
通话时长
[0,
100)
[100,
200)
[200,
300)
[300,
400)
[400,
500)
[500,
600)
[600,
700)
[700,
800)
人数
3707
449
281
178
103
78
49
42
通话时长
[800,
900)
[900,
1000)
[1000,
1100)
[1100,
1200)
[1200,
1300)
[1300,
1400)
[1400,
1500)
[1500,
4000)
人数
26
14
15
8
10
7
4
29
然后作出柱状图如下:
图三长途通话时长柱状图
该柱状图与图二相同的是通话时段人数都是随通话时间减少(但在后面有点小波动),但该柱状图中人数在通话时长大于100之后,便很少了。
(5)短信次数
利用EXCEL求出5000个用户的短信次数的平均值和方差:
利用EXCEL统计各短信次数段的人数并作表格如下:
表四短信情况统计表
短信次数
[0,
100)
[100,
200)
[200,
300)
[300,
400)
[400,
500)
[500,
600)
人数
4352
287
118
73
42
33
短信次数
[600,
700)
[700,
800)
[800,
900)
[900,
1000)
[1000,
1100)
[1100,
3000)
人数
20
15
17
5
8
30
然后作出柱状图如下:
图四短信统计柱状图
从该柱状图中很容易得到用户使用短信次数大都分布在0~100之间,超过100便很少了,与图三很相似。
(6)彩铃
若有彩铃,Fi=1,否则Fi=0,则
所以其中有1386个用户有彩铃,占总数的比例为:
(7)来电显示
若有来电显示,Gi=1,否则Gi=0,则
所以其中有4803个用户有来电显示,占总数的比例为:
(8)灵群网
若有灵群网,
,否则
,则
所以其中有449个用户有灵群网,占总数的比例为:
以上的预处理只是对所有用户总体情况的一个把握。
5.2模型的建立与求解
从上面的模型准备中我们对所有用户的总体消费情况有了一个总体的印象。
为了更进一步分析问题,我们采用聚类分析方法,将所有用户进行分类,再对分类后的用户消费特点进行分析,提出完整分析和操作报告。
首先,我们采用K-均值法(快速聚类法)对总体进行分类。
K-means算法的工作原理:
算法首先随机从数据集中选取K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。
计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。
本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确。
若不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。
如果在一次迭代算法中,所有的样本被正确分类,则不会有调整,聚类中心也不会有任何变化,这标志着已经收敛,因此算法结束。
算法描述如下:
算法:
K-means。
划分的K-means算法基于类中对象的平均值。
输入:
类的数目K和包含N个对象的数据库。
方法:
①对于数据对象集,任意选取K个对象作为初始的类中心;
②根据类中对象的平均值,将每个对象重新赋给最相似的类;
③更新类的平均值,即计算每个类中对象的平均值;
④Repeat②③;
⑤直到不再发生变化。
依据上述原理,对总体进行分类,迭代10次,分类具体结果见附录。
然后,我们将分类出的4个用户群分别记为A类、B类、C类、D类,下面对其进行具体讨论。
A类:
分类出的用户数为65人。
该用户群的消费特点见下表:
表五A类用户消费情况表
用户资料
年龄
本地时长
长途时长
短信次数
彩铃
来电显示
灵群网
均值(或人数)
36.27
8357.72
236.94
211.64
31
61
15
对上表数据进行分析,定义用户第i项服务的值与所有用户的均值的比值为用户该项服务的消费度。
消费度越大,表示该用户在该项服务上对运营商提供的利润越大。
本地时长:
同样的方法可算出长途时长、短信次数的消费度分别为
。
可看出A类用户的各项消费度均较大,判断其为保持客户,运营商应继续加强对该类客户群的服务。
下面为A类客户不同年龄的消费情况表。
表五aA类客户不同年龄的消费情况表
年龄
市话(平均时长)
长途(平均时长)
短信(平均条数)
总人数
10~22
8550.667
57.8
415.6667
3
23~30
7969.462
654.7308
487.3846
13
31~50
8478.523
132.675
127.4773
44
51~60
8188.4
175.7
113
5
以下是该类用户的短信次数、本地时长、长途时长、年龄分布具体情况图。
图五a
图五b
图五c
图五d
从图五a和图五b中可以看出,个别用户的短信次数与本地时长消费度较大,其为保持客户中的关键客户,运营商应加强关注,留住此类用户。
而本地时长项方面,各用户区别不大。
表六B类用户消费情况表
用户资料
年龄
本地时长
长途时长
短信次数
彩铃
来电显示
灵群网
均值(或人数)
39.75
2570.37
142.08
66.54
534
1590
175
表七C类用户消费情况表
用户资料
年龄
本地时长
长途时长
短信次数
彩铃
来电显示
灵群网
均值(或人数)
39.09
4778.92
173.69
104.14
216
609
100
表八D类用户消费情况表
用户资料
年龄
本地时长
长途时长
短信次数
彩铃
来电显示
灵群网
均值(或人数)
39.96
764037
77.45
36.65
2566
2542
159
操作报告:
A类为保持客户,运营商应继续加强对该类客户的服务;D类为有发掘潜力的客户,运营商应提供一些套餐服务来吸引该类客户消费;B、C类差异相对不大。
在各类客户群下,再依据年龄、本地、长途等的不同设置相应的服务对策,以此来提高企业的收入及利润。
六、模型的评价
6.1优点
纵观整个模型的建立及求解可以看出,模型原理很简单,无需多考虑其它各个因素的影响,只需要对所求的一个或多个对象进行分析求解,得出占有率,分析运营商应向哪些方面多投入。
6.2缺点
本模型虽然很简单,容易理解,但当分析多个变量时,计算及数据的处理显得很繁琐,整个过程很庞大。
6.3推广
该模型能够将多个随机变量进行分类,我们应该将它推广到其他具有很多个随机变量的情况。
八、参考文献
[1]徐全智、杨晋浩,数学建模(第二版)[M],北京:
高等教育出版社,2008.6。
[2]杨启帆、何勇、谈之奕,数学建模竞赛[M],杭州:
浙江大学出版社,2005.5。
[3]王向东、戎海武、文翰,数学实验[M],北京:
高等教育出版社,2004.5。
[4]漆安慎、杜禅英,力学(第二版)[M],北京:
高等教育出版社,2005.6。
九、附录
附录聚类过程
初始聚类中心
聚类
1
2
3
4
年龄
74
39
48
30
性别
1
1
1
1
本地时长
0
10363
4882
15710
长途时长
0
576
2282
85
短信次数
0
2
0
205
最终聚类中心
聚类
1
2
3
4
年龄
40
39
40
36
性别
1
1
1
1
本地时长
764
4778
2569
8358
长途时长
77
173
142
237
短信次数
37
104
67
212
最终聚类中心间的距离
聚类
1
2
3
4
1
4015.666
1806.301
7597.037
2
4015.666
2209.599
3581.574
3
1806.301
2209.599
5791.046
4
7597.037
3581.574
5791.046
每个聚类中的案例数
聚类
1
2645.000
2
635.000
3
1654.000
4
65.000
有效
4999.000
缺失
1.000
出师表
两汉:
诸葛亮
先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。
然侍卫之臣不懈于内,忠志之士忘身于外者,盖追先帝之殊遇,欲报之于陛下也。
诚宜开张圣听,以光先帝遗德,恢弘志士之气,不宜妄自菲薄,引喻失义,以塞忠谏之路也。
宫中府中,俱为一体;陟罚臧否,不宜异同。
若有作奸犯科及为忠善者,宜付有司论其刑赏,以昭陛下平明之理;不宜偏私,使内外异法也。
侍中、侍郎郭攸之、费祎、董允等,此皆良实,志虑忠纯,是以先帝简拔以遗陛下:
愚以为宫中之事,事无大小,悉以咨之,然后施行,必能裨补阙漏,有所广益。
将军向宠,性行淑均,晓畅军事,试用于昔日,先帝称之曰“能”,是以众议举宠为督:
愚以为营中之事,悉以咨之,必能使行阵和睦,优劣得所。
亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所以倾颓也。
先帝在时,每与臣论此事,未尝不叹息痛恨于桓、灵也。
侍中、尚书、长史、参军,此悉贞良死节之臣,愿陛下亲之、信之,则汉室之隆,可计日而待也
。
臣本布衣,躬耕于南阳,苟全性命于乱世,不求闻达于诸侯。
先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰。
后值倾覆,受任于败军之际,奉命于危难之间,尔来二十有一年矣。
先帝知臣谨慎,故临崩寄臣以大事也。
受命以来,夙夜忧叹,恐托付不效,以伤先帝之明;故五月渡泸,深入不毛。
今南方已定,兵甲已足,当奖率三军,北定中原,庶竭驽钝,攘除奸凶,兴复汉室,还于旧都。
此臣所以报先帝而忠陛下之职分也。
至于斟酌损益,进尽忠言,则攸之、祎、允之任也。
愿陛下托臣以讨贼兴复之效,不效,则治臣之罪,以告先帝之灵。
若无兴德之言,则责攸之、祎、允等之慢,以彰其咎;陛下亦宜自谋,以咨诹善道,察纳雅言,深追先帝遗诏。
臣不胜受恩感激。
今当远离,临表涕零,不知所言。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电信