4G驻留比大数据分析方法论研究与总结

上传人:wan****g1 文档编号:139123413 上传时间:2022-08-22 格式:DOCX 页数:8 大小:325.45KB
收藏 版权申诉 举报 下载
4G驻留比大数据分析方法论研究与总结_第1页
第1页 / 共8页
4G驻留比大数据分析方法论研究与总结_第2页
第2页 / 共8页
4G驻留比大数据分析方法论研究与总结_第3页
第3页 / 共8页
资源描述:

《4G驻留比大数据分析方法论研究与总结》由会员分享,可在线阅读,更多相关《4G驻留比大数据分析方法论研究与总结(8页珍藏版)》请在装配图网上搜索。

1、4G驻留比大数据分析方法论研究与总结淮安无线维护中心张毅阳、张柏林、刘瑞摘要:随着电信的4G网络逐步向乡镇农村推进,网络的覆盖范围逐步扩大,用户规模不断增长,如何精确的分析网络性能,直观的体现用户感知,成为当前网络分析工作的重点和难点。本文通过对用户话单和使用终端数据的深度挖掘,结合“大数据”分析的相关方法,利用成熟的SQLSERVER数据库系统,实现直接针对用户使用的区域、流量时长等行为的分析,重点针对4G用户切3G的情况进行分析定位,真实反映出网络和用户使用方面的问题,为网优和规划工作提供有效的参考。关键词:用户话单、终端类型、大数据分析、4G流量时长驻留比、高值用户1、分析背景:随着4G

2、网络覆盖范围的扩大以及用户增长,4G网络和3G网络覆盖水平日益接近,通过对4G用户切换到3G网络这一行为的分析和定位,可以有效的反映4G网络的真实覆盖水平和用户感知。常规的分析手段,以网管性能数据为基础,站在网络侧的角度,以扇区为最小维度,得出的结论可以反映网络的基本覆盖情况,但往往和用户真实感知有一定的差距。本文通过对用户话单数据进行深度挖掘,分析结论直接反映用户的使用行为,更能贴近用户感知。2、分析方法:考虑到数据规模庞大,关联关系较为复杂,本案例部分采用大数据分析的理论基本方法进行分析。以上是一般大数据挖掘流程,本案例中,针对分析对象的具体情况,按照以下简化流程进行:2.1 需求分析:结

3、合本案例的具体目标,主要需求针对目标用户从4G切换到3G的现象进行仔细的分析和定位,满足这一需求,主要需要以下几个方面的数据:2.2 数据准备:通过以上分析,需要的数据主要有:话单数据、扇区数据、用户终端信息数据。其中话单数据和用户终端信息数据由本地企信提供,扇区数据从“爱网优”平台提取,此类分析对实时性要求不高,为了避免接口上的繁琐,所有数据统一采用标准文本文件的格式提供。因话单数据非常庞大,为了更有效率的处理,采用SQLSERVER数据库进行数据的处理和计算。文本文件导入后,数据表结构如下:话单表:COLUMNNAMETYPENAMELENGTH定义SERV_IDnvarchar100SE

4、RV_IDBILLINGNBRnvarchar40用户号码IMSInvarchar30用户IMSIPPP_IDnvarchar40PPP_IDBSIDnvarchar40占用扇区BSIDMSCnvarchar20占用扇区MSCLACnvarchar20占用扇区LACCELLIDnvarchar20占用扇区CISTARTDATEdatetime16开始时间ENDDATEdatetime16结束时间RECVAMOUNTnumeric12反向流量SENDAMOUNTnumericSERVICE_TYPEbigintMDNnvarchar12840前向流量服务类型MDNPIDnvarchar40PID

5、40RATING_GROUP8时长RATING_GROUPnvarcharshichangbigint终端类型表:COLUMN_NAMETYPE_NAMELENGTH定义SERVIDnvarchar100SERVIDTRMNL_MDL_TPnvarchar100用户号码TRMNL_BRANDnvarchar100终端厂家TRMNLMDLNMnvarchar100终端型号数据表导入后,还需要对数据进行一些初步的处理,剔除一些无用噪声数据,根据开始结束时间计算出时长数据填入数据表中等等工作均在这一步骤完成。噪声数据主要有数据类型错误、超高流量的测试用户、异地漫游数据等;时长数据用结束时间和开始时间

6、之间的时长得出。2.3 建立模型:承接上文的需求,本次分析的考虑建立以下的主要模型全网流量分析高值用户分布用户时长模型用户流量模型2.4 数据挖掘:挖掘过程是按照上文的分析模型,通过编写sql语句,通过数据库计算输出最终结果,相应的语句主要有以下几种:督尊警警saLsaLsalsciL以上语句,主要基于几种思路编写:2.4.1 对原始话单数据表按照用户号码进行汇总分析,得出全网每个用户的流量和时长,由此得出每个用户的3G和4G使用情况;2.4.2 对原始话单数据和终端类型进行关联分析,得出全网不同终端的流量和时长数据,由此得出不同终端类型的流量时长占比情况;2.4.3 对原始话单数据表和基站扇

7、区表进行关联分析,得出不同扇区的3G和4G流量,3G流量高的扇区,认为是4G网络存在覆盖问题的区域;2.4.4对原始话单中使用4G终端,但没有4G流量的用户进行分析,这些用户如果在4G覆盖区域内,认为是用户自己关闭了手机的4G功能;2.4.5对产生3G流量的扇区覆盖的区域类型进行关联分析,反映出不同区域类型的4G网络覆盖情况。2.5 挖掘分析结果:2.5.1各类型业务流量和时长占比情况:上图数据反映流量占比情况,4G流量占比81.17%,3G流量占比18.65%,2G流量和其他特殊业务的流量占比较低可以忽略。上图数据反映时长占比情况,4G时长占比69.43%,3G流量占比30.18%,2G流量

8、和其他特殊业务的流量占比较低可以忽略。2.5.2用户产生3G流量和时长的原因分析:本期分析主要是通过对4G用户话单中的3G流量产生原因和产生地点进行分析,希望以此找到当前LTE网络覆盖的薄弱区域,找到高质用户的地理分布和使用行为规律,为后期的建设和优化提供方向。原因1-非4G终端:这部分用户共788个,占所有用户的0.75%,产生流量72240MB,占所有3G流量的1.56%。产生时长81247874,占所有3G时长的0.61%原因2-人为关闭4G功能:这部分用户共13628个,占所有用户的13%,产生流量1575027MB,占所有3G流量的34%。产生时长1534785757s,占所有3G时

9、长的46%。3G流量产生原因分析非4G终端流量_2%4非4G终端流量人为关闭流量人为关闭流量覆盖不好4G切34%3G覆盖不好4G切3G64%3G时长各类原因占比覆嚮严人为关闭时长校园CBD室内2%2%3%2%汽0%站机场火车%0%居民区42%景区其他工业园7%水域1%道路郊区4%4%农村33%不同区型3G流量居民区农村工业园郊区道路校园CBD室内水域景区非4G终端时长人为关闭时长覆盖不好4G切3G时长52%原因3-因为覆盖不好原因4G切3G:针对这个原因,从以下地理区域维度进行分析从区域类型分布上看,居民区、农村区域占比最大,说明居民区的深度覆盖和农村区域的广覆盖仍然是网络覆盖的薄弱点。2.5

10、.4 TOP用户和TOP扇区:0ha*i”Wk輕(氈Lii!rMKrfJB.i.rEanWIJTiBE-iLmuvsmSH旳騎INBIH9BC4MLitJiVEBlWEgfWwi4M3V建iB?负如efl-?叫M3SJAM-車6UKtWHEK4H130If?旳d4i-iIrTKelEM?3MTSIrrtMi1*udun,jHJ.lHilia-fi-WttifClMWaww*siMTiHqiimMiaiiittaWalfcaiWsHf!*t?町帀JMWnJi宵聊BQ017rnis-B10tiH5wmlH.w_Liii!-pJlrfri!.glAMgp和W4HHWNf#*WInfillMiJUPI

11、mrjw當rmnWilli?WMavuiBHRIMilUM*dct44-imwrVfiWI悯PMLlMIF枷HIEEwnr-fFVh.*3RQVU4*UmnIWtMMi且忖屮为排除T别大流萱用户行为.审全將我征4GS0,以”时怅.带户数”钻取TOP扇区;/4G用产莊B3G肘长TOP20尿夏分补再疑佐址3总民IRsM.vJipH41MMib严Jh*|jfKdiBtilHP-J.il血强.1fu-MH-jas1r4H14MM出01百Mi4441-r*吐在血出T.:MF$*dT?X1締?科诩PtWbLNyublkfGJTS#MMr齐审SMX30liQ4dJHTE!XKULLJ537MV7hwiiwv

12、nLWuhwtayxii4hi1wtihuii.佃比5甌ih佑hlALlb1auKreE.MV4n&fflmwfe-巧径口T/Tfl;*4ULLMJIL7?m2和nmrfilJILjHJ.FTMrFJ-rajiHiUiMn-ocgi.rurcuiFEMLMai希rrrntAilU+BiM.rcLHLrMALLhuu.M:iWOrlruAihcrnuu;hvsfr1nit1MI!ika1U13-!MJU,JWUH3MiWriHAlJhJ.J3MFLMdiTbh口JS廿bVOhiklZiJHM!:ymhuu.、JiMCLji*,30.MCGli!9HULLJIMMiflIU-MAlVCLUi,!i

13、ktUljM站刚舗!huu.nuwmjuwqfpgT$Jflfla7TrIKEMPiT?MU弄輕X719041HUU,jnt胃np咼VWE!f*TmnsrMAJ.huu.JEWC*WW*HAl/TOP用户终圻为中高斎.均爻持4G:幵关未柠幵耒髭正常注斑帥G廳络睦2.5.3高值用户分布:以IPONE6手机用户为分析对象,统计占用的流量TOP500扇区分布图,以此分析高值用户的分布情况,可见绝大部分的高值用户,分布区域在城区和极少数的几个重点乡镇,另外在一些重点景区,也是高值用户的流量集中的区域,这部分区域是后期网优和建设工作的重点保障区域。五港U兰二)白马湖黠区曲=T-win高构吏Jte河观金陶赵集33、结论和推广价值:本案例通过借鉴大数据分析的有关方法,对用户话单数据、终端类型数据、扇区地理分布数据进行综合分析和挖掘,最终找出当前网络中4G用户3G流量的产生原因。通过对3G高流量扇区的分析,发现网络存在问题的区域,发现高值用户的分布区域,为网络优化和网络建设提供方向。因为数据源是直接来自用户话单,这些问题的解决,将直接带来用户感知的提升。此外通过建立归纳模型,使得此类方法能够有更多的可拓展性,可以从数据中挖掘更多有价值的东西。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!