网站点击次数的正态分析方法的介绍

上传人:x**** 文档编号:65759405 上传时间:2022-03-25 格式:DOC 页数:6 大小:241KB
收藏 版权申诉 举报 下载
网站点击次数的正态分析方法的介绍_第1页
第1页 / 共6页
网站点击次数的正态分析方法的介绍_第2页
第2页 / 共6页
网站点击次数的正态分析方法的介绍_第3页
第3页 / 共6页
资源描述:

《网站点击次数的正态分析方法的介绍》由会员分享,可在线阅读,更多相关《网站点击次数的正态分析方法的介绍(6页珍藏版)》请在装配图网上搜索。

1、 论点击次数的正态分析方法奚回 (单位略 710068)兴波 (金融高等专科学校 071000)(特别说明:本文是作者为了学习实证分析方法而刻意研究的一个问题,实用意义可能不大,练笔而已,敬请各位专家批评指正。)摘要:现行的点击次数分析方法有明显的缺陷,其根源在于没有对点击次数作随机变量考察。本文作了这种考察,并验证了它服从正态分布。正态分布的参数可以帮助分析其发展状况、与同业比较、制定科学的管理目标、考核员工等多种分析目的。这种以正态分布为基础的分析方法,本文暂称为点击次数的正态分析方法。关键词:点击次数;分析方法;正态分布;参数一、点击次数现行分析指标的缺陷和本文问题的提出随着我国经济社会

2、的发展,计算机网络的应用已越来越普与,并发挥着越来越重要的媒介作用,因此,如何管理网络也变得越来越重要。对一个来讲,点击次数(本文的分析方法,也适用于其他类似于点击次数的现象,如“某论坛某天发表的文章数”)的高低直接影响着其经营目标的实现程度,所以各总是极尽所能地提高其点击次数,并引入了一些与点击次数有关的分析指标,如最高点击次数、点击次数的不同期比较、点击次数的时间序列变化、一定期间点击次数的平均值等1。同时,对于点击次数与其他网络流量信息重要性的关注也催生了商业性分析软件的应用,如ITSUN流量统计分析系统2。虽然这些指标(含分析软件所用指标)能够在一定程度上反映的管理状况,但是就对于点击

3、次数的分析程度来讲,仍存在着明显的缺陷。主要表现在:1、的访问者主要是无法控制的客户,所以点击次数是随机变量,上下变动频繁,这使现行分析指标的直接根据点击次数绘制的时间序列图波动剧烈、趋势弱。虽然我们可以作回归分析来反映总体趋势,但回归直线和曲线的代表性都很差,如图1所示回归直线的R2仅为0.0713,回归曲线的R2仅为0.1。而且回归线也不能提供更为详细的变动信息。图1是根据“在线”2005年7月1日至12月31日的点击次数绘制的时间序列图和回归线图,它说明了此缺陷的存在:2、最高点击次数是极端值,价值有限。3、各客观上需要能够在同业间相互比较的标准指标。4、考察点击次数出现在某个区间的概率

4、(或频率)有助于制定科学的管理目标和考核标准。但现行的分析方法没有涉与此分析角度。5、点击次数存在“周周期性”,即点击次数以一周为一个周期上下波动。图2是在线两周的点击次数时间序列图,它直观地说明了其点击次数存在周周期性:点击次数存在周周期性的原因,可能是因为大部分用户访问的时间受其工作时间的周周期性的影响。这种周周期性会影响现行考核分析指标结果的正确性或正确程度。下面以在线2005年11月和10月的点击次数对比分析为例,来说明这种影响的显著与剔除这种影响的方法:该11、10月的点击次数分别为95581509和98024557次,则: 1、不考虑周周期性的影响。则11月的日均点击次数为3186

5、050次,10月为3162082次。比较可知,11月的业绩高于10月,因为11月的日均点击次数上升了23968次。但这只是假象。2、考虑周周期性的影响。注意到,除4个整周外,10月余周一、六、日3天,11月余周二、三2天。我们已知在线的点击次数明显地存在周周期性,周六、日在低点,周二、三在高点,所以10月的点击次数合计明显受低点影响,而11月则受高点影响。要剔除这种影响,方法是:忽略非整周数据中的周周期性数据,而保留其中的非周周期性数据(避免将非整周数据中的非周周期性数据也一同忽略掉了),然后将保留的数据并入4周数据中按4周计算日均点击次数。其中,某天(例如周六)的点击次数周周期性数据,就是各

6、周该天点击次数的期望值(平均值)。这时,11月的日均点击次数为3168104次,10月为3162529次。比较可知,11月的业绩比10月仅微弱上升,因为11月的日均点击次数比10月仅上升了5575次。比较而言,本文认为第二种方法是科学的方法。 上述方法的对比,说明了点击次数周周期性对于分析结果正确性或正确程度影响的显著,而要理解并剔除这种影响,则需要对点击次数作随机变量考察。鉴于以上对点击次数现行分析指标缺陷的分析,注意到:“某一天的点击次数”是随机变量,它服从正态分布(后有实证检验),这使得利用正态分布的参数(,2)对它进行科学考察成为可能。所以,本文就拟从正态分布的角度,对点击次数分析方法

7、进行研究,以期能改善现行指标的分析效果,或提出更有效的指标。本文研究所用点击次数数据是“在线”提供的公开的“在线全频道点击次数月报表”(2005.7-12)3。在此,对该支持科学研究的实际行动表示感。另外,在本文写作过程中,笔者曾查阅了相当数量的文献资料,但未发现一个与本文研究思路和容类似或有关的文章,这使笔者的参考与借鉴无从进行,所以文的不足可能在所难免,谨期能抛砖引玉。二、对“在线”点击次数服从正态分布的实证检验表面上看,点击次数是离散型数据,但因为它取值围广泛(0至几百万),所以应该把它看作连续型变量进行考察。经笔者检验分析,证明在线的点击次数服从正态分布。表一是根据在线2005年7-1

8、2月每天的点击次数样本数据计算的正态分布的分布函数(注意不是密度函数)频率概率对比表(其中为实际点击次数除以10万后的四舍五入): 表1:在线点击次数分布函数频率概率对比表k频率pk%概率pk%k频率pk%概率pk%200.5434782610.0126134813359.782608756.90034414211.0869565220.0446793153470.1086956567.46446235241.6304347830.8184675383577.1739130477.02111367252.1739130431.2738300543687.584.74415642263.8043

9、478263.0878957353790.7608695790.11332948276.521739136.197391933896.1956521793.82972678289.78260869610.378291283997.282608796.070256272911.9565217415.154691624097.8260869697.123889423020.6521739124.414474184198.9130434898.825500833130.4347826134.242960994299.4565217499.393041093247.8260869645.5929579

10、24310099.79485127根据该表可绘制分布函数(注意不是密度函数)的频率概率对比图(图3)如下:从图3直观可知,在线点击次数的分布与参数为(32.9,3.522)的正态分布有较好的拟合。另外,还可以用2检验对这一问题(H0:在线点击次数服从参数为(32.9,3.522)的正态分布)进行更准确的检验。检验结果为:根据样本数据计算,得2=40.0343。查2表,得显著性水平为0.005、自由度为21的临界值为41.401。因为2=40.034341.401,所以H0通过了检验,即在线的点击次数服从参数为(32.9,3.522)的正态分布。4三、利用正态分布参数对在线发展状况和部考核的分析

11、(一)、对发展趋势的分析管理者首先应正确理解其的整体发展趋势,但如前所述,图1的分析不能很好地提供这方面的信息。所以,客观上需要一种更好的指标来反映点击次数的发展趋势。正态分布的参数是其随机变量的期望值,其含义为均值,可以作为点击次数的代表。在本例中,=32.9;而标准差为3.52,远小于,所以,的变化可以很好地反映点击次数的发展趋势。下图(图4)是在线点击次数的变化曲线图:从该图可以得到以下信息:1、整体上,在线点击次数呈稳定下降趋势,但最近有回升的迹象。2、在约第25至65日间,点击次数快速上升,并维持在较高的水平。此后,点击次数却一再稳定下降。在约85日附近情况有所改善,但没能逆转。最后

12、10日左右,点击次数有回升的迹象,但幅度不大。上述趋势至少给提出了两个研究命题:1、判断点击次数下降的性质,分析原因。从性质上,可以初步推断下降是系统性的。这说明在线整体服务质量与市场需求有一定的距离。2、对系统性下降之外的变动进行分析,即对点击次数的3个上涨期作细致的调查分析,为采取逆转措施提供思路。需要说明的是:查看图5时应忽略起初的几个值或部分值,因为此时数据量太少;图五反映的变化有迟滞现象,实际情况的发生要比图5反映的早几日;根据多个需要,制作多个数据量的图五更有利于分析。(二)对同业间相互比较的分析由于能够作为点击次数的代表,可以反映这种代表性的强弱,所以它们可以用作同业间相互比较的

13、标准指标(数据时期要一样)。同样,可以计算多个进行比较,也可以使用连续的变化曲线图(图5)进行更详细的比较。由于没有其他的数据,所以本文不作同业比较的实例分析。(三)对制定科学管理目标的分析管理目标分长远目标和近期目标。1、对在线长远目标的分析从图5可以判断其点击次数的下降是系统性的,在外部环境和部管理没有发生显著改善以前这种趋势不会改变。外部环境是客观存在,所以应从部管理着手来延缓或逆转这种趋势。这就是该在可预见的未来的长远目标。为了达此目标,在线应对其服务质量进行细致的考察,因为其点击次数的稳步下降与网络发展的总趋势(按几何级数增长5)相反。2、对在线近期目标的分析。从近期(如一个月)来讲

14、,则应以近几期(如近3个月)的数据计算的为依据。具体目标应确定为比略大的某个区域,如+/10,+/5,表述为(+1)。具体略大指大多少,视管理力度的大小决定。(四)对部考核指标的改善科学剔除点击次数周周期性影响,可以使剩余的点击次数数据与员工的工作努力程度的相关性进一步提高,使日均点击次数能更好地反映员工的业绩。这个举例前面有,不再重复。另外,一个经营期结束后,实际的点击次数往往与目标不一致,这时就要分析其差异性质(有利差异还是不利差异)、大小、原因。服从正态分布的随机变量,其某个具体值落在区间的概率为68.27%,落在2区间的概率为95.45%,落在3区间的概率为99.73%。也就是说,如果

15、点击次数落在上述区间则属正常,未落在上述区间则不正常。这为进一步考核员工的工作努力程度提供了分析的依据。四、结语:点击次数的正态分析方法要义纵上所述,可总结点击次数正态分析方法的要义如下:点击次数服从正态分布;这个分布的参数可以帮助分析其发展状况、与同业比较、制定科学的管理目标、考核员工等多种目的。=主要参考文献:15 坚争、许勤、维新.电子商务基础与实务M.市:电子科技大学,2001.184、133.2 ITSUM.ITSUN流量统计分析系统. ITSUN./,2005年12月1日.3 在线网. 在线访问量(点击次数)分月报告EB/OL.203.207.99.35/webleadreport/reports/jc/(在线访问情况统计分析系统),2005年7月1日/2005年12月31日.4 剑平、陆元鸿.概率论与数理统计方法M.市:华东理工大学,1999.159-161.(英文摘要、作者简介、通信地址、联系方法等略)6 / 6

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!