点击率及其准确性研究分析计算机科学技术专业

上传人:文*** 文档编号:240081922 上传时间:2024-03-15 格式:DOC 页数:12 大小:96KB
收藏 版权申诉 举报 下载
点击率及其准确性研究分析计算机科学技术专业_第1页
第1页 / 共12页
点击率及其准确性研究分析计算机科学技术专业_第2页
第2页 / 共12页
点击率及其准确性研究分析计算机科学技术专业_第3页
第3页 / 共12页
资源描述:

《点击率及其准确性研究分析计算机科学技术专业》由会员分享,可在线阅读,更多相关《点击率及其准确性研究分析计算机科学技术专业(12页珍藏版)》请在装配图网上搜索。

1、点击率及其准确性研究摘要在互联网时代网页点击率日益成为重要的理论和运用热点,本课题正是基于这样一个原因围绕统计网页页面点击率和准确性问题展开了较为全面的研究。首先对网页页面点击率问题的研究背景、现状和趋势进行了阐释;其次针对点击率中存在的问题,重点研究了单页面统计、利用jsp内置对象application统计、利用jsp application和session统计等三种方法,同时着眼如何区分同一IP上不同用户点击情况,纳入点击时间、点击频率两个因素,设计改进了点击率的统计方法,结果表明改进后的点击率统计方法能够更加准确反映用户点击的真实情况。关键词页面点击率;准确性;点击时间;点击频率Rese

2、arch on Click-through Rate and Its AccuracyAbstract In the Internet age, the click-through rate of web pages has become an increasingly important theoretical and application hotspot. This topic is based on this reason, focusing on the statistical issues of page click-through rate and accuracy. First

3、ly, the research background, current situation and trend of web page click-through rate are elaborated. Secondly, aiming at the problems of click-through rate, three methods are studied: counting by single page, counting with JSP built-in object application, counting with JSP application and session

4、. In order to distinguish clicks of different users on the same IP, including click time and click frequency, a click rate statistics method was designed and improved. The results show that the improved click-through rate statistics method can more accurately reflect the click-through rate of users.

5、 Key wordspage click rate; accuracy; click time; click frequency1 概述1.1 研究背景与意义当今进入网络时代、智能时代和电子商务时代,网络上电子商务店铺、舆论舆情分析人员、文案创作人员等等许多主体都会更加关注自己在网络上的网页备关注的程度,这种被关注程度衡量的重要依据就是点击率的多少,每天或者是每个小时有多少人在点击网页,特别是随着电子商务发展,网页上的广告成为一种和电视媒体广告一样重要的广告模式,如何知道广告浏览情况,点击率也是最重要的衡量指标。反映了网页上某一内容的受关注程度,经常用来衡量广告的吸引程度。因此,对互联网网页点

6、击率的研究越来越重要。当前研究人员研究的重点是关注网站页面上某个内容,被点击次数与被显示次数之比,用公式表示就是Click frequency=clicks/time*100%。点击率的计算可以通过多种方式进行,最基本的公式为:点击率=点数数访问数。如一个新闻网站的网页链接在一小时之内,某网页刊登的广告被点击10次,以10s为单位时间,这个网页上的广告点击率=点击数访问数=10/360*100%=2.8%。当前通用的计算方法是指网站的点击率,也就是指一个链接单位时间内的点击次数。在互联网广告成为了商家推崇的一种主流营销方式的时代,选择了网站网页点击率与准确性这个课题进行研究,并把研究的范围聚焦

7、到电子商务中网页广告的点击率问题,采用一定的算法预估精准广告投放的效益,在精确广告投放过程中扮演了很重要的角色。预估的准确性对广告主的收益、广告商的收益以及用户的友好体验有着重大的影响,因此受到互联网企业的广泛关注。这时用点击率衡量出一个比值,有多少人看到一个链接,然后又有多少人点进去看,用这两个数字之比来衡量一个网络内容的受欢迎程度和影响程度,如图1.1在线广告投放模式所示。图1.1 在线广告投放模式但是当前采取的方法计算网页点击率CRT,最突出的特点是这种点击率计算方法不重复计算24小时内相同IP的点击行为,因为相同的IP意味着相同的人,相同的人看一万次和看一次没有什么区别。典型的是百度统

8、计和谷歌统计,使用百度统计可以很好的区分搜索推广与自然流量,可以自动推送给搜索引擎爬虫,一条统计代码可以和很多的百度产品结合在一起,所以百度统计还是比较方便的,目前常用点击率统计方法有三种:第一种是单页面统计,第二种是利用jsp的内置对象application进行统计的方法,第三种是利用jsp的application和session进行统计的方法。本课题考虑到因为点击率可以反映人们对一个网站或app喜爱程度,而如何探究点击率的准确性就需要仔细分析,比如在网吧一个IP可以不同的人登录,所以点击率的准确性是个值得探讨的问题。正是基于这样一个原因围绕统计网页页面点击率和准确性问题展开了较为全面的研究

9、,首先对网页页面点击率问题的研究背景、现状和趋势进行了阐释;其次针对点击率中存在的问题,重点研究了单页面统计、利用jsp内置对象application统计、利用jsp application和session统计等三种方法,同时着眼如何区分同一IP上不同用户点击情况,纳入点击时间、点击频率两个因素,设计改进了点击率的统计方法,结果表明改进后的点击率统计方法能够更加准确反映用户点击的真实情况。1.2 研究现状在国内外对这个问题的研究多年来一直都是热点,有研究基本理论的,也有研究算法应用的,还有创新方法结构的。从国外典型的有代表性的研究来看,发表比较早的研究成果是来自于Google. Microso

10、ft、Yahoo三大互联网公司。这三个公司近些年来把广告点击率预估作为了一个很热门的研究课题,把广告点击率预估模块作为实时广告系统中一个不可或缺的组成部分,在学术上和工业界都有着很深入的研究,研究内容的重点是点击率预估模型的设计、信息的提取和处理、长短期利益权衡策略、模型训练分布式系统实现等方面, 并取得了一系列的理论成果和应用成果,这种价值可以起到联锁作用,也就是说预估效果的好坏严重影响着广告商的收益、广告主的广告投放效果以及用户的上网体验,如图1.2广告点击率预估问题模型所示。图1.2 广告点击率预估问题模型此外,在国外的研究方面还有从事其他有关研究的。从国内有代表性的典型研究来看,随着国

11、内网络理论和信息理论发展,国内学者也十分重视点击率及其准确性研究,有跟踪国外研究前沿的,有独创派系的,也有国内国外结合的,当前的一个重点就是 信息的提取和处理,由于这是一个很复杂的过程,国内学者把关注的重点放在如何从原始数据中提取出有助于点击率预估的信息,目前取得了一系列成果,通常使用回归或者分类方法,构建点击率预估模型,模型中考虑了各种对点击率可能产生影响的因素。1.3 研究框架本文将论文分为5个部分,第一部分研究点击率及其准确性概述,第二部分研究点击率及其准确性统计原理,第三部分研究点击率及其准确性统计方法分析,重点是基于单页面统计、基于jsp内置对象application统计、基于jsp

12、 application和session统计,第四部分研究进点击率及其准确性统计新方法,主要包括利用点击时间优化统计方法和 利用点击频率优化统计方法,第五部分对全文进行总结,并对研究课题进行展望。2 点击率及其准确性统计原理2.1 点击率及其准确性含义通过前面的概述可以知道点击率的含义,即网页点击率就是指一个链接单位时间内的点击次数,最基本的公式为点击率=点击数访问数。点击率的公式可表示为: (2-1)当前通用的计算方法是指网站的点击率,就是指一个链接单位时间内的点击次数,目前可以用百度统计来监测,百度统计点击率当前成为国内最流行和可信的点击率统计工具。如一个新闻网站的网页链接在一小时之内,某

13、网页刊登的广告被点击10次,以10s为单位时间,这个网页上的广告点击率=点击数访问数=10/360*100%=2.8%。2.2 点击率及其准确性统计方法分类当前对点击率问题的典型研究,目前常用的方法有三种模式。第一种,用户浏览CTR模型预测模型。这种方法利用了概率论和统计论的思想,首先假设对网站上网页上某个广告的每一次点击都是相互独立的独立事件,第一次与后面的不相关,则就可以利用相关性因素和IP位置的因素得到网页的点击率。这种模型是本文研究的重点,在操作层面重点设计和创新基于单页面统计、基于jsp内置对象application统计、jsp application和session统计的方法。第二

14、种,动态贝叶斯网络模型。这种方法以智能算法为基础,用到了贝叶斯网络模型,贝叶斯网络模型是研究过程的动态模型。这里用到计算网页点击率主要是对使用者点击网页广告的过程进行建模,估算出观察相关性、实际相关性指标。这一个过程的建模和估算具体为:假设使用者点击URL地址,当且仅当使用者确实关注到了URL这个链接,所谓的观察相关性已经满足条件;若使用者点击后续的URL地址,则实际相关性不符合用户的要求。这样的一个模型大大的提高了计算点击的实际效果,更加具有真实性。第三种,点击链模型。这种模型是对CRT预测方法的扩展,这种方法的最大的优点是充分考虑的使用者的心理因素和实际需求因素,对网页上的广告进行浏览,反

15、复的浏览,当达到使用者的需求时才点击,这样的模型建模比较复杂,但经过人工智能算法分析,则可以比较准确的不仅计算了点击率,而且预估的使用者的实际需求,对商业上有更高的价值。2.3 本章小结本章从分析点击率的内涵和外延出发,对这一个概念进行了阐释,尔后研究了点击率统计方法,重点分析了点击率统计的典型方法,如用户浏览CTR模型预测模型、动态贝叶斯网络模型、点击链模型,最后分析了本课题研究中所用到的方法,进行了典型的归纳,为后续研究做好铺垫。3 点击率及其准确性统计方法分析3.1 基于单页面统计这种统计方法对于网站的页面,当点击了网站的某个页面,计数器就统计一次点击量,通过以独立的IP地址或者网站页面

16、为访问对象,只要被访问点击就记录一次点击量。在实际中将统计代码放置在需要统计的网站网页内,完成内置代码就可以实现点击量的统计。主要代码如下:_hmt.push(_trackPageview, /virtual/login);router.afterEach(to, from) = console.log(to); console.log(to.fullPath); window._hmt.push(_trackPageview, /# + to.fullPath););3.2 基于jsp内置对象application统计Jsp可以内置request、response、pageContext、s

17、ession、application、out、config、page、exception等内置对象,这种应用对象application,是存活范围最大的对象,当服务器一直开启时,application在整个服务器运行过程中数据一直存在,但利用application统计也有弊端,这个程序结果运行分析,也是访问一次页面统计一次。感觉还是不够好。真正满意的是浏览器打开网页,到关闭网页算一次,这样统计比较实际。application实现一个简单的网页计数器主要代码如下: page language=java import=java.util.* pageEncoding=UTF-8%String pa

18、th = request.getContextPath(); base href= My JSP application.jsp starting page 您是第位访问者; 3.3 基于jsp application和session统计利用Application对象实现访问人数的统计很常见,这种统计方法的原理是,Jsp调用Javeabean命令UseBean中有Scope设置,当访问者打开浏览器到关闭浏览器算一次访问,每次打开首页,创建一个session,这个session直到浏览器关闭才失效。但总体来说,比前两种要好。在这里为了解决当jsp服务器重启时累计的统计数就清零的问题,本文利用Ap

19、plication对象把保存到web.xml的数据库信息取出来,不但解决安全性问题,而且是一个全局变量,不用每次连接数据库,都写一串长长的数据。基于jsp application和session统计点击率主要代码: page language=java contentType=text/html; charset=utf-8 pageEncoding=utf-8%index3.4 本章小结本章在前面各个章节研究的基础上,深入到网页点击率统计方法的具体层面,重点分析了单页面统计方法、利用jsp内置对象application统计方法、利用jsp application和session统计方法,这个

20、三种统计方法是最基本的方法,也是最典型的方法,对后续研究有重要作用。4 点击率及其准确性统计新方法4.1 利用浏览时间优化统计方法由于目前本文上述研究分析的“基于单页面统计、基于jsp内置对象application统计、基于jsp application和session统计”等3种方法,都能够统计出网站网页的点击率,但这中间存在一些问题,比如到底是不是不同的人点击的,到底是过客还是有需求的客户,到底是路过网页还是按照客户的需求访问等问题,举一个实际例子,有个广告商投放在网络上的二个广告,分别被放在网页的不同的两个位置上,统计得到前者的点击率是30%,后者的点击率是10%,究竟哪个广告好一些呢?

21、其实我们得不出任何结论。我们知道如果不考虑时间、位置等各种复杂人类行为因素,绝对的点击率水平是没有什么太大意义的。这些问题解决不好,就没有办法真实的统计出网站网页广告的真实需求,对商家的帮助就有差距和偏差。为了解决这个问题,在本章引入了点击时间优化统计方法。在基于单页面统计、基于jsp内置对象application统计、基于jsp application和session统计方法的基础上,在网页的脚本文件或者代码中加入点击进入时间统计和离开时间统计,这样就可以知道访问者在这个网页停留的时间了,如果停留时间比较短,比如只有几秒钟,就可以认为访问者不是真正的需求者,如果在同样的一个网页上停留比较合理

22、的时间,比如达到了阅读全部内容的时间,则可以认为访问者有较大的潜在需求。经过这样一种改进,就能够有效解决统计真实需求不准的问题。这种方法是对基于单页面统计、基于jsp内置对象application统计、基于jsp application和session统计三种方法的改进,通过实验可以较为精准的得到真正的需求者和对广告有关注的关注者。主要代码如下:/统计用户访问网站页面时间 var tjSecond = 0; var tjRandom = 0; /定时增加时间 window.setInterval(function() tjSecond+; /获取随机的时间 tjRandom = (new Da

23、te().valueOf(); /加载 window.onload = function() ; /onbeforeunload 事件在即将离开当前页面(刷新或关闭)时触发 /该事件可用于弹出对话框,提示用户是继续浏览页面还是离开当前页面 window.onbeforeunload = function() /定义空的容器 var params = ; params.tjRd = tjRandom; /获取当前的url地址 params.url = location.href; params.time = tjSecond; params.timeIn = Date.parse(new Dat

24、e() - (tjSecond * 1000); params.timeOut = Date.parse(new Date(); /获取页面的title标题 params.title = document.title; /获取域 params.domain = document.domain; /获取屏幕的高度 params.sh = window.screen.height; /获取屏幕的宽度 params.sw = window.screen.width; /获取语言 params.language = navigator.language; /获取来源地址 params.refer =

25、getReferrer(); /定义空变量,用来做传递的参数 var args = ; for (var i in params) if (args != ) args += & args += i + = + encodeURIComponent(paramsi) $.post( + args, jsstr: , function(data) , json) ; 4.2 利用点击频率优化统计方法本章第一节的思路作为解决网站网页真实点击情况的方法比较有效,在此基础上还有这样一种方法,利用点击频率优化统计方法解决这种问题,这个方法的基本思路是:当访问者在一个网站网页上点击频率来判断是不是真正的有

26、效的点击,如果点击频率很高,则不是真正的访问者,如果点击频率不高,则是真正的访问者。这种方法是在基于单页面统计、基于jsp内置对象application统计、基于jsp application和session统计方法基础上的改进,和3.1利用浏览时间优化统计方法在解决问题的性质上一致的,只是利用了单位时间点击的次数。主要代码如下:Integer id = (Integer)request.getAttribute(id);Map obj=(Map) application.getAttribute(count);if(obj=null)obj = new HashMap();obj.put(i

27、d,1);application.setAttribute(count,obj); elseInteger count = (Integer)obj.get(id);if(count=null)count = 1; elsecount+; obj.put(id,count);application.setAttribute(count,obj);4.3 本章小结本章在第三章研究的基础上,特别是重点分析了单页面统计方法、利用jsp内置对象application统计方法、利用jspapplication和session统计方法的基础上,着眼当前点击率计算存在的主要问题,如何区分来自于同样的IP上的

28、不同用户的点击情况,特别是网吧电脑贡献的点击数统计问题,从点击时间和点击频率两个方面设计了改进统计的方法。5 结束语在互联网时代网页点击率日益成为重要的理论和运用热点,本课题正是基于这样一个原因围绕统计网页页面点击率和准确性问题展开了较为全面的研究,特别是针对当前研究中存在的问题。首先对网页页面点击率问题的研究背景、现状和趋势进行了阐释;其次针对点击率中存在的问题,重点研究了单页面统计、利用jsp内置对象application统计、利用jsp application和session统计等三种方法,同时着眼如何区分同一IP上不同用户点击情况,纳入点击时间、点击频率两个因素,设计改进了点击率的统计

29、方法,改进后的点击率统计方法能够更加准确反映用户点击的真实情况,具有一些理论意义和实践意义。本文的研究既有理论上的基础性,又有方向上的新颖性,还有实践上的价值性,通过本文的研究梳理出了文本相似度计算的逻辑过程和实践过程,有较为重要的价值。参考文献1 C.J.Wang,H.H.Chen. Learning user behaviors for advertisements click prediction J. SIGIR 2011 Workshop:Internet Advertising , 2011,38(04): 689701.2陈巧红,余仕敏,贾宇波. 广告点击率预估技术综述J. 浙江

30、理工大学学报(自然科学版), 2015,24 (6):851857.3欧阳晟. 基于Storm与在线机器学习的广告点击率预测的研究D. 武汉理工大学, 2016.4汪荣贵,沈明玉,偶春生. Bayes网络与关系模型的集成:概率关系模型J. 微电子学与计算机, 2002,24 (3):10001003.5刘唐. 基于多类别特征的在线广告点击率预测研究D. 北京邮电大学, 2013.6邵迪. 在线广告中高层特征表示及点击率预测方法研究D. 哈尔滨工业大学, 2014.7张志浩. 基于深度学习的在线广告点击率预估系统的设计与实现D. 南京大学, 2015.8孔东营. 基于在线贝叶斯算法的广告点击率预

31、估D. 中国科学院大学,2013.9 Thorsten Joachims. Making large-scale SVM learning practicalJ. Advances in Kernel Methods-Support Vector Learning, 1999,438(42):125130.10 肖垚, 毕军芳, 韩易, 董启文. 在线广告中点击率预测研究J. 华东师范大学学报(自然科学版), 2017,42(5): 8086.11 Ciaramita M,Murdock V,Plachouras V. Online learning from click data for sponsored searchJ. the 17th International World Wide Web Conference,2008,07(36):563568.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!