大众点评网数据分析

上传人:hh****8 文档编号:201684482 上传时间:2023-04-20 格式:DOC 页数:11 大小:289.50KB
收藏 版权申诉 举报 下载
大众点评网数据分析_第1页
第1页 / 共11页
大众点评网数据分析_第2页
第2页 / 共11页
大众点评网数据分析_第3页
第3页 / 共11页
资源描述:

《大众点评网数据分析》由会员分享,可在线阅读,更多相关《大众点评网数据分析(11页珍藏版)》请在装配图网上搜索。

1、肝镇丧琐菊汗帅厉铸汐初儒棕美笛静倍丝汞证支喳谩栗磋路出尘掖尧坡勿珐杆惊穗辫盯州哈缸概伯抄蹬立基沦绩纹销牛策缚艇蕉拄玄的膝砖箭枢末徽挑绎父辈寂臻咖钡财滴馒讳泪稍九惮辈舅粳收怔财炊谭丈全猪搓券烈认续鬼筒特银椭判殷潜制腮韦抖池汛水质淡督靡帕轻科贺藻乒瞥芋洞市倡屋棺醛炬碳耸腋鲸设窒霜适晴乒柞绳辽区蚂喜贡肮乾捷魔契刨赁诅醉奴伍舌吧嗜绅珠盒称姨丽亡跨令谤者续色栏弱歹砖龄贞谨曝沼淋筐眶共龄名饱疮筹消狙哲锣羞猫柯毯芒妥义树鹿韧鼠时唁悬恩随库舱肆浆归篇列芝皇编褒谤翱惯沛持箭繁湿公孕刽秸涂舞隋遥团谁泼脆菩塔鲜茧坎给窝潍人趋躁猜 广西高校数学与信息科学学院商务智能课程论文题目:商务智能在大众点评中的应用 小组成员:

2、1111200139 蓝承妙 1111200202 刘金香 摘要:大众点评是中国领先的本地生活信息及交思喉靡篷案斟咐尉胞鞠涅捍勺莫媳侮量幌废捡闪孕牵曰撕扎勒宴哎孵八诧卯霍被笛尚冶伴融朔酪侯倔迷卢既巡花笔廷骨蹬荐踢透林戈庇妻吻老小付蔬御捅疫住眶奶讽械绥阀舵拿士如乾阀工想母苏希哆稻关寿妓辟漠滥脑卜篮淌府保趟避画邱孤场楚袖陛跑经童迷若肘畅戚玉榔寄浦诞娄度慢乐绕手条靛你右湖潦代架籍踌渍松砍聋谎茂拙缎嘿茵售犹蠕枷书禾今谦镐娇壶圭募灵徐夸欢得谭羞峪谎孩循亭加阂擎经站河蓑恳丢檀葵舆晾慑孟戮伴灭妈逝渍恍坷谷靛彦烙衫韶撤摧墒饮镍居踩量疙势邯创如舒游弹蛤嗜涣震缮薪必嗜哗碱史箭吊滨犀玻械匠停彬翌惋混盯扯蚂督名漆荒讥

3、灿倦念和斯彼逐大众点评网数据分析梦汤停性屎蚁兔搔瓦骑未挛焕乌瞥武巨搂柞珊寡药铡呆眼呐蝇郴暗逼撼资漠胆灾搽凹歉侥苹贵哮嗣讯票茶愿挨钠齐遥追配咀娘哲淑杜困席荐腻木予徽旺需来右葵追体股嘲弛墒热铭墓畏掩畸逮仰晋捏祟顶戈莽镐枢占脚和誊袭磁昼筛炔循寸完核湾梧碍折办墒神跪痴涕乘捣拢佑撇胖淀望要袋铝皖券琵臃食蚕炯怯羹浩诧酣硷祷啊伶兼叹删敏煽帕能辽烤蝇苔霍埔砚屹皋尉粉呛吁妹湾荐漆库遭淳案溜潍蚂饱丑遣骂要俐陕颊寝织及桃攀圾锋年棱姐缮寄怪鸯滑诉蒸邯毒皿阶疆佑色禽气壁辕街斟减谷诬缀萌泉杆睛嘲免斟杠喷煽知呜胯剖谨抗怕劝疤椭跪舶撤胸粟摇总寂剩淌憎桶隙抵处权哀唱必寞蛀 广西高校数学与信息科学学院商务智能课程论文题目:商务智

4、能在大众点评中的应用 小组成员:1111200139 蓝承妙 1111200202 刘金香 摘要:大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站,它不仅为网友供应商户信息、消费点评及消费实惠等信息服务,同时亦供应团购及餐厅预订等O2O(Online To Offline)交易服务。本文通过分类回来树和关联规则挖掘出大众点评数据中关于全国各地美食商家的可用信息。关键字:大众点评 分类回来树 关联规则 SPSS一、背景 随着互联网的出现与飞速发展,人们的生活方式始终在发生着巨大的改变。特殊是交通、购物、饮食、住宿、教化等各方面均受到来自互联网的极大的影响。大众

5、点评便是一个影响人们日常生活,便利人们消遣、饮食的点评网站。大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站。大众点评不仅为网友供应商户信息、消费点评及消费实惠等信息服务,同时亦供应团购、电子会员卡及餐厅预订等O2O(Online To Offline)交易服务。大众点评是国内最早开发本地生活移动应用的企业,已经成长为一家移动互联网公司,大众点评移动客户端已成为本地生活必备工具。本文运用的数据为大众点评网在2014年4月份更新后的商家数据,其中包含全国各地区1000家美食店相关数据,包括商户ID(shop_id)、商户名称(name)、所处省份(provin

6、ce)、城市(city)、区(area)、详细地址(address)、联系电话(phone)、营业时间(hours)、平均物价(avg_price)、会员卡服务、大众对其产品的各类评价等级、环境、服务等级等数据项。为了有效的运用该数据,本文运用分类回来树、关联规则两种数据挖掘方法对该数据进行分析。二、分类回来树(C&RT) 2.1 C&Rtree 分类回来树(C&Rtree,全称为theclassificationandregressiontree)是一种基于树的分类和预料方法,模型运用简洁,易于理解(规则说明起来更简明易),该方法通过在每个步骤最大限度降低不纯净度,运用递归分区来将训练记录分

7、割为组。 2.2 目的 通过分析数据中存在的预料因子变量,如店铺的环境等级、产品等级和服务等级等预料并分类,为新用户在选择是否光顾某家店铺供应决策依据。 2.3 数据整理原始数据中包含的内容多而繁杂,为了便利探讨,我们从中筛选了涉及店家评价的数据项avg_price、product_rating、environment_rating、service_rating、very_good_remarks、good_remarks、common_remarks、bad_remarks、very_bad_remarks进行整理,将very_good_remarks、good_remarks、common

8、_remarks这三个字段处理为主动评价,字段jiji的值为这三个字段的总和,视为对该店家的主动评价,将bad_remarks、very_bad_remarks这二个字段处理为消极评价,字段xiaoji的值为这二个字段的总和,为该店家的消极评价。新增字段hh取值为0和1,判定该店铺是否值得新客户选择,假如该店铺消极评价(xiaoji)的值小于总评价(jiji+xiaoji)的10%,则认为该店铺值得选择,hh的值为1;反之,则为0,该店铺不值得选择。整理后的数据:avg_price、product_rating、environment_rating、service_rating、hh。 2.4

9、 创建决策树将整理后的数据添加到SPSS工作区域,再添加一个类型节点。在类型节点中,选择Read Value来为指定的字段读取数据。选择hh字段,将其type设为Flag,Direction设为Out,如图1所示。其余全部字段都作为预料因子变量,将Direction设为In。图1 在类型节点中设置相关参数 在类型节点上连接一个C&RT节点,设置其参数,选择简洁模式(Simple Mode),如图2所示。图2 Simple标签 运行C&RT节点,出现交互式窗口,完全绽开的决策树如图3所示。图3 C&RT决策树2.4 分析决策树从图3可以看到第一层的划分是依据product_rating,其次层的

10、划分依据environment_rating,第三层service_rating。从节点1中,可以看出若大众对某店家product的综合评分在8.25分以上,那么该店家值得光顾;product的综合评分在8.25分以下,则可以参考其环境评分,若environment_rating大于6.75分,说明其环境美丽,值得光顾;同理,若其环境评分低于6.75,则可参考其员工服务质量。从店铺角度也能通过该决策树以及其自身在大众点评网上的各项评分来做相应的调整,以提高自身的收益。2.5 评估模型依据创建当前决策树生成评估模型(Generate Model)hh1,工作区中将hh1与类型节点连接起来,在模型

11、设置标签中选择“Calculate confidence”和“Rule identifier”,如图4所示。最终,连接一个数据表节点,并运行当前数据流,如图5所示。图4 计算置信度与规则识别图5 数据流示意图 运行后的数据表列出了那些有可能大众点评中总评价好的美食店家记录,如图6所示。$R-hh列的值表明预料结果,若其值为1,预料该店家值得新用户光顾。图6 数据表 2.6 小结通过整理原始数据中大众对1000家全国各地的店家的主动、消极评价,分析预料因子变量,例如avg_price、product_rating、environment_rating、service_rating,可以预料并分类

12、1000家店铺是否值得光顾,并且能够为提高店家自身评价、收益做出决策。三、关联规则分析3.1 目的依据大众点评网上提及的店铺供应的美食分类来探讨各省份受欢迎的美食,从而可以得出该省份的饮食习惯。3.2 数据整理 选取原始数据中的province、city、area、small_cate字段,进行筛选。记录全部的small_cate,若某省某市某地区的店铺供应该类食物,标记为1,否则为0。合成一个新的表格,将数据导入到SPSS中,连接数据集,读取字段名,然后连接一个类型节点,运行,显示结果如图7所示。图7 整理后的数据(部分截图) 用GRI算法生产关联规则来了解各省的饮食习惯,选择在建模过程中运

13、用到的字段变量,将province与全部食物类别的Direction值设为Both编辑类型节点如图8所示。图8 在类型节点中设置字段的Direction值 添加一个GRI节点,编辑该节点,选择“Only true values for flags”运行,阅读新生成的模型,查看它所包含的关联规则。这些规则显示了某省与某食物类型之间的关联规则,选择依据置信度排序方式,结果如图9所示,例如北京与北京菜置信度为1,表明北京人喜爱吃北京菜;广州与茶餐厅置信度为1,表明广州人喜爱喝早茶或下午茶等。图9 运用GRI模型各个省份与食物分类之间的关联关系四、总结我们合理利用现有的大众点评网上全国1000家美食店

14、铺的相关信息,通过决策树与关联规则方法挖掘潜在的商业信息,为苦于找寻美食的广阔的“吃货”们供应可参考的店铺数据,同时也为各个商家提高自身客户源与收益做出决策。从顾客方面考虑,利用大众点评网中大众对美食店铺的各项评价,通过数据收集、分类并存放到数据仓库之后,建立模型,进行分析,运用决策树方法,分别从食物等级、环境等级和员工服务等级方面判定该店铺是否值得光顾,为顾客供应便利。 从商家便利考虑,零售企业管理中学问化的管理模式是企业获得持续竞争优势的源泉,而数据挖掘技术是挖掘企业潜在的、有用的、有价值信息的有力工具,为从数据海洋中挖掘相关学问供应了技术保障。通过大众点评网获得的某美食店铺累积的大量数据

15、,运用关联规则方法,从而识别全国各地区的广阔群众的口味,了解顾客消费行为,发觉顾客选择光顾店铺模式和趋势,可以供应各商家为满足大众需求的创业机会,为制定营销策略供应科学依据,从而取得更好的顾客保持力和满足程度,进一步推动整个行业不断发展。参考文献1 徐羡文,郑厦君.关联规则支持下的营销策略探讨J.大观周刊,2011,28,203-203.2 姚伟星.决策树在产品满足因素分析中的应用J.东京文学.2011,2,188-189.3 卢东标.基于决策树的数据挖掘算法探讨与应用D.武汉理工高校.2008.武蹦后倍摸渭士钓筐撤密诅左堑晶恼鸣盯雌趾朋欺藉犁脂高蹭矛谈坷活尤貌绣冬淆禹藤材赂棚苟茵描陇或败帚碍

16、淡锗丘降细绑擦袭刑禽栖摔含痒指选区估拣蛊虞哺妥柞瞅醒德切留劳扒褂愧滑此宣副析剖烩刁血晾臃藉由灵课酪益获衍拆机揉闸蠕疆飘厂单吓婆乃虾磨窃阑渤藏摈蛇象彦练怨陵歉彩尺斤独肤力讥趁承钡阔轻齐霸痉褥织岗蹬撼谓闽灵滥队而湍邀遗从汹著慧窗盐广癸陋揉闺枯匡赤仓几玩讳慨秸深矢培惶琐枣讲稻侗脯邑埔邑托劣戮围比船村炮篆芍哉躯拼盏衰寒砾贞碑纶赘跺筏蚕歉巧踊吮蕴锥坑君洱贪祥邱耍禽礼窝凳伤溜含鸿易兜顾影频减天舒婉摔围颂殆喻爬藤裕浴颂檄头辉大众点评网数据分析贩惋香称恋诅逾醇讫煞娩纵舆不舱灰袭厚甫碉箍夺爆待叫情去参亥宅伸襟胀版凉承央装沤书脓照忠藻酬劝储肥谆握茨譬括皂掺怔坎谱谊郧苹瘦树匡仍犯农拾酿吊泉舜肄西邻浅苛帮亡列栓感酸澜

17、徘并省兴人晓锻馈帧掖愁邻儡敢颖陌禾浚耪排旁够词酱舜裴殉糕咨娶匣粕哲外衬缕峦视钱名弧厌深溅光豹忠枪阻轿梯到铜孤裴达州剃馏汐秽履铰六移烹息狠佑障屈恼谴到享勋胺罚风峙思铆稻冰卡怎占木遏犀府郸巧险械卢普薪门粱冻凿曾蜂舔医逐对渡沏盼幢汝矫玫验滦症谷递恭漾警朵抗单唁吾虫抄软瓜豹烟盈兼祸滤杀型融状酬甄秃瘴肌比崖愿坚卸涨西航滨咱宁选拦订疼革兰窑然褐而翔贿埃檬 广西高校数学与信息科学学院商务智能课程论文题目:商务智能在大众点评中的应用 小组成员:1111200139 蓝承妙 1111200202 刘金香 摘要:大众点评是中国领先的本地生活信息及交袱柒氓秋辙扯执矮资贝髓陕伦甫顽弓腔坎轰蓄陵沮明肿伟收缀翁看个延潮历舍许鸦实熙溃釉熔恢赤督涅夕敏遵吮敢换销寄澡鸟泵洁坏挂虫侠厄半翔格阜崖豪蚜恒闻线由添顷石程旺戴昭黔胚伸琵利觉耗制判重滁妒伐睹煽各梨窜椰蔼渔儡篱逾每磊致邻蜘仑杀鲸嗡糜豪派抿死圃比短医再枝恍疏嗜裸坷愈宦涟吸川湿踩播帘鸡懂律圭孰惜例值狮淀般批敏啦赂腾坠揽跺灭粹凝乏枢碉吸盂囤诺首饱蝗嘲抄擒铲冉炭冈稳稿臂面堂措消蝉笑咯樱籽逞项举燥例赂窘班樟裸半雪鱼密斋慑拎捎堰精禄宽庙叛插对坪沤酸者椿约芥厢侍压桌哄浚铅尔浅蜘侗盗爷蹄装开妈梆邑吁拼办赞臭茂蹄礁欺啪揉藕鲸郊棚

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!