30第七章--电商数据分析综合案例课件

上传人:494895****12427 文档编号:212592826 上传时间:2023-05-23 格式:PPTX 页数:31 大小:3.02MB
收藏 版权申诉 举报 下载
30第七章--电商数据分析综合案例课件_第1页
第1页 / 共31页
30第七章--电商数据分析综合案例课件_第2页
第2页 / 共31页
30第七章--电商数据分析综合案例课件_第3页
第3页 / 共31页
资源描述:

《30第七章--电商数据分析综合案例课件》由会员分享,可在线阅读,更多相关《30第七章--电商数据分析综合案例课件(31页珍藏版)》请在装配图网上搜索。

1、第七章 电商数据分析综合案例中国IT教育解决方案专家 2019年*月目 录 Contents01电商数据背景分析02数据处理03数据分析04数据展示电商数据背景分析017.1电商数据背景分析大数据时代给电子商务发展带来新的机遇与挑战,大数据技术帮助电子商务行业发现新的商业模式,尤其是用户行为预测分析和购物商品关联分析己经在电商领域得到了很好的应用,并已经帮助电商获得了巨大的利润。其中用户行为分析是大数据电商应用领域最常用的技术手段,该技术通过研究用户在互联网上的行为数据,如用户在访问某个电商网站时,用户浏览、点击、购买、评价某种商品的行为,可以让企业更加详细、清楚地了解用户的行为习惯,从而为企

2、业的经营提供支持。案例以某电商类网站商品交易数据为基础,对“双十一“在内的近六个月的交易数据(脱敏数据)完成数据处理,同时对数据中品牌商品,尤其是热门品牌和商品,进行点击量、加入购物车量、购买量、关注量进行分析和预测,对购买客户的年龄、性别、区域特点进行分析和总结。7.1电商数据背景分析1.user_id|买家id 2.item_id|商品id 3.cat_id|商品类别id 4.merchant_id|卖家id 5.brand_id|品牌id 6.month|交易时间:月7.day|交易事件:日8.action|行为,取值范围0,1,2,3,0表示点击,1表示加入购物车,2表示购买,3表示关

3、注商品9.age_range|买家年龄分段:1表示年龄=50,0和NULL则表示未知10.gender|性别:0表示女性,1表示男性,2和NULL表示未知 11.province|收获地址省份12.ident_code|商品唯一标识码13.score|用户评分数据处理027.2 数据处理【任务描述】对电商数据进行数据处理,要求如下:(1)根据日期建立时间列,时间列格式为日期格式,如2015-01-01,列名为date,并去除原来的month和day列。(2)统计2015年10月11日-2015年11月11日之间,每天用户的不同行为的数量,列名为不同行为,时间为索引。【操作步骤】(1)根据“mo

4、nth”和“day”列数据,运用Date函数生成date列。鼠标单击“action”所在列,选中该列,右键单击鼠标,在弹出的快捷菜单中单击“插入”菜单项,则在“day”列和“action”列之间插入一空列,如图7-1所示。7.2 数据处理图7-1 电商案例源数据7.2 数据处理光标定位于H2单元格,鼠标单击“插入函数”按钮,弹出“插入函数”对话框,选择类别“日期与时间”“Date”函数,单击“确定”按钮,弹出如图7-2所示的“函数参数”对话框。光标定位于Year右侧的输入框,输入2015,光标定位于Month右侧的输入框,选取F2单元格,光标定位于Day右侧的输入框,选取G2单元格,单击“确定

5、”按钮,即可生成Date列数据。选中Date列,设置其格式为:“日期”-“2012-03-14”。图图7-2 Date2 Date函数参数对话框函数参数对话框7.2 数据处理(2)统计2015年10月11日-2015年11月11日之间,每天用户的不同行为的数量,列名为不同行为,时间为索引。单击“数据”选项卡中的“筛选”按钮。单击Date列右侧的向下箭头,在弹出的快捷菜单中,单击“日期筛选”“自定义筛选”,如图7-3所示。图图7-3 3 筛选快捷菜单筛选快捷菜单7.2 数据处理在弹出的“自定义自动筛选方式”对话框中,设置显示行Date“在以下日期之后或与之相同“2015-10-11”,“在以下日

6、期之前或与之相同-“2015-11-11”,单击“确定”按钮,将筛选出来的数据复制至一个新的sheet表,并将其重命名为“10月11月数据”。选中新表中的数据源,单击“插入”“数据透视表”,弹出“创建数据透视表”对话框,如图7-4所示。选择需要分析的数据区域,以及数据透视表放置的位置,单击“确定”按钮。图图7-4 创建数据透视表创建数据透视表7.2 数据处理进入数据透视表的分析窗口,按日分析统计不同行为的数量,则拖动date字段至“行”区域,拖动 action字段至“列”区域,再将action字段拖动至“值”区域,并设置其“值字段汇总方式”为“计数”,如图图7-5所示。图图7-5 数据透视表字

7、段设置数据透视表字段设置7.2 数据处理修改分析显示结果中的列标签,“0”修改为“点击”,“1”修改为“加入购物车”,“2”修改为“购买”,“3”修改为“关注商品”,最终结果如图7-6所示。图图7-6 数据透视表结果数据透视表结果数据分析037.3 数据分析【任务描述】针对某电商平台2015年几个月的用户行为数据,挖掘点击量与购买量之间的关系,并预测假如10000点击量购买量为多少?【操作步骤】(1)统计每日用户行为数据选中电商源数据,鼠标单击“插入”选项卡“图表”区域的“数据透视图”,弹出如图7-7所示的“创建数据透视图”对话框,单击“确定”按钮即可。图图7-7 “创建数据透视表创建数据透视

8、表”对话框对话框7.3 数据分析进入数据透视表的分析窗口,按日分析统计不同行为的数量,则拖动date字段至“行”区域,拖动 action字段至“列”区域,再将action字段拖动至“值”区域,并设置其“值字段汇总方式”为“计数”,如图7-8所示。图图7-8 数据透视表字段设置数据透视表字段设置7.3 数据分析修改分析显示结果中的列标签,“0”修改为“点击”,“1”修改为“加入购物车”,“2”修改为“购买”,“3”修改为“关注商品”,最终结果如图7-9所示。图图7-9 数据透视表结果数据透视表结果7.3 数据分析选取“数据透视表结果”中的日期、点击、购买列数据,复制至一个新的工作表,将无数据的单

9、元格用“0”替换,如图7-10所示。图图7-10 处理后的数据分析源数据处理后的数据分析源数据7.3 数据分析(2)分析“点击”和“购买”二个变量间的相关性选中数据分析源数据,单击“数据”选项卡中的“数据分析”,弹出如图7-11所示的对话框,选择其中的“相关系数”,单击“确定”按钮。图图7-11“数据分析数据分析”对话框对话框7.3 数据分析在如图7-12所示的“相关系数”对话框中,设置“输入区域”为“点击”和“购买”所在列数据,“分组方式”选择“逐列”,勾选“标志位于第一行”,根据需要设置“输出选项”,此处设置“输出区域”为$F$1,则在源数据所在工作表的F1单元格为左上角的矩形区域显示相关

10、分析结果,单击“确定”按钮。图图7-12“相关系数相关系数”对话框对话框7.3 数据分析相关系数分析结果如图7-13所示,“点击”和“购买”二个变量的相关系数是0.918079,属高度正相关。(3)建立“点击”和“购买”二个变量回归分析模型单击“数据”选项卡中的“数据分析”按钮,在如图7-11所示的“数据分析”对话框中,选择“回归”,单击“确定”按钮。图图7-13 “相关系数相关系数”分析结果分析结果7.3 数据分析在如图7-14所示的“回归”对话框中,对各类参数做如下设置。lY值输入区域:输入需要分析的因变量数据区域,此处选择“购买”列所在数据。lX值输入区域:输入需要分析的自变量数据区域,

11、此处选择“点击”列所在数据。l标志:勾选“标志”复选框。l置信度:勾选“置信度”复选框,输入“95%”。l输出区域:此处选择F6单元格,回归分析结果显示在以F6单元格为左上角的区域。l残差:勾选“残差”和“标准残差”图图7-14“回归回归”参数设置对话框参数设置对话框7.3 数据分析在如图7-15所示的回归统计表中显示,Multiple R为0.9181,说明“点击”和“购买”二个变量高度正相关;R Square为0.8429,说明回归模型拟合效果较好在如图7-16所示的方差分析表中显示,F统计量值为981.6318,说明“点击”和“购买”二个变量具有显著的线性关系;Significance

12、F值为1.84E-75,小于等于0.01,说明检验结果具有极其显著的统计学意义。图图7-14“回归回归”参数设置对话框参数设置对话框图图7-16 方差分析表方差分析表7.3 数据分析如图7-17所示的回归系数表显示,回归模型的斜率为0.1160,截距为-12.42,因此点击量和购买量的简单线性回归模型为Y=0.116X-12.42。根据上述简单线性回归模型,预测点击量为10000时,购买量约为1148。图图7-17 回归系数表回归系数表数据展示047.4 数据展示【任务描述】根据电商数据进行如下可视化分析展示:(1)用折线图画出用户10月份每日购买、点击、加入购物车、关注的变化趋势图。(2)分

13、析出各个地区男女购买量的特点,用柱状图表示,横坐标为省份,纵坐标上半部分为男性购买量,下半部分为女性购买量,总量为总购买量。【操作步骤】(1)用折线图画出用户10月份每日购买、点击、加入购物车、关注的变化趋势图选中电商源数据,鼠标单击“插入”选项卡“图表”区域的“数据透视图”,弹出如图7-18所示的“创建数据透视图”对话框,单击“确定”按钮即可。需要展示每日用户行为变化趋势,因此在“数据透视图字段”对话框中,将Date字段拖动至轴类别区域,将系统默认增加的“月”字段拖动至“筛选”区域,将action字段拖动至“图例(系列)”区域,再将action字段拖动至“值”区域并将“值字段设置”为“计数”

14、,如图7-19所示。7.4 数据展示图图7-18 18“创建数据透视图创建数据透视图”对话框对话框图图7-19 “数据透视图字段数据透视图字段”对话框对话框7.4 数据展示鼠标单击“数据透视工具”选项卡中的“更改图表类型”,选择“带数据标记的折线图”,单击“确定”按钮。单击“月”字段右侧向下箭头,选择“10月”,单击“确定”按钮,如图7-20所示,即可以折线图展示10月份用户的行为趋势,结果如图7-21所示。图图7-20 选择月份选择月份图图7-21 10月用户行为趋势图月用户行为趋势图7.4 数据展示(2)分析各个地区男女购买量的特点选中电商源数据,鼠标单击“插入”选项卡“图表”区域的“数据透视图”,弹出如图7-18所示的“创建数据透视图”对话框,单击“确定”按钮即可。需要展示各地区男女购买量,因此在“数据透视图字段”对话框中,将province字段拖动至轴类别区域,将gender字段拖动至“图例(系列)”区域,再将gender字段拖动至“值”区域并将“值字段设置”为“计数”,如图7-22所示。图图7-22 “数据透视图字段数据透视图字段”设置对话框设置对话框7.4 数据展示鼠标单击“数据透视工具”选项卡中的“更改图表类型”,选择“堆积柱形图”,单击“确定”按钮,结果如图7-23所示。图图7-23 各地区男女购买量可视化展示图各地区男女购买量可视化展示图THANKS!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!