数据标准化处理方法(word)可编辑
《数据标准化处理方法(word)可编辑》由会员分享,可在线阅读,更多相关《数据标准化处理方法(word)可编辑(3页珍藏版)》请在装配图网上搜索。
1、腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄
2、羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿 数据标准化处理方法 在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无
3、量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。一、Min-max 标准化 min-max标准化方法是对原始数据进行线性变换。设minA和maxA分别为属性A的最小值和最大值,将A的一个原始
4、值x通过min-max标准化映射成在区间0,1中的值x,其公式为: 新数据=(原数据-极小值)/(极大值-极小值) 二、z-score 标准化 这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到x。 z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。 新数据=(原数据-均值)/标准差 spss默认的标准化方法就是z-score标准化。 用Excel进行z-score标准化的方法:在Excel中没有现成的函数,需要自己分步计算,其实标准化的公式很简单。步骤
5、如下: 1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ; 2.进行标准化处理: zij(xijxi)si 其中:zij为标准化后的变量值;xij为实际变量值。 3.将逆指标前的正负号对调。 标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。 三、Decimal scaling小数定标标准化 这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性A的取值中的最大绝对值。将属性A的原始值x使用decimal scaling标准化到x的计算方法是: x=x/(10*j) 其中,j是满足条件的最小整数。 例如 假定A的值由-986到91
6、7,A的最大绝对值为986,为使用小数定标标准化,我们用1000(即,j=3)除以每个值,这样,-986被规范化为-0.986。 注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数,以便对后续的数据进行统一的标准化。 除了上面提到的数据标准化外还有对数Logistic模式、模糊量化模式等等: 对数Logistic模式:新数据=1/(1+e(-原数据)) 模糊量化模式:新数据=1/2+1/2sin派3.1415/(极大值-极小值)*(X-(极大值-极小值)/2) X为原数据 薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄
7、薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中移动绩效管理系统1课件
- 第五节维生素D缺乏性佝偻病ppt课件
- 登革热主题班会ppt课件
- 新生儿持续肺动脉高压诊治进展课件
- 新湘少版三年级英语上册Unit2goodmorning课件
- 新生儿呼吸窘迫综合症(Neonatal-Respiratory-Distress-Syndrome)课件
- 中移动滚动规划中关于流量经营的考虑课件
- 电气排故高级证ppt课件
- 新浙教版-九年级科学上-第一章复习课件
- 把握新高考的难得机遇做一位成功的高考考生ppt课件
- 新生儿缺氧缺血性脑病课件
- 中科院讲义-分布式操作系统-Peterson和Dekker算法证明教学课件
- 新生儿巨细胞病毒感染课件
- 大学生恋爱观及恋爱问题的应对策略ppt课件
- 新生儿惊厥ppt课件