MBA统计学数据的描述培训课程

上传人:xcv****223 文档编号:253315984 上传时间:2024-12-11 格式:PPTX 页数:39 大小:478.98KB
收藏 版权申诉 举报 下载
MBA统计学数据的描述培训课程_第1页
第1页 / 共39页
MBA统计学数据的描述培训课程_第2页
第2页 / 共39页
MBA统计学数据的描述培训课程_第3页
第3页 / 共39页
资源描述:

《MBA统计学数据的描述培训课程》由会员分享,可在线阅读,更多相关《MBA统计学数据的描述培训课程(39页珍藏版)》请在装配图网上搜索。

1、,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,统计学,从数据到结论,第三章数据的描述,在对数据进行深入加工之前,总应该对数据有所印象。,可以借助于图形和简单的运算,来了解数据的一些特征。,由于数据是从总体中产生的,其特征也反映了总体的特征。对数据的描述也是对其总体的一个近似的描述。,3.1 如何用图来表示数据?,3.1.1 定量变量的图表示:1.直方图,对于一个定量变量,比如某个地区(地区1)测量了163个高三男生的身高,(S3height1.txt),。,用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”的一个办法是画,直方图(his

2、togram),。,图3.1就是利用这个数据由SPSS软件所画的直方图。,该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而纵坐标为各种身高区间的身高的频数。,直方图,3.1.1 定量变量的图表示:2.盒型图,简单一些的是,盒形图(boxplot,又称箱图、箱线图、盒子图),。,图3.2的左边一个是根据地区1高三男生的身高数据所绘的盒形图;其右边的图代表另一个地区(地区2)的高三学生的身高,(height.txt,height.sav,第三章例.xls),。,盒型图,盒子的中间横线是数据的中位数(median),封闭盒子的上

3、下两横线(边)为上下四分位数(点);按照SPSS的默认选项,如果所有样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为最大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四分位间距),在其外面的度量单独点出,3.1.1 定量变量的图表示:3.茎叶图,在直方图和盒形图中,很难恢复数据的原貌。而另一种图:,茎叶图(stem-and-leaf plots),可以恢复数据,以地区1高三男生身高为例(图3.3),茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。,茎叶图,其中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎

4、为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。,3.1.1,定,定,量,量变,量,量的,图,图表,示,示:4.,散,散点,图,图,数据,会,会有,两,两个,变,变量,,,,如,美,美国,男,男士,和,和女,士,士初,婚,婚年,限,限数,据,据(marriage.txt,),)。,该数,据,据描,述,述了,自,自1900年,到,到1998年,男,男女,第,第一,次,次婚,姻

5、,姻延,续,续的,时,时间,。,。,这里,年,年份,是,是一,个,个变,量,量,,婚,婚姻,延,延续,时,时间,是,是第,二,二个,变,变量,。,。由,于,于不,可,可能,将,将所,有,有人,的,的婚,姻,姻年,限,限都,给,给出,来,来,,所,所以,每,每年,就,就取,了,了一,个,个中,间,间的,值,值(,中,中位,数,数),作,作为,代,代表,。,。,散点,图,图,3.1.2,定,定,性,性变,量,量的,图,图表,示,示:,饼,饼图,定性,变,变量,(,(或,属,属性,变,变量,,,,分,类,类变,量,量),不,不能,点,点出,直,直方,图,图、,散,散点,图,图或,茎,茎叶,图,图,,

6、但,但可,以,以描,绘,绘出,它,它们,各,各类,的,的比,例,例。,下面,用,用SPSS绘,的,的图3.5(饼,图,图,piechart)表示,了,了说,世,世界,各,各种,主,主要,语,语言,人,人数,的,的比,例,例(language.txt).,饼图,3.1.2,定,定,性,性变,量,量的,图,图表,示,示:,条,条形,图,图,而用,同,同样,数,数据,画,画的,图,图3.6,称,称为条形,图,图(barchart)。,从每,一,一条,可,可以,看,看出,讲,讲各,种,种语,言,言的,实,实际,人,人数,,,,而,且,且分,别,别给,出,出了,每,每个,语,语种,中,中母,语,语和,日

7、,日常,使,使用,的,的人,数,数(,在,在图,中,中并,排,排放,置,置),。,。条,形,形图,显,显示,比,比例,不,不如,饼,饼图,直,直观,。,。,条形,图,图,3.2,如,如,何,何用,少,少量,数,数字,来,来概,括,括数,据,据?,大量,的,的数,字,字既,繁,繁琐,又,又不,直,直观,;,;需,要,要对,数,数据,做,做人,们,们时,间,间和,耐,耐心,所,所允,许,许的,简,简化,我们,可,可以,用,用,“,“平,均,均”,,,,“,差,差距,”,”或,百,百分,比,比等,来,来概,括,括大,量,量数,字,字。,由于,定,定性,变,变量,主,主要,是,是计,数,数,,比,比较

8、,简,简单,,,,常,用,用的,概,概括,就,就是,比,比例,或,或百,分,分比,。,。下,面,面主,要,要介,绍,绍关,于,于定,量,量变,量,量的,数,数字,描,描述,。,。,3.2,如,如,何,何用,少,少量,数,数字,来,来概,括,括数,据,据?,可用,少,少量,所,所谓,汇,汇总,统,统计,量,量或概括,统,统计,量,量(summarystatistic)来描,述,述定,量,量变,量,量的,数,数据,。,。,这些,数,数字,是,是从,样,样本,数,数据,得,得来,的,的,,因,因而,也,也是,样,样本,的,的函,数,数,,任何,样,样本,的,的函,数,数,,只,只要,不,不包,含,含

9、总,体,体的,未,未知,参,参数,,,,都,称,称为统计,量,量(statistic)。,样本,的,的随,机,机性,决,决定,统,统计,量,量的,随,随机,性,性(,统,统计,量,量也,是,是随,机,机变,量,量),3.2,如,如,何,何用,少,少量,数,数字,来,来概,括,括数,据,据?,概括,统,统计,量,量经,常,常对,应,应于,总,总体,的,的无,法,法观,测,测到,的,的某,些,些参,数,数。,这时,,,,统,计,计量,可,可作,为,为这,些,些参,数,数的,估,估计,。,。一,些,些统,计,计量,还,还可,以,以用,来,来检,验,验样,本,本和,假,假设,的,的总,体,体是,否,否

10、一,致,致。,3.2,如,如,何,何用,少,少量,数,数字,来,来概,括,括数,据,据?,注:一些,统,统计,量,量前,面,面有,时,时加,上,上“,样,样本,”,”二,字,字,,以,以区,别,别于,总,总体,的,的同,名,名参,数,数。,如,如“,样,样本,均,均值,”,”和,“,“样,本,本标,准,准差,”,”,,以,以区,别,别于,总,总体,均,均值,和,和总,体,体标,准,准差,;,;但,在,在不,会,会混,淆,淆时,可,可以,只,只说,“,“均,值,值”,和,和“,标,标准,差,差”,。,。,3.2.1,数,数,据,据的,“,“位,置,置”,数据,有,有位,置,置吗,?,?,这里,三

11、,三个,数,数据,的,的位,置,置一,样,样吗,?,?,3.2.1,数,数,据,据的,“,“位,置,置”,“位,置,置”,一,一般,是,是关,于,于数,据,据中,某,某变,量,量观,测,测值,的,的“,中,中心,位,位置,”,”或,者,者数,据,据分,布,布的,中,中心,(,(center或centertendency),。,。,和这,种,种“,位,位置,”,”有,关,关的,统,统计,量,量就,称,称为位置,统,统计,量,量(locationstatistic)。,位置,统,统计,量,量当,然,然不,一,一定,都,都是,描,描述,“,“中,心,心”,了,了,,比,比如,后,后面,要,要讲,的,

12、的k,百,百分,位,位数,(,(或k,分,分位,数,数),。,。,3.2.1,数,数,据,据的,“,“位,置,置”,最常,用,用的,位,位置,统,统计,量,量就,是,是小,学,学时,所,所学,到,到的,算,算术,平,平均,数,数,,它,它在,统,统计,中,中叫,做,做均,值,值(mean);,严,严格,地,地说,叫,叫做,样,样本,均,均值(samplemean),,以,以区,别,别于,总,总体,均,均值,。,。,如果,记,记样,本,本中,的,的观,测,测值,为,为,x,1,x,n,,则,样,样本,均,均值,定,定义,为,为,(样,本,本),中,中位,数,数(median),是,是数,据,据按

13、,照,照大,小,小排,列,列之,后,后位,于,于中,间,间的,那,那个,数,数(,如,如果,样,样本,量,量为,奇,奇数),,或,或者,中,中间,两,两个,数,数目,的,的平,均,均(,如,如果,样,样本,量,量为,偶,偶数)。,由于,中,中位,数,数不,易,易被,极,极端,值,值影,响,响,,所,所以,中,中位,数,数比,均,均值,稳,稳健(robust),。,。,3.2.1,数,数,据,据的,“,“位,置,置”,上下,四,四分,位,位数(或,分,分别,称,称为第一,四,四分,位,位数,和,和第,三,三四,分,分位,数,数,firstquantile,thirdquantile,),)则分,

14、别,别位,于,于(,按,按大,小,小排,列,列的,),)数,据,据的,上,上下,四,四分,之,之一,的,的地,方,方。,3.2.1,数,数,据,据的,“,“位,置,置”,3.2.1,数,数,据,据的,“,“位,置,置”,一般,地,地还,称,称上,四,四分,位,位数,为,为75,百,百分,位,位数,(,(75pecentile,有75,的,观,观测,值,值小,于,于它,),),,下,下四,分,分位,数,数为25,百,百分,位,位数(有25,的,观,观测,值,值小,于,于它,),)。,一般,地,地,k百,分,分位,数,数(k-pecentile)意,味,味着,有,有k,的,观,观测,值,值小,于,

15、于它,。,。,如果,令,令,a,=k%,则k,百,百分,位,位数,也,也称,为,为,a,分位,数,数(,a,-quantile),。,。,样本,中,中出,现,现最,多,多的,数,数目,,,,称,为,为众数(mode),3.2.2,数,数,据,据的,“,“尺,度,度”,这两,个,个数,据,据“,胖,胖瘦,”,”一,样,样吗,?,?,3.2.2,数,数,据,据的,“,“尺,度,度”,数据,中,中数,目,目的,分,分散,程,程度,由,由尺度,统,统计,量,量(scalestatistic)来描,述,述。,尺度,统,统计,量,量是,描,描述,数,数据,散,散布,,,,即,描,描述,集,集中,与,与分,

16、散,散程,度,度或,变,变化,(,(spread或variability),的,的度,量,量。,3.2.2,数,数,据,据的,“,“尺,度,度”,从前,面,面两,个,个高,三,三男,生,生身,高,高数,据,据的,盒,盒形,图,图。,左,左边,的,的数,据,据平,均,均要,高,高些,,,,但,右,右边,的,的数,据,据散,布,布范,围,围要,小,小得,多,多。,统计中有,许,许多尺度,统,统计量。,一,一般来说,,,,数据越,分,分散,尺,度,度统计量,的,的值越大,。,。,3.2.2 数,据,据的“尺,度,度”,极差(range);就是极,大,大值和极,小,小值之间,的,的差。,前面两个,高,高三男生,身,身高数据,的,的极差分,别,别为50cm和32cm。,盒形图盒,子,子的长度,为,为两个四,分,分位数之,差,差,称为四分位数,极,极差或四,分,分位间距(interquantile range);它描述,了,了中间半,数,数观测值,的,的散布情,况,况。极差,和,和四分位,极,极差实际,上,上各自只,依,依赖于两,个,个值,信,息,息量太少,。,。,3.2.2 数,据,据的“尺,度

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  sobing.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!