R的简单介绍和线性回归课件

上传人:文**** 文档编号:240634280 上传时间:2024-04-26 格式:PPTX 页数:37 大小:634.66KB
收藏 版权申诉 举报 下载
R的简单介绍和线性回归课件_第1页
第1页 / 共37页
R的简单介绍和线性回归课件_第2页
第2页 / 共37页
R的简单介绍和线性回归课件_第3页
第3页 / 共37页
资源描述:

《R的简单介绍和线性回归课件》由会员分享,可在线阅读,更多相关《R的简单介绍和线性回归课件(37页珍藏版)》请在装配图网上搜索。

1、R学习的分享目录一、R的介绍 1.R的特点 2.R的界面 3.R的使用注意事项二、R中数据创建 1.数据的输入 1.1.向量 1.1.1向量的赋值 1.1.2有序向量的赋值 1.2.矩阵的创建 1.3.数据框的创建 1.3.1表格输入 1.3.2数据框的直接输入 2.数据读入目录三、统计分析方法简介3.1方差分析和多重比较 3.1.1方差分析和多重比较的命令调用3.2假设检验 3.2.1假设检验的命令调用3.3主成分和因子分析 3.3.1主成分和因子分析的命令调用3.4判别分析及命令3.5聚类分析 3.5.1聚类分析函数的命令调用3.6回归分析 3.6.1回归分析的详细解释 R的介绍的介绍 R

2、是什么:R是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka和Robert Gentleman共同创立,并受到贝尔实验室s语言的影响。R的特点 1.免费性:R是一个免费的统计分析软件;2.运算能力强大:同Matlab一样不需要编译就可执行代码;3.帮助功能完善:可通过help命令可随时了解R所提供的各类函数的使用方法或例子;4.R有顶尖水准的制图:在可视化方面,R的效果特别好,并能保存为各种形式的文件;5.统计分析能力尤为突出:R内嵌了许多统计分析函数,一些中间结果既可保存到专门的文件,也可直接用于进一步的分析。6.R的界面中文版的R界面从后开始输入数

3、据,代码等R的使用注意事项1.R的命令对大小写敏感,这在使用命令方式安装和载入程序包时应特别注意。2.输入R的命令中尽量使用英文字符,避免使用中文字符。3.同一行中可输入多个命令,需用 ;隔开,#认为是注释内容,不予执行。4.R中所有的函数后都带圆括号5.赋值一般用 a a 1 1 2 3 4 5 b b1 one two three four five“d d1 TRUE FALSE1.1.2有序向量的赋值 生成有序的向量可以使用seq命令,s1 s1 1-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.5 0.0 0.5 1.0 1.515 2.0 2.5 3.

4、0 3.5 4.0 4.5 5.0还有其他的赋值向量的命令不再详细举例。1.2.矩阵创建创建一个矩阵:Mymatix cells rnames cnamesmymatrix mymatrix C1 C2R1 1 26R2 24 681.3.1表格输入如果要输入以下表格的数据可以使用矩阵,也可用数据框数据框的形式 bloodtype jnbq cs xjt xjgs patientdata patientdata bloodtype jnbq cs xjt xjgs1 zc 8.90 12.00 34.71 44.002 lj 10.63 18.05 46.18 67.243 yc 19.84

5、30.55 73.06 116.82血压状态血压状态 冠状动脉冠状动脉机能不全机能不全猝死猝死心绞痛心绞痛心肌梗塞心肌梗塞正常正常8.91234.7144临界临界10.6318.0546.1867.24异常异常19.8430.5573.06116.821.3.2数据框的直接输入同样的,可以在R中新建数据框,直接输入数据。命令格式如下:比如创建一个名为mydata的数据框,它含有三个变量,age(数值型)、gender(字符型)、weight(数值型)。命令为:mydata mydata-edit(mydata)2.数据读入R可以读取多种形式的形式。以导入csv,xls,txt为例:mydata

6、framemydataframe library(RODBC)channel mydataframe odbcClose(channel)txt读取:mydata choose.dir()或者()直接从弹出的对话框中了来查找文件。三、统计分析方法简介统计分析方法:统计分析方法:常用的主要方法有:线性回归线性回归,方差分析与方差分析与多重比较,假设检验多重比较,假设检验,主成分和因子分析,主成分和因子分析,判别分析,聚类分析。判别分析,聚类分析。3.1方差分析方差分析方差分析:用于分析分类型自变量与数值型自变量之间的关系,即分析多各总体均值是否相等的方法。具体根据影响因素的不同,可以分为单因素方

7、差分析,双因素方差分析例:例:某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量是否有差别。排污口属于分类型自变量,大肠杆菌数量属于数值型因变量。分析的问题是:不同排污口大肠杆菌的数量是否相等。排污口排污口1234大肠杆菌数量9,12,7,520,14,18,1212,7,6,1023,13,16,21方差分析代码X-c(9,12,7,5,20,14,18,12,12,7,6,10,23,13,16,21)A-factor(rep(1:4,each=4)fcfx-data.frame(X,A)fcfxaov.fcfx-aov(XA

8、,data=fcfx)summary(aov.fcfx)plot(fcfx$Xfcfx$A)pairwise.t.test(X,A,p.adjust.method=holm)TukeyHSD(aov(XA,fcfx)3.1多重比较多重比较是在方差分析得到否定结论后,为确定是哪些组之间存在差异,两两之间进行的比较分析。假设上述问题经分析得到的结果是四个排污口的大肠杆菌的数量是有差异的。那么具体是哪些排污口数量不同造成的,可进行多重比较。3.1.1方差分析与多重比较命令函数的调用格式:aov.miss-aov(formula,data=Null,projections=FALSE,qr=TRUE,

9、contrast=NULL,)多重比较的T检验命令pairwise.t.test(x,g,p.adjust.method=p.adjust.methods,poor.sd=TRUE,)x是影响变量构成的向量,g是分组向量(因子)方差分析的对象数据框是否返回逻辑预测值是否返回QR分解因素对比合并方差调整p值3.2假设检验 假设检验假设检验是依据样本去推测总体特征。是依据样本去推测总体特征。思想思想:是基于小概率事件在一次试验中不是基于小概率事件在一次试验中不发生发生的原理。的原理。某车间用一台包装机包装精盐,额定标准每袋净重500g,设包装机包装出的盐每袋净重XN(,2)某天随机地抽取9袋,称得

10、净重为490,506,508,502,498,511,510,515,512.问该包装机工作是否正常?H0:=500 H1:500 3.2.1假设检验命令调用z.test-function(x,n,sigma,alpha,u0=0,alternative=“two.sided”)类似的可以调用t.test,chisq.var.test检验3.3主成分和因子分析 主成分分析:将多个变量通过线性变换以选出较少个数重要变量,而又尽可能多的保留原始样本的信息。因子分析:用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原

11、资料的大部分信息。3.3.1主成分分析随机抽取30名某年级中学生,测量其身高(X1),体重(X2),胸围(X3),坐高(X4),数据如下表所示,试对这30名学生身体四项指标作主成分分析。序号 X1 X2 X3 X4 序号 X1 X2 X3 X4 1 148 41 72 78 2 139 34 71 76 3 160 49 77 86 4 149 36 67 79 5 159 45 80 86 6 142 31 66 76 7 153 43 76 83 8 150 43 77 79 9 151 42 77 80 10 139 31 68 74 11 140 29 64 74 12 161 47

12、78 84 通过对以上四项指标做主成分分析,可以构造由四个指标的线性组合组成的主成分,来解释数据。本例中经过主成分分析中可构造出一个反应学生魁梧成度魁梧成度的主成分y1和反应学生胖瘦胖瘦的主成分y2。主成分分析代码x-read.csv(student.csv)student.pr weight fhl womendataplot(fhlweight,type=b,col=red,xlab=体重,ylab=肺活量,xlim=c(40,50),ylim=c(0,3.5)p经常不断地学习,你就什么都知道。你知道得越多,你就越有力量pStudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe写在最后谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way演讲人:XXXXXX 时 间:XX年XX月XX日

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!