第三部分Logistic回归SPSS与SAS课件

上传人:磨石 文档编号:240391851 上传时间:2024-04-09 格式:PPT 页数:94 大小:1.35MB
收藏 版权申诉 举报 下载
第三部分Logistic回归SPSS与SAS课件_第1页
第1页 / 共94页
第三部分Logistic回归SPSS与SAS课件_第2页
第2页 / 共94页
第三部分Logistic回归SPSS与SAS课件_第3页
第3页 / 共94页
资源描述:

《第三部分Logistic回归SPSS与SAS课件》由会员分享,可在线阅读,更多相关《第三部分Logistic回归SPSS与SAS课件(94页珍藏版)》请在装配图网上搜索。

1、复习:1.多元统计分析中指标的量化法2.多元线性回归分析的数据结构与模型3.多元线性回归分析的具体任务回归分析的具体任务4.4.筛选变量的常用方法5.5.多元线性回归分析的实现方法回归分析的实现方法1PPT学习交流.多元统计分析指标的量化法:(1)二分类(2)无序多分类(3)有序多分类 .多元线性回归分析的数据结构与模型:2PPT学习交流.多元线性回归分析的具体任务回归分析的具体任务1)采用最小二乘法原理确定方程中系数bi i=0,1,2,3p;2)采用F检验对回归方程整体进行假设检验;3)采用t检验对方程中的每个系数bi进行假设检验。4)结合专业给出合理的解释。3PPT学习交流.筛选变量的常

2、用方法向前法(forward selection)后退法(backward selection)逐步回归法(stepwise selection)4PPT学习交流.多元线性回归的实现过程多元线性回归的实现过程操作过程:操作过程:Analyze-Regression-Analyze-Regression-Linear-yLinear-y选入选入Dependent-x1Dependent-x1、x2x2、X3X3选入选入Independent-Stepwise-Independent-Stepwise-options-okoptions-ok5PPT学习交流 logistic regression

3、 analysis Logistic Logistic回归回归内容:6PPT学习交流(一)基本概念和原理(一)基本概念和原理 1.1.应用背景应用背景 LogisticLogistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。7PPT学习交流 设资料中有一个因变量y、p个自变量x1,x2,xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。2、LogisticLogistic回归模型的数据结构8PPT学习交流 表1 LogisticLogistic回归模型的

4、数据结构实验对象 y X1 X2 X3 .XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 9PPT学习交流表2肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区10103002001461310035130100261注:是否患病中,1代表否,0代表是。性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不吸烟。地区中,1代表农村,0代表城市。10PPT学习交流表3配对资料(1:1)对子号病例对照x1x2x3x1x2x31130101203113030120201022

5、2000注:X1蛋白质摄入量,取值:0,1,2,3X2不良饮食习惯,取值:0,1,2,3X3精神状况,取值:0,1,211PPT学习交流LogisticLogistic回归回归-Logistic-Logistic回归与回归与多重多重线性回归联系与区别线性回归联系与区别联系联系:用于分析多个自变量与一个因变量的关系,目用于分析多个自变量与一个因变量的关系,目的是矫正混杂因素、筛选自变量和更精确地对因变的是矫正混杂因素、筛选自变量和更精确地对因变量作预测等量作预测等.区别区别:线性模型中因变量为连续性随机变量,且要求线性模型中因变量为连续性随机变量,且要求呈正态分布呈正态分布.Logistic.L

6、ogistic回归因变量的取值仅有两个,回归因变量的取值仅有两个,不满足正态分布不满足正态分布.12PPT学习交流3 3、Logistic回归模型l 令令:y=1 发病(阳性、死亡、治愈等)发病(阳性、死亡、治愈等)l y=0 未发病(阴性、生存、未治愈等)未发病(阴性、生存、未治愈等)l 将发病的概率记为将发病的概率记为P,它与自变量,它与自变量x x1 1,x x2 2,x,xp p之间的之间的Logistic回归模型为:回归模型为:l可知,不发病的概率为:可知,不发病的概率为:l 13PPT学习交流经数学变换得:定义:为Logistic变换,即:14PPT学习交流 4、回归系数i的意义

7、流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。即Xi的优势比为:15PPT学习交流故对于样本资料OR=exp()95%置信区间为:可见是影响因素Xi增加一个单位所引起的对数优势的增量,反映了其对Y作用大小。如果要比较不同因素对Y作用大小,需要消除变量量纲的影响,为此计算标准化回归系数16PPT学习交流5.假设检验(1)回归方程的假设检验H0:所有H1:某个计算统计量为:G=-2lnL,服从自由度等于n-p的分布(2)回归系数的假设检验H0:H1:计算统计量为:Wald,自由度等于1。17PPT学习交流(二)Logistic回

8、归类型及其实例分析1、非条件Logistic回归 当研究设计为队列研究、横断面研究或成组病例对照研究时,要用非条件Logistic回归。18PPT学习交流实例1某研讨究者调查了某研讨究者调查了3030名成年人,记名成年人,记录了同肺癌发病的有关因素情况录了同肺癌发病的有关因素情况,数数据见表据见表4 4。其中是否患病中。其中是否患病中,1 1代代表否表否,0 0代表是代表是.性别中性别中 1 1代代表男表男,0 0代表女代表女,吸烟中吸烟中 1 1代表吸烟代表吸烟,0 0代表不吸烟代表不吸烟.地区地区中中,1 1代表农村代表农村,0 0代表城市。代表城市。试分析各因素与肺癌间的关系。试分析各因

9、素与肺癌间的关系。19PPT学习交流表4肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区10103002001461310035130100261注:是否患病中,1代表否,0代表是。性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不吸烟。地区中,1代表农村,0代表城市。20PPT学习交流Datalog1;In;-读取数据Inputnyx1-x4;-指出变量Proclogistic;-调logistic回归模块modely=x1;run;-作单变量(x1)分析Proclogistic;modely=x2;run;Proclogistic;modely=x3;run;Proclogistic

10、;modely=x4;run;Proclogistic;modely=x1-x4;run;-作多变量分析21PPT学习交流dataa;in;inputabyx1-x22;要导入()Procprint;Run;proclogistic;modely=x1-x4;run;22PPT学习交流表6单因素Logistic回归分析结果 模型号 变量 系数 标准误 Wald 卡方 P值1X11.70470.80064.53440.03322X22.56490.93647.50290.00623X30.14280.04679.34090.00224X4-0.27190.73870.13550.7128结果表明

11、,性别,吸烟,年龄三个因素都与肺癌有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.23PPT学习交流表7多元Logistic回归分析结果变量系数标准误Wald卡方P值INTERCPT-9.754.095.660.02X12.521.821.920.17X23.981.984.060.04X30.190.085.670.02X4-1.301.580.680.41由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有显著的影响。所得的回归方程为:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.24P

12、PT学习交流SPSS操作步骤:Analyze-Regression-BinaryLogistic-Dependent框(y)-Covariates框(x1,x2,)-ok非条件Logistic回归SPSS操作步骤:25PPT学习交流26PPT学习交流27PPT学习交流 结果表明,性别,吸烟,年龄三个因素都与肺癌有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.单因素分析的结果28PPT学习交流多因素分析的结果29PPT学习交流30PPT学习交流 由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有影响。所得的回归方程为:Logit(P)=-9.7544

13、+2.5152X1+3.9849X2+0.1884X3-1.3037X4.31PPT学习交流2.条件logistic回归分析配对设计的类型:1:1、1:m、n:m(可采用分层COX模型来拟合)。例如:某市调查三种生活因素与胃癌的关系,资料见表5。32PPT学习交流表5配对资料(1:1)对子号病例对照x1x2x3x1x2x311301012031130301202010222000注:X1蛋白质摄入量,取值:0,1,2,3X2不良饮食习惯,取值:0,1,2,3X3精神状况,取值:0,1,233PPT学习交流data log2;input no y x1 x2 x3;-输入变量cards;1 0

14、1 3 0(对子号、病人、x1、x2、x3)1 1 1 0 1(对子号、对照、x1、x2、x3)2 0 0 3 1 2 1 1 3 0.10 1 0 0 0;34PPT学习交流proc phreg;-调用实现条件Logistic回归和COX回归模块model y=x1;-作单变量分析strata no;run;proc phreg;model y=x1-x3;-作多变量分析strata no;run;35PPT学习交流配对Logistic回归SPSS操作步骤:Analyze-Survival-COXRegression-Time框(outcome)-Status框(Status)-Define

15、Event:Singlevalue1:continue-Covariates框(x1、x2、x3)-Strata框(id)-Options-atlaststep-ok36PPT学习交流37PPT学习交流38PPT学习交流39PPT学习交流40PPT学习交流41PPT学习交流42PPT学习交流43PPT学习交流3、逐步Logistic回归分析(1 1)向前法)向前法(forward selection)(forward selection)开始方程中没有变量,自变量由少到多一个一个引入回归方程。按自变量对因变量的贡献(P值的大小)由小到大依次挑选,变量入选的条件是其P值小于规定进入方程的P界值E

16、nter,缺省值 P(0.05)。44PPT学习交流(2)后退法(backward selection)开始变量都在方程中,然后按自变量因变量的贡献(P值的大小)由大到小依次剔除,变量剔除的条件是其P值小于规定的剔除标准Remove,缺省值 p(0.10)。45PPT学习交流(3)逐步回归法逐步引入-剔除法(stepwiseselection)前进前进逐步引入-剔除法 是在前进法的思想下,考虑剔除变量,因此有两个p界值Enter,Remove。46PPT学习交流SPSS无论是条件还是非条件Logistic回归,在多变量分析时均可以采用逐步回归方法,实现的方法是:在 method后加选项:Ent

17、er:所有变量一次全部进入方程。Forward:逐步向前法 Backward:后退法 变量移出方程所采取的检验方法:Conditional;LR;Ward(尽量不用)47PPT学习交流二分类二分类LogisticLogistic回归回归 method中文名称剔除依据Enter全部进入Forward:conditional向前逐步条件参数估计似然比PForward:LR向前逐步最大偏似然估计似然比PForward:Wald向前逐步Wald统计量PBackward:conditional向后逐步条件参数估计似然比PBackward:LR向后逐步最大偏似然估计似然比PBackward:Wald向后逐

18、步Wald统计量P48PPT学习交流LogisticLogistic回归回归检验方法检验方法似然比检验(似然比检验(likelihood ratio testlikelihood ratio test)记分检验记分检验(score test)(score test)Wald Wald检验检验三种方法比较三种方法比较 通常应用似然比检验结果相对较可靠通常应用似然比检验结果相对较可靠.在在小样本情况下记分的分布根接近于卡方分布,小样本情况下记分的分布根接近于卡方分布,所以记分检验导致的第所以记分检验导致的第类错误的可能性要小类错误的可能性要小一些一些.Wald.Wald检验在计算和使用上较容易检验

19、在计算和使用上较容易.但是但是结果略偏于保守结果略偏于保守.通常在样本较大时三种检验的通常在样本较大时三种检验的结果是一致的结果是一致的.49PPT学习交流SPSS软件实现方法 FileFileOpenOpen相应数据相应数据(已存在已存在)StatisticsStatistics Regression RegressionBinary Binary LogisticLogistic Dependent(y)Dependent(y)Covariates Covariates (自变量)自变量)MothodMothod(逐步回归方法)(逐步回归方法)Specify model(Specify m

20、odel(单因素或多因素)单因素或多因素)save(save(欲保存的内容)欲保存的内容)Options(Options(输出选输出选项)项)OKOK50PPT学习交流 调试法:P从大到小取值0.5,0.1,0.05,一般实际用时,Enter、Remove应多次选取调整51PPT学习交流解 释设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。当bi0时,对应的优势比(odds ratio,记为ORi):ORi=exp(bi)1,说明该因素是危险因素;当bi0时,对应的优势比ORi=exp(bi)0 0,即,

21、即exp(exp(i i)1)1:表明该变量每上:表明该变量每上一个等级比数比就在原来的基础上扩大一个等级比数比就在原来的基础上扩大exp(exp(i i)倍;倍;i i0 0,即,即exp(exp(i i)1)0 0,即,即exp(exp(i i)1)1:表明该变量每增:表明该变量每增加一个单位比数比就在原来的基础上扩大加一个单位比数比就在原来的基础上扩大expexp(i i)倍;倍;i i0 0,即,即exp(exp(i i)1)RiskVariable DF Estimate Error Chi-Square Chi-Square Ratio X2 1 1.2218 0.8410 2.1

22、107 0.1463 3.393 X3 1 2.2947 1.8072 1.6124 0.2042 9.922 采用Logistic逐步回归:Proc logistic;Proc logistic;model y=x1-x3/noint model y=x1-x3/noint selection=stepwise ale=0.5 sls=0.3;selection=stepwise ale=0.5 sls=0.3;Run;Run;56PPT学习交流Block 1:Method=Forward Stepwise(Likelihood Ratio)57PPT学习交流58PPT学习交流59PPT学习

23、交流60PPT学习交流61PPT学习交流62PPT学习交流在本例中不良饮食习惯X2,取值:0、1,2、3,b=3.021,OR=20.505,表示不良饮食习惯是危险因素;精神状况X3,取值:0、1、2,b=0.054,OR=1.161,表示精神状况不良影响发病,是危险因素。63PPT学习交流4.Logistic4.Logistic回归回归-Logistic-Logistic回归种类回归种类成组资料的非条成组资料的非条件件LogisticLogistic回归回归配对资料的条件配对资料的条件LogisticLogistic回归回归两分类反应变量的两分类反应变量的LogisticLogistic回归

24、回归多分类有序反应变量多分类有序反应变量LogisticLogistic回归回归多分类无序反应变量多分类无序反应变量LogisticLogistic回归回归1:11:1配对资料的条件配对资料的条件LogisticLogistic回归回归1:m1:m配对资料的条件配对资料的条件LogisticLogistic回归回归n:mn:m配对资料的条件配对资料的条件LogisticLogistic回归回归L Lo og gi is st ti ic c回回归归分分析析64PPT学习交流注意注意自变量是多分类(自变量是多分类(n n)无序变量时,需要先)无序变量时,需要先转换成转换成n-1n-1个哑变量,以

25、哑变量进行分析。个哑变量,以哑变量进行分析。自变量为连续变量时回归系数的解释。连自变量为连续变量时回归系数的解释。连续自变量是否转换成分组变量视具体情况而定;续自变量是否转换成分组变量视具体情况而定;65PPT学习交流例例现对乳腺癌患者的数据进行分析,其中的现对乳腺癌患者的数据进行分析,其中的变量包括年龄变量包括年龄(age)(age)、患病时间、患病时间(time)(time)、肿瘤、肿瘤扩散等级扩散等级(pathscat)(pathscat)、肿瘤大小、肿瘤大小(patsize)(patsize)、肿瘤史肿瘤史(histgrad)(histgrad)和癌变部位的淋巴结是否含和癌变部位的淋巴

26、结是否含有癌细胞有癌细胞In_yesnoIn_yesno,建立一个模型,对癌变部,建立一个模型,对癌变部位的淋巴结是否含有癌细胞的情况进行预测位的淋巴结是否含有癌细胞的情况进行预测.66PPT学习交流SPSSSPSS程序操作程序操作analyzeanalyzeregressionregressionbinary logisticbinary logistic dependent:In_yesno dependent:In_yesno covariates:age pathscat pathsize covariates:age pathscat pathsize time time histg

27、radhistgrad (自自(协协)变量变量)method:enter method:enter catergorical:pathscat histgrad(catergorical:pathscat histgrad(多分类协多分类协变量变量)change contrast:reference catergory first-change contrast:reference catergory first-chang(chang(多分类协变量类间多重比较及比较方法选择多分类协变量类间多重比较及比较方法选择)-continue-ok)-continue-ok 67PPT学习交流二分类二分

28、类LogisticLogistic回归回归多重比较的方多重比较的方法法Indicator第一类或最后一类为参照类,每一类与第一类或最后一类为参照类,每一类与 参照类比较参照类比较Simple-除参照类外,每一类与参照类比较除参照类外,每一类与参照类比较Difference-除第一类外,每一类与其前各类的平均除第一类外,每一类与其前各类的平均效应比较,有称反效应比较,有称反HelmertHelmertHelmert-除最后一类外,每一类与其后各类的平均除最后一类外,每一类与其后各类的平均Repeated相邻两类比较,除第一类外,每类与其前一相邻两类比较,除第一类外,每类与其前一 比较比较Poly

29、nominal正交多名义分类比较,该法假设每一分类正交多名义分类比较,该法假设每一分类都都 有相等的空间,仅适于数值变量有相等的空间,仅适于数值变量Deviation除参照类外,每一类与总效应比较除参照类外,每一类与总效应比较68PPT学习交流二分类Logistic回归多重比较的方法Referencecatergory参照类的选择,有第一类和最后一类两种参照类的选择,有第一类和最后一类两种选择。选择。Indicator、Simple、Deviation方法可选第方法可选第一类,也可选最后一类。一类,也可选最后一类。69PPT学习交流二分类二分类LogisticLogistic回归回归频数资料频

30、数资料分析分析例例 成组病例成组病例-对照研究。在饮酒与食道癌的病例对照研究。在饮酒与食道癌的病例-对照研究中,考虑到年龄可能是混杂因素,按对照研究中,考虑到年龄可能是混杂因素,按年龄分层后资料整理如下年龄分层后资料整理如下 变量标示变量标示 IDID病例病例:1 :1 对照对照:0:0 Drink Drink饮酒饮酒:1 :1 不饮酒不饮酒:0:0 Age Age年龄年龄 1(25-34),2(34-44),1(25-34),2(34-44),3(45-54),4(55-64),3(45-54),4(55-64),5(65-74),6(75-85)5(65-74),6(75-85)70PPT

31、学习交流二分类二分类LogisticLogistic回归回归频数资料频数资料分析分析表 饮酒与食道癌关系的研究资料年龄组 病例 对照饮酒 不饮酒 饮酒 不饮酒1 (25-34)2 (35-44)3 (45-54)4 (55-64)5 (65-74)6 (75-85)合计 1 0 9 106 4 5 26 16425 21 29 13842 34 27 13819 36 18 88 5 8 0 3196 104 109 66571PPT学习交流二分类二分类LogisticLogistic回归回归频数资料分析频数资料分析频数加权:频数加权:DATA-WEIGHT CASES-WEIGHT CASE

32、S BY DATA-WEIGHT CASES-WEIGHT CASES BY FREQFREQ-OK-OK ANALYZE ANALYZEREGRESSIONREGRESSIONBINARY LOGISTICBINARY LOGISTIC DEPENDENT DEPENDENT:IDID COVARIATES COVARIATES:DRINK,AGEDRINK,AGE MTHOD MTHOD:ENTER ENTER CATERGORICAL CATERGORICAL:AGEAGE CHANGE NTRAST CHANGE NTRASTREFERENCE CATERGORYREFERENCE C

33、ATERGORY FIRST FIRST -CHANGE-CONTINUE-OK-CONTINUE-OK72PPT学习交流LogisticLogistic回归回归多分类有序多分类有序LogisticLogistic回归回归(Binary Logistic(Binary Logistic RegressionRegression)特征特征因变量是多(因变量是多(k k水平)分类有序变量;水平)分类有序变量;每个水平建立一个回归方程;每个水平建立一个回归方程;自变量是连续变量或分类变量自变量是连续变量或分类变量.73PPT学习交流多分类有序多分类有序LogisticLogistic回归回归-实例分

34、实例分析析 例例 研究性别和两种治疗方法对某研究性别和两种治疗方法对某疾病疗效的影响。疗效的评价分为疾病疗效的影响。疗效的评价分为3 3个有序等级:显效、有效和无效,资个有序等级:显效、有效和无效,资料见下表,试用有序分类料见下表,试用有序分类logisticlogistic模模型进行分析疗效与性别和治疗方案的型进行分析疗效与性别和治疗方案的关系。关系。74PPT学习交流多分类有序多分类有序LogisticLogistic回归回归-实例分实例分析析表表 性别和两种治疗方法对某病疗效的影响性别和两种治疗方法对某病疗效的影响 性别性别 女女X1=0新药疗法新药疗法(X2=0)16 5 6 27 治

35、疗方法治疗方法疗效疗效(Y)显效显效(Y=1)有效有效(Y=2)无效无效(Y=3)合计合计传统疗法传统疗法(X2=1)6 7 19 32 新药疗法新药疗法(X2=0)5 2 7 14 传统疗法传统疗法(X2=1)1 0 10 11 男男X1=175PPT学习交流 DATA-WEIGHT CASES-WEIGHT CASES DATA-WEIGHT CASES-WEIGHT CASES BYBY FREQFREQ-OK-OK ANALYZE-REGRESSION-ORDINAL ANALYZE-REGRESSION-ORDINAL-DEPENDENT-DEPENDENT ID-ID-COVARI

36、ATE COVARIATE SEX,SEX,TREATTREAT-OK-OK76PPT学习交流77PPT学习交流78PPT学习交流LogisticLogistic回归回归多分类无序多分类无序LogisticLogistic回归回归特征特征因变量是多(水平)分类且各水平之间没有因变量是多(水平)分类且各水平之间没有递增或递减关系,即反应变量是多分类名义变量;递增或递减关系,即反应变量是多分类名义变量;每个水平建立一个回归方程;每个水平建立一个回归方程;自变量是连续变量或分类变量自变量是连续变量或分类变量.方法方法拟合一个通用拟合一个通用LogisticLogistic模型模型 (general

37、logistic model).(general logistic model).79PPT学习交流多分类无序多分类无序LogisticLogistic回归回归实例分实例分析析例例 19921992年美国总统选举的数据,候选人为年美国总统选举的数据,候选人为Bush(Bush(布布什什)、Perot(Perot(帕罗特帕罗特)、Clinton(Clinton(克林顿克林顿),评价分析,评价分析不同选民的投票情况。不同选民的投票情况。因变量:因变量:pred92pred92 自变量:自变量:eduedu:受教育程度:受教育程度 degreedegree:学历:学历 sexsex:性别:性别80P

38、PT学习交流多分类无序多分类无序LogisticLogistic回归回归实例分析实例分析变量标示变量标示因变量:因变量:Pres92 1=Bush2=Perot3=Clinton自变量自变量:sex1=famlae,2=maleedu0=0=高中以下高中以下 1=1=高中高中 2=2=大专大专 3=3=学士学士 4=4=研究生研究生81PPT学习交流多分类无序多分类无序LogisticLogistic回归回归实例分析实例分析SPSSSPSS程序操作程序操作 AnalyzeAnalyzeRegressionRegressionMultinomial Multinomial Logistic-De

39、penfent:Pres92-Logistic-Depenfent:Pres92-Factor:sex edu-OKFactor:sex edu-OK82PPT学习交流83PPT学习交流84PPT学习交流例3实战练习 据报道目前全世界每年的自杀率为1010万,我国自杀率为2310万,我国高校自杀率则为210万。为了了解当代大学生综合素质现状、为了进行提高大学生综合素质的对策研究,利用中国现场统计研究会教育统计与管理专业学会设计的中国大学生综合素质调查问卷,采用分层整群抽样,选择了不同年级、不同性别、不同专业以及不同生源的医学大学生554名的调查问卷,其中129人有过自杀的意念。应用 Logis

40、tic回归分析,探讨大学生有自杀意念的影响因素。85PPT学习交流部队3所院校,1121份有效问卷、地方3所院校1874份有效问卷。表6 各校有效问卷情况 单 位 有效问卷份数 军队:北京军医学院 554 海军工程大学 450 解放军信息工程大学 117 地方:同济医学院 778 中国科技大学 628 广西工学院 468 86PPT学习交流 1.1.各项目的名称及量化方法各项目的名称及量化方法 在中国大学生综合素质调查问卷中又增加的2个小题记为A01,A02。基本情况A共有21项,分别记为A1,A2,A21。当有的项目中又分为2项时再分别赋予不同的名称,如A10父母亲文化程度分为:父亲文化程度

41、A10.1、母亲文化程度A10.2。其它项目的名称以此类推。87PPT学习交流 利用EXCEL将调查问卷各项进行量化:有序的项目按照顺序赋值0,1,2,;两分类无序项目赋值0和1;多项无序和多选项目,根据例数多少进行合并成两项或引进哑变量。去掉了几项人数少或不容易量化的个别多选题:A9.1父亲职业、A9.2母亲职业、B16加入WTO后大学生最应具备的素质、B17在当代大学生中你认为普遍欠缺的东西、C10.1对学习吃力的再回答、C19.1决定考研者进一步需回答、C21.1-C21.3参与过科研或社会实践者进一步需回答的问题。最终确定的变量个数是:A类有22个、B类有17个、C类有38个、D类有3

42、2个、E类有20个,总计129个变量。88PPT学习交流 大学生产生自杀念头的影响因素和程度按入选顺序样本资料情况依次是:抚养人对其关爱是不关爱方向的0.326倍;考试作弊严重的是不作弊方向的1.405倍;当认定一个目标能够尽力去做并持之以恒 的是时做时不做方向的0.734倍;认为同学中考试作弊人数多的是少方向的 1.295倍;对自己心理素质的评价高的是低方向的 0.553倍;89PPT学习交流 对自己各方面的综合评价高的是低方向的 2.008倍;做事常半途而废是能坚持方向的1.732倍;家庭幸福度自我评定高的是低方向的0.699 倍;认为自己在学习上接受与理解能力强的是 不强方向的1.451

43、倍;身体健康状况较好是较差方向的0.688倍。90PPT学习交流 对自己心理素质评价低、身体健康状况差、做事常半途而废、认为同学中考试作弊人数多、认为考试作弊是严重的、抚养人对其不关爱、家庭不幸福、认为自己在学习上接受与理解能力强、身体健康状况差、当认定一个目标不能持之以恒者,容易产生自杀的念头。归纳起来主要是:个人精神健康问题、生长环境两大因素。91PPT学习交流Logistic 回归的注意事项1.变量的取值形式 在作危险性因素分析时,以定性资料的形式出现为好。2.样本含量要足够大 一般地:病例与对照研究应至少各有30-50例,且变量越多例数也要增多;配对资料样本的匹配组数应为纳入方程中自变量个数的20倍以上。3.3.大多数情况下模型的大多数情况下模型的常数项常数项没有多大的意义,所没有多大的意义,所以不用对常数项作解释;以不用对常数项作解释;4.4.条件条件LogisticLogistic回归不能用于预测回归不能用于预测.92PPT学习交流谢谢!93PPT学习交流此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!94PPT学习交流

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!