糖尿病治疗效果的评价分析.pdf

上传人:小** 文档编号:16730657 上传时间:2020-10-22 格式:PDF 页数:20 大小:729.21KB
收藏 版权申诉 举报 下载
糖尿病治疗效果的评价分析.pdf_第1页
第1页 / 共20页
糖尿病治疗效果的评价分析.pdf_第2页
第2页 / 共20页
糖尿病治疗效果的评价分析.pdf_第3页
第3页 / 共20页
资源描述:

《糖尿病治疗效果的评价分析.pdf》由会员分享,可在线阅读,更多相关《糖尿病治疗效果的评价分析.pdf(20页珍藏版)》请在装配图网上搜索。

1、糖尿病治疗效果的评价分析 摘要 许多非重症监护室级别的病人的血糖指标没有受到严格的监视,但血糖的波 动会对病人的安全造成一定的影响,所以对医院进行糖尿病治疗模式评估,能够 给医院未来努力方向提供建议。 针对问题一和问题二,由于对糖尿病治疗效果的影响因素很多,首先对题中 所给数据字符数字化,采用主成分分析,提取出 8 个主成分,以此为基础构建评 价模型,对糖尿病患者治疗效果选取评价指标。对于问题二,首先对数据预处理, 删去残缺度大的数据,根据 9icd 编码范围将疾病类型分为 19 组,统计各组的频 数计算其百分比。 针对问题三和问题四,分别统计各特征变量中各类的频数,计算其概率,年 龄符合正态

2、分布并通过检验,根据问题二中的分组分别计算再次入院率,求得总 体均值置信水平为 0.95 的置信区间为 4673.0,4074.0 ,对于问题四,分别计算不 同特征变量下的再次入院率,选取了年龄、药物数量两个指标分别与各自再次入 院率拟合,年龄在 20-30、 70-90 岁之间,药品种类在 4-6 种之间的再次入院率较 高,但随着药品种类 的增加再次入院率逐步降低。 针对问题五,等间隔抽取 4974 个病人数据,采用秩和比综合评价法对治疗 模式评价,将评价结果分为六个等级,分别分析每个等级的治疗模式,适当增加 药品数量,尽量在 20 岁之前, 40-60 岁之间得到治疗能够降低再次入院率 ,

3、 降低 治疗成本。 关键字 大数据 治疗模式评价 秩和比综合评价 主成分分析 一、问题重述 控制住院病人的血糖水平对降低发病率和死亡率有重要作用。按照传统方 式,住院病人的管理比较随意,会导致各种各样的问题,因此需要对现有医院的 病人糖尿病治疗效果进行评估。根据附件中 美国 130 家医院糖尿病的治疗数据对 治疗模式进行评估,并提出合理建议。 利用数学建模,解决以下问题: ( 1)分析确定合理的评价指标体系,用来评价医院对糖尿病患者的治疗效 果。 ( 2)对数据进行预处理,并对各种疾病类型进行分组,并给出它们诊断值 的范围以及所占的比例。 ( 3)求出就诊病人性别、年龄、种族、出院去处、入院来

4、源、糖化血红蛋 白含量、葡萄糖血清检测等特征变量的概率分布,并求每类病人的再次入院率及 其置信区间。 ( 4)分析再次入院率与各特征变量的关系,并分析糖化血红蛋白检测等因 素对再次入院率的影响。 ( 5)对医 院治疗模式进行评价,并就如何提高再次入院率、提高治病效率 和效果给出合理建议。 二、问题分析 问题一需要选取合适的指标来评判医院糖尿病的治疗效果,可以先选出一些 有可能作为评判标准的自变量,再进行主成分分析,得到几个综合评价指标,这 几个指标组成的就是效果的评价体系。但是在此之前需要将一些重要的文字类型 自变量转化为字符,再进行处理。 问题二首先要进行预处理,主要是删去一些残缺度较大的数

5、据以及一些利用 率很低的药物数据,再参照 9icd 码的范围 分成 19 个 组,统计各组的频数和所占 的百分比。 问题三根据大数定理可以认为得到的频率等于概率,因此对涉及到的变量数 据进行统计,可以得到它们的概率分布图。根据第二问的分组,每个组计算出一 个再次入院率,最后总体求解它的置信区间。 问题四要想探求各个特征变量与再次入院率之间的关系,可以分别画出它们 的关系图,然后根据图形分析这些变量对再次入院率的影响。 问题五是建立体系评价糖尿病治疗模式,可以先对每个病人分析,但是病人 数量太多,因此等间隔选取 4974 个来研究,利用秩和比综合分析得到医院对每 个人的治疗效果等级,根据各个 等

6、级占的比例评判治疗模式的好坏。降低住院率 和节约住院成本等问题,可以从这五问的答案中总结分析。 三、模型假设 1.假设除题中所给因素外,其他因素对糖尿病治疗效果影响很小。 2.假设题中诊断值大小与实际误差不大。 3.假设题中所给病人数据是随机排列的,等间隔抽取的病人数据能够反应总 体情况。 四、符号说明 符号 含义 x y z 年龄 再次入院率 药品数量 五、模型的建立与求解 5.1 问题一的模型建立和求解 5.1.1 字符赋值 根据题意,需要选出几个指标来评判一个医院的治疗效果,考虑到一些指标 不是数字,因此先将其数字化,数字化的方式为: .对于药类,未服用为 0 ,持续服用为 1,增大剂量

7、为 5.1 ,减小剂量为 5.0 。 .患有糖尿病为 1未患有为 0 ,同理再次住院为 1,不再次住院为 0 ,服药 后有变化为 1,没有变化为 0 ,性别男为 0 ,女为 1。种族方面,白种人为 1,黑 人为 2 ,西班牙人为 3 ,亚洲人为 4 ,其他人种为 5 。 .年龄取年龄段的中间值,例如 20,10 选取 15为它的值。 .对于糖化血红蛋白含量,查阅 1资料 可知,有以下评判标准: 表 1 糖化血红蛋白等级表 糖化血红蛋白的标准 等级状态 6,4 正常( norm ) 7,6 理想( none ) 8,7 一般 9,8 不理想 因此取 none 为 5.6 , norm 为 5 ,

8、 7 取 5.7 , 8 取 5.8 。 5.1.2 选取指标 对病人年龄、性别、住院时间等 13 个重要指标指标进行主成分分析,得到 的累计贡献率表如下 表 2 累计贡献率表 解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 1.933 14.870 14.870 1.933 14.870 14.870 2 1.486 11.429 26.299 1.486 11.429 26.299 3 1.415 10.885 37.184 1.415 10.885 37.184 4 1.147 8.825 46.009 1.147 8.825

9、46.009 5 1.048 8.062 54.071 1.048 8.062 54.071 6 0.976 7.505 61.576 0.976 7.505 61.576 7 0.942 7.247 68.824 0.942 7.247 68.824 8 0.860 6.619 75.443 0.860 6.619 75.443 9 0.793 6.097 81.539 10 0.735 5.655 87.194 11 0.691 5.313 92.508 12 0.506 3.895 96.403 13 0.468 3.597 100.000 由表可知,前八个主成分的累计贡献率达到了 %7

10、5 ,因此选取前八个为主 成分,又根据成分矩阵(具体矩阵见附录 1)可以大致看出,对于选出的八个主 成分,每个用对其贡献最高的那个成分代替,因此选出的指标为年龄、性别、出 院去处、糖化血红蛋白含量、药物数量、是否再次入院、住院时间 和住院次数共 八个指标。因此选取这八个指标组成评价体系,根据此评价体系便可以对医院的 治疗水平进行评价。 5.2 问题二的模型建立和求解 5.2.1 数据预处理 对数据进行分析后发现,下面的数据应当删去: ( )体重和付款人代码两列数据缺失率达到 50%,不便于进行分析,因此 将这两列删去。 ( )药物中有几种利用率很低甚至完全没有人服用,需要删去。 ( )种族、医

11、师专业和性别是比较重要的特征变量,因此将残缺这三个变 量的行删去。 ( )分组的基准是诊断的结果,因此将诊断一二三存在未知数据的行删去。 5.2.2 分类 筛选 之后数据还剩下 49734 项。由数据可以看出,病人的诊断次数有多次, 但是给出的数据只有三组,假设最后一次诊断代表确诊,因此利用最后一组数据 对病人的疾病类型进行分组。 根据 2查阅 的 9icd 编码可以将疾病类型分为 19 组,它们的 9icd 码的范围、 频数和所占百分比如下。 表 3 分组数据 组 别 9icd 码范围 频数 所占百分比 1 001-139 931 1.87 2 140-239 911 1.83 3 240-

12、279 13513 27.17 4 280-289 1223 2.46 5 290-319 1568 3.15 6 320-359 728 1.46 7 360-389 139 0.28 8 390-459 15003 30.17 9 460-519 3163 6.36 10 520-579 1702 3.42 11 580-629 2736 5.50 12 630-676 187 0.38 13 680-709 1242 2.50 5.3 问题三的模型建立与求解 5.3.1 概率分布 根据 3大数定理 可知,一个随机事件重复很多次,每个事件发生的频率近似 等于它的概率,本题中的有效数据接近

13、50000 个,因此可以用频率代替概率,从 而可以通过分别统计每个变量各个条件发生的频率得出它们的概率分布 5.3.1.1 年龄、性别和种族 对性别和种族分别进行统计,可以求得它们的概率分布图如下: 从图中 可以看出,在患糖尿病的人群中,男女比例相当,女性占的比重大一 点。对于人种,从数据上看白种人患病的概率比黑种人和亚洲人要大,这与美国 整个国家的人口种族比例有一定的关系,不能简单的认为白种人患病率较高。 统计年龄的频次,得到的概率分布图如下。 14 710-739 1038 2.09 15 740-759 35 0.07 16 760-779 0 0.00 17 780-799 2255

14、4.53 18 800-999 928 1.87 19 E 和 V 代码 2432 4.89 图 1 人种和性别概率分布 在年龄结构上,患病的人群集中在中老年人和老年人当中, 20 岁以下占的 比例很小。从整体上,猜测年龄服从正态分布,下面利用 Q-Q 图进行 4检验 , 利用 spss 得到下图: 由上图可以看出,各 个点与直线比较接近,可以认为服从正态分布。 5.3.1.2 住院天数、入院来源和出院去处 根据附表中的分组信息,得出的概率分布表如下(考虑到一些指标所占比太 小,因此将其剔除) 图 2 年龄概率分布 图 3 检验 Q-Q 图 0.63 0.02 0.13 0.01 0.01 0

15、.10 0.01 0.02 0.02 0.02 0.02 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 1 2 3 4 5 6 7 11 18 22 25 出院去向概率分布 0.34 0.03 0.01 0.03 0.50 0.08 0.00 0.10 0.20 0.30 0.40 0.50 0.60 1 4 5 6 7 17 入院来源概率分布 入院来源大多数集中在了方式 1 和方式 7,对应的方式为医生转诊和急诊, 出院的去向几种在方式 1、方式 3 和方式 6,表示的是出院回家、转入 SNF 病房 以及回家疗养。住院天数在 3 天之内的占大多数,之后随着时

16、间的延长逐渐减小。 5.3.1.3 初次诊断结果 按照与问题二相同的方法进行分组,可以得到下面的概率分布图 图 4 入院和出院概率分布 图 5 住院时间概率分布 0.024 0.036 0.107 0.010 0.028 0.009 0.003 0.306 0.091 0.086 0.045 0.008 0.025 0.061 0.001 0.076 0.067 0.018 0.000 0.050 0.100 0.150 0.200 0.250 0.300 0.350 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 17 18 19 初次诊断结果概率分布 根据概率分布可

17、以 看出,组别 8 也就是循环系统疾病在初次诊断结果占的比 重最大,而糖尿病所属的组别 3 比例仅占 10%,由此看出误诊率较高,诊断效果 有待改进。 5.3.1.5 糖化血红蛋白检测和血清监测 统计血红蛋白和葡萄糖血清含量各个等级的数据,画出的概率分布图如下: 0 . 0 4 3 0 . 8 3 0 0 . 0 4 0 0 . 0 8 7 0.000 0.100 0.200 0.300 0.400 0.500 0.600 0.700 0.800 0.900 norm none 7 8 HbA1c 概率分布 0.943 0.030 0.017 0.010 0.000 0.100 0.200 0

18、.300 0.400 0.500 0.600 0.700 0.800 0.900 1.000 none norm 20 0 300 葡萄糖血清含量概率分布 5.3.1.6 诊疗医师的专业 诊疗医师的专业类型比较复杂,因此需要先初步进行分类,将一些小类归为 一大类,最终共分为 19 组,经过统计得到的概率分布图如下: 图 6 初次诊断结果概率分布 图 7 检测概率分布 0.007 0.011 0.002 0.022 0.017 0.013 0.150 0.017 0.015 0.281 0.144 0.032 0.097 0.008 0.105 0.015 0.050 0.015 0.000 0

19、.050 0.100 0.150 0.200 0.250 0.300 儿科 肠胃科 耳鼻喉科 放射科 肺科 妇产科 急救 精神科 内分泌科 内科 全能医师 肾脏科 外科 康复科 心脏科 血液科 整形美容科 其他 诊疗医师的专业概率分布 5.3.1.7 再次入院的置信区间 根据问题二的分组,统计出每个组的再次入院率,得到的表格如下: 表 4 各组再次入院率表 组别 人数 再次入院人数 再次入院率 1 931 415 0.406 2 911 386 0.424 3 13513 5736 0.424 4 1223 556 0.455 5 1568 684 0.436 6 728 322 0.442

20、7 139 62 0.446 8 15003 6895 0.460 9 3163 1545 0.488 10 1702 819 0.481 11 2736 1308 0.478 12 187 41 0.219 13 1242 638 0.514 14 1038 437 0.421 15 35 15 0.429 16 0 0 0 17 2255 1010 0.448 18 928 395 0.426 19 2432 1059 0.435 对所得的 18 个数据(将 16 组的数据去除)求它们的均值和标准差可得 图 8 诊疗医师专业概率分布 4373.0X , 0602.0 置信区间的表达式为 n

21、zX 2 ( 1) 当置信度为 95%时, 05.0 ,查表可得,此时的 96.1 2 z 将数据代入公式( 1)可以求得再次入院率在置信水平为 0.95 的置信区间为 4673.0,4074.0 。 5.4 问题四的模型建立和求解 题目要求建立再次入院率与各特征因素之间的关系,并且分析它们之间的影 响,因此选取性别,年龄,种族,糖化血红蛋白,葡萄糖血清检测,药品数量及 初次诊断结果为特征因素,将他们对应的再次入院率统计出来,通过建立回归模 型发现其关系并解释影响。 5.4.1 性别与再次入院率的关系 将预处理后的表格进行统计整理,得到如下结果: 表 5 性别与再次住院率数据 性别 总人数 再

22、次住院人数 再次住院率 男 22817 10031 0.439 女 26917 12286 0.456 从表格可以看出,女性的再次入院率比男性要略高,表明性别对再次入院率 有一定的影响,女性复发再次入院的概率要比男性要大一些。 5.4.2 年龄与再次入院率的关系 整理预处理过的表格,对各个年龄段的数据进行统计,得到的结果如下: 表 6 性别与再次入院率数据 年龄段 年龄点 总人数 再次住院人数 再次住院率 0,10) 5 52 12 0.230 10,20) 15 285 117 0.410 20,30) 25 812 351 0.432 30,40) 35 1909 786 0.411 40

23、,50) 45 4985 2228 0.446 50,60) 55 8693 3731 0.429 60,70) 65 11013 4907 0.445 70,80) 75 12709 5965 0.469 80,90) 85 7950 3693 0.464 90,100) 95 1326 527 0.397 选取每个年龄段的中位数作为代表该年龄段的数,根据统计表建立多项式回 归方程,用 MATLAB 作图如下: 10 20 30 40 50 60 70 80 90 0 . 2 5 0 . 3 0 . 3 5 0 . 4 0 . 4 5 年龄 再次入院率 y v s . x 再次入院率与年龄

24、得到的回归方程为: 09964.003285.0001107.01052.110201.7 23548 xxxxy ( 2) 此回归方程的均方差 SSE 值为 0.001576,趋近于 0, R 值为 0.9625,趋近于 1,两个指标都说明此方程拟合良好。 根据上述图表与关系式可以看出,总体上年龄与再次入院率的关系为年龄偏 小或偏大的再次入院率低,年龄在中间范围的再次入院率要偏高,具体表现为从 0 到 20 岁的再次住院率逐渐上升, 20 到 80 岁相对稳定, 80 至 100 岁的再次住 院率逐渐降低,其中 70 到 85 这段比例最高。我们分析发生这种现象的原因可能 是年龄较小的青少年

25、 身体恢复能力较快,越早治疗疗效越好,中间年龄段相对要 稳定,而 80 岁以上的人再次入院率也要降低是因为他们在家去世,没有坚持到 再次住院。 图 9 再次入院与年龄拟合图 5.4.3 种族与再次入院率的关系 通过统计再次住院人数,得到的统计表如下: 表 7 种族与再次入院率数据 从统计结果可以看出 ,白种人的再次入院率要相对高一些,其次是西班牙人 黑种人,最后是以亚洲人为代表的黄种人,这种结果可能是饮食,身体素质等方 面的不同造成的。 5.4.4HbA1C 与再次入院率的关系 依然利用第一问的赋值字符,统计得到下表: 表 8 糖化血红蛋白入院率数据 HbA1C 检测 HbA1C 检测值 总人

26、数 再次入院人数 再次入院率 None 5 2154 858 0.398 Norm 6.5 41258 18702 0.453 7 7.5 1978 847 0.428 8 8.5 4344 1910 0.439 通过表格可以发现,理想状态下的再次入院率最高,其余状态随着糖化血清 蛋白的增加而上升,这是可能是因为经常检查的人可以得以很好的掌握病情并治 疗到理想状态,而别的不理想的则是由于再次复发等状况而入院。 5.4.5 葡萄糖血清监测与再次入院率的关系 表 9 葡萄糖血清检测与再次入院率 葡萄糖血清检测 总人数 再次住院人数 再次住院率 None 46897 20880 0.445 Norm

27、 1476 718 0.486 200 842 444 0.527 300 519 275 0.529 从表可以看 出,在葡萄糖血清检测为理想状态下的再次入院率是最低的,接 下来是正常范围内,然后是超标状态,表明再次住院率与血清含量成比例关系, 随着血清含量的增大,再次住院率也会上升。 种族 总人数 再次住院人数 再次住院率 白种人 36667 16633 0.453 西班牙人 1124 494 0.439 非洲裔黑种人 10683 4701 0.440 亚洲人 437 164 0.375 其他 823 325 0.394 5.4.6 药品数量与再次入院率的关系 根据药品的多少,将其分为 11

28、 组, 50 种以内的 5 个为一组, 50 以外的分为 一组,经过统计得到的数据如下: 表 10 药品与再次入院率 药物数量 组数 总人数 再次住院人数 再次住院率 1,5) 1 1589 501 0.315 5,10) 2 8999 3543 0.393 10,15) 3 14182 6382 0.450 15,20) 4 11678 5637 0.482 20,25) 5 6837 3354 0.490 25,30) 6 3443 1597 0.463 30,35) 7 1547 720 0.465 35,40) 8 696 309 0.443 40,45) 9 321 135 0.42

29、0 45,50) 10 144 54 0.375 50, ) 11 298 85 0.285 接着分析组数与再次入院率的回归关系,利用 matlab 拟合得到的图如 下 1 2 3 4 5 6 7 8 9 10 11 0 . 3 0 . 3 5 0 . 4 0 . 4 5 0 . 5 药品数量 / 种 再次入院率 y v s . x 再次入院率与药品数量 拟合得到的公式为 279.0017.0076.00295.00037.01033.21061.5 2345466 zzzzzzy 它拟合的均方差 41077.1 SSE , 9962.0R , SSE 值趋于零, R 值趋于 1, 因此拟合程

30、度好 。从图表可以发现,总体药物数量与再次入院率呈抛物线关系, 药物数量对再次入院率有很大影响。从这个看来,吃的药种类越多,效果越好, 同样吃的药越少,效果也好,但是我们还是要推荐比较少的药,然后靠像食疗这 样的方式来减少再次入院率。 5.4.7 初次诊断结果与再次入院率的关系 按照与问题二相同的方式分组,统计出每组的再次入院率表如下 图 10 药品数量与再次入院率 表 11 初诊结果与再次入院率 组数 初次诊断结果 总人数 再次住院人数 再次住院率 1 001-139 1185 505 0.426 2 140-239 1785 589 0.329 3 240-279 5325 2612 0.

31、490 4 280-289 506 250 0.494 5 290-319 1370 602 0.439 6 320-359 430 191 0.444 7 360-389 125 48 0.384 8 390-459 15223 7087 0.465 9 460-519 4548 2187 0.480 10 520-579 4255 1922 0.451 11 580-629 2249 959 0.426 12 630-676 412 87 0.211 13 680-709 1224 562 0.459 14 710-739 3020 1125 0.372 15 740-759 30 8 0

32、.266 16 760-779 0 0 0 17 780-799 3774 1635 0.433 18 800-999 3357 1514 0.450 19 E 和 V 代码 916 434 0.473 由表可以看出,在再次入院率存在的情况下,占比最低的是第 12 类,即妊 娠、分娩和产后综合症,再次入院率比较高的是 3,4 类, 即内分泌、营养、新陈 代谢及免疫系统疾病与血液及造血器官疾病,其余疾病的再次入院率要居中一 些,因此,患这些再次入院率高的病的病 人 要有耐心,这是比较正常的情况。 5.5 问题五的模型建立和求解 问题五要求对治疗效果进行评价,因此我们选取了第一问做出的主成分分析

33、结果作为评选标准,并且由于数据过于庞大,我们选取了其中 4974 个病患信息 做模式评价,其他的病患信息也可以应用这个评价。 5.5.1,模型建立 在算法的选择上,我们选取了 5秩和比法 进行评 价,此算法可以较为准确的 得到分档排序,和我们想要的评价系统相符。如下为秩和比法的步骤: .编秩 将 n 个评价对象的 m 个评价指标排列成 n 行 m 列的原始数据表,编出各 个指标对应的评价对象的秩,得到秩矩阵 mnijRR )( 。其中编制原则为最优值 为最高秩次,依次顺序排列,最差的编以 1。 .计算秩和比 (RSR)或加权秩和比 (wRSR) 计算公式为: m j iji mnRRSR 1

34、( 3) 其中 m 为指标数, n 为评价对象数, ijR 为第 i 行第 j 列元素的秩。 加权秩和比为: m j ijji nRwwRSR 1 ( 4) 其中 jw 为第 j 个评价指标的权重。 .计算概率单位 (Probit) 编制 RSR 频数分布表,列出各组(评价对象)的频数及累积频数; 确定各组的 RSR 的秩次范围 R 及平均秩次 R ; 计算累积频率 %100/ nR ,最后的累积值按 n411 校正; 查百分数与概率单位对照表,求得其所对应的 概率单位值 Probit。 .计算直线回归方程 以概率单位为自变量, RSR 为因变量,建立回归方程。 .分档排序 按照回归方程推算出

35、所对应的 RSR(wRSR)估计值对评价对象进行分档排 序。 5.5.2 模型求解 在本模块中,借助 MATLAB 进行求解,因数据过于庞大,此处不展示计算 结果,全部放置在附件里。 编秩 在本题中,将选取的 4974 个病患的 8 个评价指标排列成 4974*8 的矩阵 ijR , 并对各个指标对应的病患进行排序,编秩。 .计算加权秩和比 题目中涉及到的权 重是按照第一问中主成分分析得到的贡献率整理得来的, 计算它们的加权秩和比 wRSR。 计算概率单位 在 MATLAB 里代用公式得到累计频率,进一步解得概率单位 Probit,得到 的概率单位范围在。 .计算直线回归方程 以 Probit

36、 为自变量, wRSR 为因变量,求得回归方程为: 5001.0107658.2 6 p r o b itwR S R ( 5) .分档排序 用求得的回归方程推算出对应的 wRSR 估计值,按概率单位大小 3 作为第 六类,是效果最不好的, 34 是第五类, 45 为第四类, 56 为第三类, 67 为 第二类, 7 以上 为第一类,是效果最好的。 因此将这 4974 个病人按照 8 个指标分为了六个等级,一等级就是治疗模式 最好的,以此类推,统计到的各个等级的人数及占比如下 : 表 12 各等级人数 等级 人数 占比 一等 114 0.0229 二等 676 0.1359 三等 1697 0

37、.3414 四等 1698 0.3411 五等 676 0.1359 六等 113 0.0227 我们发现治疗效果的分布为正态分布,可以解释为,大多数的病人治疗效果 是一般的,治疗的特别好的与特别少的占比都相对要小,因此认为医院的治疗效 果 为一般,还有待继续改进,改进的方法为,适当增加药品数量,治疗尽量在 20 岁以前和 40-60 岁之间。 综上,结合各类数据的总结整理发现,住院率一方面体现在健康的情况下住 院检查,另一方面为病症复发导致再次住院,因此降低再次住院率可以通过定期 体检,降低再次复发的可能,同时注意平时的生活习惯,保证身体健康。在治疗 效率与效果方面,还是要控制糖化血红蛋白含

38、量在理想状态,并且不可以一昧的 追求药物数量,吃的药也不适宜特别多。在降低住院成本上,最直接的就是住院 时间与住院次数越少,住院成本越低。 六、模型优缺点分析 优点: 1.本文在原始数据的基础上进行预处理,整理统计,较为严谨准确。 2.本文各个问题之间相互联系,没有脱离题目本身,对每个问题都有了较为 具体的解答。 3.第五问采用了秩和比法评价治疗模式,结合了古典参数估计与近代非参数 统计的优点。 缺点: 基于原始数据进行统计与处理,运用基础的算法得到结论,没有运用比较先 进,特别高深的算法理论。 七、参考文献 1.美国糖尿病学会 (ADA)2016 指南 :糖尿病血糖控制诊疗标准 J.中国全科

39、 医学 ,2016,19(13):1555 2虞晓芬 ,傅玳 .多指标综合评价方法综述 J.统计与决策 ,2004(11):119-121. 3史建平 ,古丽扎尔 艾海提 ,刘万里 ,刘阳 ,潘侯梅 .秩和比法对某医院 10 年医 疗质量的综合评价与分析 J.中国卫生统计 ,2013,30(03):416-417+420. 4魏高文 ,黄丹丹 ,黄湘蓉 ,周生杰 ,彭桂阳 .糖尿病高危人群生命质量的综合评 价 J.实用预防医学 ,2008(05):1426-1427. 5温星来 ,乔巨峰 ,冯伟勋 .应用秩和比法综合评价医院科室的病床使用情 况 J.中国卫生统计 ,1999(05):41-43

40、. 八、附录 1.成分矩阵 成份矩阵 a 成份 1 2 3 4 5 6 7 8 种族 -.134 .110 .387 -.537 .295 -.001 .385 -.231 性别 .125 .443 -.077 -.510 .240 .674 -.341 -.047 年龄 .230 -.343 -.522 .034 .063 .068 -.098 .614 入院来源 .063 .201 -.251 -.350 -.114 .047 .080 .092 住院时间 .714 -.323 .218 -.047 .061 -.142 -.045 -.091 出院去处 .373 -.262 -.116

41、.682 .269 -.041 -.221 -.368 药物数量 .687 -.292 .314 .073 .720 .004 .010 -.108 门诊数量 .207 .298 -.120 .342 -.070 .352 .420 -.598 突发事件数量 .246 .010 .060 -.070 -.077 .080 .137 .421 住院数量 .422 -.612 -.021 -.137 -.109 -.121 .528 .132 糖化血红蛋白 结果 -.060 .055 .629 .275 .458 -.149 -.336 -.079 二甲双弧 -.043 -.114 .410 .3

42、82 -.160 .587 .026 .347 是否再次住院 .344 .617 -.113 .038 -.007 -.039 -.427 -.167 提取方法 :主成份。 a. 已提取了 8 个成份。 2.秩和比法求解代码 clc,clear b=load(病人数据 .txt); aw=; j=1; for i=4:10:49734 aw(j,:)=b(i,:); j=j+1; end w=aw(end,:); a=aw(1:end-1,:);%提取数据 a(:,2,8)=-a(:,2,8);%把成本型指标转换成效益型指标 ra=tiedrank(a);%对每个指标值分别编秩,即对 a的每一

43、列分别编秩 n,m=size(ra);%计算 ra 的维数 RSR=mean(ra,2)/n; %每一行求平均值,计算秩和比 W=repmat(w,n,1); WRSR=sum(ra.*W,2)/n; %计算加权秩和比 sWRSR,ind=sort(WRSR); %对加权秩和比排序 p=1:n/n; %计算累计频率 p(end)=1-1/(4*n); %修正最后一个累计频率, Probit=norminv(p,0,1)+5 ; %计算标准正太分布的 p 分位数 +5 X=ones(n,1),Probit; %构造一元线性回归分析的数据矩阵 ab,abint,r,rint,stats=regress(sWRSR,X); %一元线性回归分析 WRSRfit =ab(1)+ab(2)*Probit; %计算 WRSR 的估计值

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!