工程资料分析-EDA.ppt

上传人:max****ui 文档编号:15469318 上传时间:2020-08-11 格式:PPT 页数:57 大小:3.95MB
收藏 版权申诉 举报 下载
工程资料分析-EDA.ppt_第1页
第1页 / 共57页
工程资料分析-EDA.ppt_第2页
第2页 / 共57页
工程资料分析-EDA.ppt_第3页
第3页 / 共57页
资源描述:

《工程资料分析-EDA.ppt》由会员分享,可在线阅读,更多相关《工程资料分析-EDA.ppt(57页珍藏版)》请在装配图网上搜索。

1、工程数据分析 Engineer Data Analysis,2,成语教学,【管窥蠡测】,2,东汉班固汉书东方朔传 “以管窥天,以蠡测海,以莛撞钟,岂能通其条贯,考其文理,发其音声哉。” (莛:ting草茎),管:竹管。蠡:贝壳做的瓢。 原意是竹管里看天,用瓢测量海水。 引申意思是比喻对事情的观察了解很狭隘很片面。,3,你是否经常听到这样的话,有没有什么办法可以让你的推论更加准确呢?,给定一组片面的信息或数据,统计学可以摘要并描述这份数据,观察者并以此份数据推论母体。,【统计学的定义】,课程大纲,4,基础统计学 假设检定 变异数分析(ANOVA) 简单回归分析,基础统计学的模型,母体:具有共同特

2、征之个体所组成的群体。 样本:由母体中抽取之部分个体所组成的小群体。 参数:用来描述母体的特征值。 统计量:由样本计算得出的特征值。,5,南京广播中心报道: 近日,南京市抽样调查了5000位市民的体重状况,得知目前南京市民中有60%的体重高于标准水平。且超重主要发生在50岁以上人群。,基础统计学,6,误差,减少误差第一要务: 抽样要够随机!,基础统计学(统计量符号),7,抽样方法,三种估计 的方法,三种估计 的方法,数据收集(练习),8,常用统计量EXCEL操作,9,1.工具数据分析描述统计,2. EXCEL中, Var. 的操作为 VAR() S 的操作为 STDEV() 的操作为 AVER

3、AGE() 的操作为 QUARTILE( ,2) Mo的操作为MODE(),10,通过统计学的计算,我们可能得到 1.第一组人均身高是 2.第三组身高的标准差是 3.某机种12月白班的平均良率是 4.新人的XX周XX周每小时平均产出是,这时,我们需要了解数据母体的分布状态,需要进行对比才能了解真实的状况,课程大纲,11,基础统计学 假设检定 变异数分析(ANOVA) 简单回归分析,改善的漏斗,12,八大步骤+品管工具 SPC 统计制程管制 发现问题,运用品管工具加以分析找出要因。,EDA 工程数据分析 将要因以客观的统计手法加以验证其真实性。,DOE 田口实验设计 以实验手法设定要因的水平,找

4、出最佳化组合。,假设检定(目的),13,假设检定,提供一个以统计理论 做为基础的证据!,1. 请 5 位帅哥、5 位美女上台,2. 大声地报出自己的身高,3. 以直觉或经验看看男女之间的身高是否有差异?,4. 如何证明两者之间的差距?,假设检定(流程),14,1. 建立虚无假设及对立假设。 (单尾检定或双尾检定),2. 设定显著水准,亦即决定型一误差。,3. 选择合适的检定统计量。,4. 计算检定统计量。,5. 以P-value或显著值判定拒绝或接受。,假设,检定,建立假设,15,统计假设是将可能的状况划分为二个互斥的集合,而构成二个互斥的假设。 H0:虚无假设 H1:对立假设 检定的种类 单

5、尾检定: 右尾检定:假设群体母数可能变大的检定。 左尾检定:假设群体母数可能变小的检定。 双尾检定: 假设群体母数可能变大或变小的检定。,双尾检定 右尾检定 左尾检定 H0: 5 H0: 5 H0: 5 H1: 5 H1: 5 H1: 5,设定显著水准,16,显著水准,表示的是发生型一误差的机率 即:虚无假设是正确的,但判为拒绝。 相对应的,表示的是发生型二误差的机率 即:虚无假设是错误的,但判为接受。,显著水准,17,临界值,临界值, 决定了此分配的临界值, 是 “接受”或“拒绝” H0假设之判断基准 值的大小无一定的标准,一般采用=5% 值越小,表示错杀的机率越小 重要的判断 值应设越小(

6、=1%),P-value 检定法,18,临界值 (Critical Value),接受域,拒绝域,P-Value 拒绝H0,P-Value 不拒绝H0(亦即接受),检定的结果,19,反之则表示拒绝H0,表即示判定H0可能错误。,如右图所示,当计算出结果P-value时,接受H0,即表示无充分证据显示H0错误。,P-value,检定的应用-T检定,20,例1:某圈组的改善主题为提高生产力,怀疑新人作业时间长可能是真因,于是测量数据如右表。(已知:标准人均产能为12),结论:计算得出平均值为10.8,与标准人均产能相差不大,故新人效率低不是生产力低的影响因素。,检定的应用-T检定,21,Ho:A=

7、12 v.s H1: A 12 =0.05,P-value 拒绝H0 新人人均产能不等于标准人均产能,由样本 计算而得,假设,检定,检定的应用-T检定,22,例2:某厂计划提高机台产出,怀疑不同机台间可能存在差异于是选了A、B两个机台分别测量几个时段的产量,记录如右表,A机台平均值:100 B机台平均值:105,结论:B机台产量比A机台多5,而且整体数据均比A大。所以B机台产出高于A机台。,检定的应用-T检定,23,假设,检定,H0:A=B v.s H1: AB =0.05,由样本 计算而得,P-value 不拒绝H0 无充分证据说明AB机台有差异,24,接下来,给大家5秒时间仔细 看看刚刚的

8、画面,25,假设,检定,H0:A=B v.s H1: AB =0.05,由于计算公式有很大的差别,所以在选用时需要借助其它的工具!,P-value 不拒绝H0 无充分证据说明AB机台有差异,找出不同的地方,检定的应用-F检定,26,例3:某设备厂商声称新款机台的稳定性要远远优于老款机台,分别对各自生产的10个产品某一特性(规格中心1.35)进行测量,结果如右表。,从数据上判断,如果是你,会选择买新款的机台么?,检定的应用-F检定,27,假设,检定,H0:新= 老 v.s H1: 新 老 =0.05,P-value 不拒绝H0 无充分证据说明新老机台有差异,两母体平均数检定,28,1.双样本等方

9、差假设,2.双样本异方差假设,T检定,F检定,双样本方差检定,不相等,相等,学员实作(15%),29,Ho:A B v.s H1: A=B =0.05,结论:由于1.430.05,所以新老人没有差异,找出左边案例的错误,学员实作(15%),30,Ho: v.s H1: = P-Value =,结论: 会打球的果然比较高 其实没差别,请 5 位有打篮球、5 位没打篮球的男生上台 大声地报出自己的身高 刻板的印象告诉我们,篮球员身高应该比较高 请使用假设检定提供有力的证据!,T检定-成对双样本,31,T检定中较为特殊的一种。 使用条件:检定单一母体成对样本平均数的变化 (例:同一母体改善前后的差异

10、),T检定-成对双样本,32,例4:某一药剂研究所进了一项降压药的实验,先记录12位大专性学生的初始血压,然后在服用此药个月后,再测其血压。根据观察结果,得出右表的资:,你觉得这种降压药有效吗?,T检定-成对双样本,33,假设,检定,H0:前=后 v.s H1: 前后 =0.05,由样本 计算而得,P-value 拒绝H0 服药前后血压有差异。,学员实作(15%),34,结论: 有差异 无差异,Ho:前=后 v.s H1: 前后 =0.05,统计检定方法分类,35,检定 平均数,两组 相关样本,两组 独立样本,检定 变异数,一组 样本,不相等,相等,未知,已知,未知,已知,t test,Z t

11、est,双样本同方差T,双样本异方差T,F test,2test,Z test,检定 平均数,检定 变异数,成对双样本T,课程大纲,36,基础统计学 假设检定 变异数分析(ANOVA) 简单回归分析,变异数分析( ANOVA ),37,通过前面的学习,假设检定可以判别两母体之间的平均数和变异数是有否差异。当母体为三个或者更多的时候?,变异数分析(Analysis of Variance),变异数分析 用来分析一个因子不同水准之间是否存在差异,以及两因素子中哪个对于特性起显著影响。,用检定的方法,两两检定,变异数分析,38,例5:已知有A、B、C三种机台,计划分析它们之间的每小时产量是否存在差异

12、,分别对其5个时段的产量进行记录。如下表,此例题中,因子是机台; 水准是A、B、C三种; 实验次数是5次。,单因子变异数分析,39,假设:H0:A=B=C H1:i不全相等 (i=1k) =0.05,使用软件:Excel工具资料分析 单因子变异数分析,单因子变异数分析,40,假设:H0:1=2=K= H1:i不全相等 (i=1k) =0.05 k:水准数。因子为机台,水平有A、B、C三种机台,则 k=3。 n:实验次数。各水平进行5次实验,共15次实验,则 n=15。,公式,学员实作(20%),哪一组的男生比较强壮? 请各组指派三位猛男!,41,俯地挺身(限时10秒),变异数分析,42,例6:

13、已知有A、B、C三种机台,五位作业员。分别对每个作业员在每个机台上作业的产量作记录,如下,此例题中,因子是机台、作业员; 水准是机台是三种,作业员五种; 实验次数是1次。,二因子变异数分析,43,B因子之假设 H0:1=2=3=4=5 H1:Bj不全等 (j=1r) =0.05,A因子之假设H0:A=B=C H1:Ai不全等(i=1k) =0.05,二因子变异数分析,44,B因子之假设H0:B1=B2=Br=H1:Bj不全等 (j=1r) =0.05,A因子之假设H0:A1=A2=Ak= H1:Ai不全等(i=1k) =0.05,公式,二因子变异数分析重复试验,45,请思考,有没有可能某人在某

14、个机台上就发挥的好?即,人员与机台间可能有交互作用?,此时,实验次数为2次,二因子变异数分析重复试验,46,P-value 不拒绝H0 无交互作用产生,B因子之假设 H0:1=2=3=4=5 H1:Bj不全等 (j=1r) =0.05,A因子之假设 H0:A=B=C H1:Ai不全等(i=1k) =0.05,交互作用之假设 H0:()ij=0 (i=1k) H1:()ij不全为0 (j=1r) =0.05,二因子变异数分析重复试验,47,A因子之假设H0:A1=A2=Ak= H1:Ai不全等(i=1k)=0.05,B因子之假设H0:B1=B2=Br= H1:Bj不全等 (j=1r)=0.05,

15、交互作用之假设 H0:()ij=0 (i=1k) H1:()ij不全为0 (j=1r) =0.05,公式,变异数分析注意事项,48,误差项变异过大,P-Value 无任何因子显著,1.规划实验时,需考虑交互作用之影响。 2.无任何因子显著时,误差项变异会过大,表示影响实验结果之主要原因未被考虑到,需重新检讨。,变异数分析注意事项(续),49,异常值需挑出,3.变异数分析前需分析组内之数据是否存有异常值。,4.变异数分析后可探讨何种水平具有较佳结果。 5.信心水平之选择,建议采 5% 或 1%,统计上的含意代表显著与非常显著。,课程大纲,50,基础统计学 假设检定 变异数分析(ANOVA) 简单

16、回归分析,QC7 图,51,可看出温度与落尘量的相关性,举手抢答加5分,QC7散布图(相关系数),52,可得上述案例之相关系数为 r =0.88,QC7散布图(相关性),53,r = 0.88 其呈现之关系为正相关,负相关,请列举出身边你认为相关的例子。 如:地势越高,气压越低。,54,散布图与回归分析,55,散布图可观察其相关性。回归分析可藉由计算两变量之线性关系 求出回归方程式,并据此方程式推估未进行实验之值。,回归方程式,56,由Excel报表可得回归方程式: y = x+= 0.15x-78.82 依据此方程式可进行最佳解的预测。 代入X(温度)可预测Y(落尘量),相关系数,回归方程式(回归线检定),57, ,P-value 拒绝H0 温度可以解释落尘量,用于检定此模型是否显着。 H0:温度无法解释落尘量 H1:温度可以解释落尘量,用于检定、是否为零。 H0:= 0 v.s H1: 0 H0:= 0 v.s H1: 0,P-value 拒绝H0 不为零,P-value 拒绝H0 不为零,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!