家用电器故障实时检测

上传人:仙*** 文档编号:32939989 上传时间:2021-10-16 格式:DOC 页数:15 大小:498.01KB
收藏 版权申诉 举报 下载
家用电器故障实时检测_第1页
第1页 / 共15页
家用电器故障实时检测_第2页
第2页 / 共15页
家用电器故障实时检测_第3页
第3页 / 共15页
资源描述:

《家用电器故障实时检测》由会员分享,可在线阅读,更多相关《家用电器故障实时检测(15页珍藏版)》请在装配图网上搜索。

1、第十届华中地区大学生数学建模邀请赛承 诺 书我们仔细阅读了第十届华中地区大学生数学建模邀请赛的竞赛细则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们的参赛报名号为: 参赛队员 (签名) :队员1: 队员2: 队员3: 湖北省工业与

2、应用数学学会第十届华中地区大学生数学建模邀请赛组委会第十届华中地区大学生数学建模邀请赛编 号 专 用 页选择的题号: 参赛的编号: (以下内容参赛队伍不需要填写) 竞赛评阅编号: 第十届华中地区大学生数学建模邀请赛题目: 家用电器故障实时检测 【摘 要】本文就家用电器的故障问题,根据传感器的异常数据,对其提出了一种实时检测的方案。对于问题一,我们在查阅了相关资料后,首先分析了异常数据的来源,并将其分为两类,一类是粗大误差或者无意义误差(如测量仪器存在的不精确性、外界环境的干扰等);另一方面是有意义误差,主要是数据来源异常。然后我们对检测异常数据的意义进行了阐述,再选用了Douglas Hawk

3、ins的异常定义对其进行了本质上的解释,最后总结了检测并剔除(主要为无意义)异常数据的方法。对于问题二,由于数据庞大,所以可以利用不同参数之间的相关性情况对数据进行筛选,从而简化模型。由于是实时检测,所以我们先去掉不随时间变化的参数,再去掉非数值类参数,用SPSS对余下参数做降维处理,选出最影响结果的参数,分别为A2、A3、A4、A5、A6、A7,对这6个参数作相关性分析,发现它们存在相关关系,适合做故障分析。于是有如下方程:Ki=1100j=16Xij-2其中Ki为非故障系数,当Ki大于标准距离时,我们认为数据故障;反之则认为数据非故障。对于问题三,将工作环境C(正常)和工作环境C(有故障)

4、的数据带入之后,我们发现问题二中建立的模型失效了,说明根据附件一所建立的模型并不适用于附件二。我们认为产生这种现象的原因是正常圆的半径取得过大,导致一部分偏离幅度不大的异常数据被我们包含在了正常范围之内。于是我们对作为标准的六个参数的异常程度进行了加权处理,在修改了模型之后,该模型对于工作环境A、B、C均适用,于是我们认为这样的修改是合理的。用修改后的模型进行验证,我们判断工作环境D、E均正常。对于问题四,由于在筛选数据过程中舍弃了很多异常数据,所以可能会出现误判,且更易出现将故障判断为正常的情况,这种情况更应该避免。可以加入异常数据的平均值这一影响因子提高模型准确度。对于问题五,在问题二的解

5、答过程中,我们发现,有的参数对于故障判断的影响程度几乎可以忽略不计,所以我们可以通过筛除这些参数来达到简化计算的目的。同时我们在测量数据时不需要每分每秒都进行检测,可以设计一个测量时间体系,以达到减少电器控制的负担。【关键词】 outlier格拉布斯准则 相关性检验spss 一、问题重述家用电器是日常生活中不可或缺的一份子,但是时长日久,电器的老化会使其工作能力弱化。电器老化的原因有很多种,我们无法避免它的老化,但当使用者开始对其进行维修时,一般来讲电器的损伤已经无法逆转。为了保证用户的体验效果,现需要一种能够对电器运行状况进行实时监测并判别的方法来解决该问题。现有某家电公司提供的经过脱敏处理

6、后的某种电器运行数据,请你根据已有数据,并结合自己所掌握的知识,利用数学建模的方法来解决以下问题:问题一:电器在情况多变的环境下工作时,有可能会使得传感器读取到异常数据,请对此给出你的解决方案。问题二:由附件一中的数据,请分析不同参数之间的相关性以及其对故障判别的重要程度。结合你之前解决方案,建立一个该电器的故障判别模型并对附件一中的数据进行判别。问题三:请问你根据附件一的数据所建立的模型,是否依然适用于附件二中的数据?如果不适用,请给出你的修正方案。将你的模型修正后,请尝试着判断附件三中的数据,判断其状态为正常或故障(附件三中的数据标签已隐藏,你的判断结果将作为评奖时的参考)。问题四:当你的

7、模型出现错误判断时,将正常判断为故障和将故障判断为正常这两种错误,哪一种更应该避免?能不能在模型中嵌入一个影响因子来解决这个问题?如果可以,请给出你的解决方案。问题五:在实际情况中,因家用电器的控制器计算能力比较低下,所以不能应对计算量特别大的模型。请问你能否在保证判断准确的前提下尽可能地降低计算的复杂程度?如果可以,请给出你的解决方案。二、问题分析2.1 问题一的分析传感器读取到异常数据的原因有很多,我们首先要对其进行分类和总结,才能提出解决方案。在此之后,我们阐述了检测异常数据的意义。在总结检测异常数据的方法之前,我们先对异常值(outlier)进行了定义,这样才能判断哪些数据属于异常,这

8、里我们选取了统计学家Douglas Hawkins的定义。最后根据查找到的资料,我们列举了检测异常数据的方法。2.2 问题二的分析由于数据进行了脱敏处理,我们无法得知数据的具体含义,在对工作环境A(正常)、B(正常)的总体数据分析后,选择了十六个异常参数,然后对它们进行相关性检验,排除粗大误差之后,最终选取了六个参数作为判断依据。建立模型如下:将工作环境(正常)时各项参数平均值所构成的6维向量记为该组正常值的中心点,在二维平面上进行处理后,以距离中心点最远的点和中心点之间的距离的绝对值为半径作圆,至此,圆内包含了所有正常情况的数据点,再将故障环境下工作的样本平均值来观察它是否落在圆内,若样本落

9、在圆内,则样本对应的情况为正常情况,否则就是出现故障。2.3 问题三的分析将工作环境C(正常)和工作环境C(有故障)的数据带入之后,我们发现问题二中建立的模型失效了,说明根据附件一所建立的模型并不适用于附件二。在研究之后,我们发现Ki的系数存在误差,为产生这种现象的原因是正常圆的半径取得过大,由于所取半径为“中心点最远的点和中心点之间的距离的绝对值”,导致一部分偏离幅度不大的异常数据被我们包含在了正常范围之内。于是我们对作为标准的六个参数的异常程度进行了加权处理,在修改了模型之后,该模型对于工作环境A、B、C均适用,于是我们认为这样的修改是合理的。用修改后的模型进行验证,判断工作环境D、E的正

10、常与否。 2.4 问题四的分析由于我们在进行异常数据筛选时,去掉了这个时间点的所有异常数据,其中可能有一些有用的数据被我们筛除了,所以必然会出现误判,我们更应该避免将异常数据判断为正常的这一种错误。2.5 问题五的分析简化计算的主要方法是减少相关参数,同时我们可以减少计算的次数,即增大计算的时间间隔,达到降低控制器计算压力的目的。三、问题假设1.电器本身合格,出厂时不存在质量问题;2.仪器的读取和传输不存在问题,均为可达到的最精准数值;四、符号说明Ki 非故障系数Xij 每组参数相应的数值五、模型建立与求解5.1 问题一的求解I. 异常数据(outlier)的来源1)粗大误差仪器自身的缺陷和外

11、界环境的变化(如光照、湿度、温度、电磁场等)产生的误差,其特点为测量结果向一侧偏移,数据按照一定的规律进行变化;需要注意,多次测量求平均值无法消除仪器误差。数据测量时产生的误差,如读数的精确度、传输错误、操作人员的失误等,这种误差具有偶然性。2)数据误差这类误差是由于观测对象本身的变化产生的。观测对象出现故障,或者因为环境的周期性变化导致的周期性变化,这些都会使数据出现异常。II. 异常数据的意义粗大误差对我们的分析研究有影响,要尽量避免出现无意义误差,一般将其作为噪点删除。数据误差非常有意义,它揭示了观测对象出现的问题,可以获取到正常数据无法得到的信息,有特殊价值III. 异常数据(outl

12、ier)的定义关于异常数据的定义有很多,我们这里采用了统计学家Douglas Hawkins的定义方式:outlier是在数据集中与众不同的数据,使人们怀疑这些数据并非随机偏差,而是产生于完全不同的机制。这种定义被认为是本质性的,且被广泛采用。IV. 异常数据的检测对于多次重复测定的数据,异常数据常用的统计识别与剔除法有拉依达准则(3准则)、格拉布斯(Grubbs)准则、肖维勒(Chauvenet)准则、罗马诺夫斯基(t检验)准则。在25n185的范围内,建议使用格拉布斯准则(a=0.01)来判别可疑数据 熊艳艳,吴先球,粗大误差四种判别准则的比较和应用,大学物理实验,第23卷第1期:66-6

13、8页,2010年2月。具体应用 费业泰,误差理论与数据处理,北京:机械工业出版社,2010年6月。如下:设对某量做多次等精度独立测量,数据为(x1,x2,xn),当xi服从正态分布时,计算x=1nxvi=xi-x=v2n-1将数据按大小顺序排列成顺序统计量x(i),格布罗斯导出了gn=xn-x及g(1)=x-x(1)的分布,取定显著度,可得临界值g0(n,),如表格1所示。表1nn0.050.010.050.01g0(n,)g0(n,)31.151.16112.232.4841.461.49122.282.5551.671.75132.332.6161.821.94142.372.6671.9

14、42.10152.412.7082.032.22202.562.8892.112.32302.743.10102.182.411003.173.59若认为x(1)可疑,则有g(1)=x-x(1)若认为xn可疑,则有gn=xn-x当gig0(n,)即判别该测得值含有粗大误差,应删除。5.2 问题二的模型建立与求解I. 不同参数的相关性在研究相关性之前,我们对数据进行筛选,发现:1)不管是正常还是故障,把不随时间变化的参数去掉之后,发现A正常相比于A故障少了参数78,B正常相比于B故障少了参数73。在不同的工作环境下,我们的影响参数也会发生变化,为简化步骤,现在只考虑他们之间共同的影响参数。我们选

15、出可能的影响因素为2,3,4,5,6,7,8,9,10,18,60,72,74,75,78,83这些参数。2)用spss对数据进行分析表2 相关矩阵表3 公因子方差A2A3A4A5A6A7A8A9A10初始1.0001.0001.0001.0001.0001.0001.0001.0001.000提取0.9890.9220.9590.9870.9860.8640.9150.9300.913A18A60A72A74A75A78A80A83初始1.0001.0001.0001.0001.0001.0001.0001.000提取0.9830.9660.9510.9980.9980.9280.9750.

16、894从表3中可以看出变量的共同度较高,变量中大部分信息都能被因子提取,因子的分析效果有效。图4 碎石图从图4中我们可以看出前面6个因子都处在陡峭的斜率上,第8个因子变缓,因此我们选择前6个参数即参数2,3,4,5,6,7来作为主成分进行分析。下面分析这6个参数的相关性,如表5所示。表5 选取的6个参数的相关矩阵表6 KMO和Bartlett检验表中数据第一行接近1,第四行的数据小于0.05,说明选取的参数之间存在相关关系,即适合做因子分析。II. 故障判别模型1)模型的建立现在的系统中包含6个参数,这6个参数可以看成是一个6维向量(即6维空间)中的一点。为了对样本进行分类,现在引进故障系数这

17、一概念:故障系数为1-Ki,其中Ki=1100j=16Xij-2为非故障系数。2)模型的求解首先,通过故障范围的公式,得出给定样本中正常者的数据,在6维欧式空间里描绘出相应的点,我们将将工作环境(正常)时各项参数平均值所构成的6维向量记为该组正常值的中心点,在二维平面上进行处理后,以距离中心点最远的点和中心点之间的距离的绝对值为半径作圆,至此,圆内包含了所有正常情况的数据点,再将故障环境下工作的样本平均值来观察它是否落在圆内,若样本落在圆内,则样本对应的情况为正常情况,否则就是出现故障。为说明该模型的正确性,我们利用附件一中的两个不同的工作环境A,B的正常与故障所给的数据进行运算,在进行模型分

18、析前,我们首先咬碎实验数据进行选择,通过Excel软件去除异常数据,最后用spss对A,B所得的分析结果如下:表 7工作环境A(正常)的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23441010.160.0060.3680.1361.8370.0421.3750.083参数334410700.36421.37521.375456.8802.0230.0422.3330.083参数4344109005.608328.987328.987108232.4921.8520.0421.4430.083参数5344109284.4

19、53261.205261.20568228.2740.1440.0422.9920.083参数634411501830.40823.94523.945573.3720.7620.0427.5390.083参数734412401440.97957.41357.4133296.232-0.1110.042-1.9140.083有效的 N(列表状态)3441离散点的中心点为(0.16,9.11,14.03,108.82,249.90,305.03),我们所做的圆的半径为4.24。当点到中心的距离大于4.24时,我们可以认为它是异常数据。表 8工作环境A(有故障)的描述统计量N极小值极大值均值标准差方

20、差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23239023231.670.71740.8011664.71956.9100.0433238.8360.086参数3323906628.720.44525.308640.4871.0430.0433238.8360.086参数432390900544.897.707438.621192388.183-0.4340.043-1.6720.086参数532390352113.392.181124.12915407.9600.7010.043-1.8070.086参数632390333288.350.98355.94

21、83130.184-1.9970.043-0.9420.086参数732390380310.310.75643.0531853.571-0.8270.0430.4000.086有效的 N(列表状态)3239我们得到的点为(1.67,28.72,544.89,113.39,288.35,310.31),经过计算发现该点与我们的中心点距离是5.01,不在我们所描述的范围内,故该模型有一定的正确性。表 9工作环境B(正常)的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23586010.540.0080.4990.249-0.14

22、70.041-1.9800.082参数3358606620.070.35020.963439.4310.3760.041-1.2370.082参数435860900466.907.497448.963201567.899-0.0760.041-1.9920.082参数535860992289.035.093304.96693004.1390.4220.041-1.1230.082参数635864329313.780.42825.651657.968-4.1840.04119.6650.082参数735860380346.480.23413.999195.974-4.2290.041103.26

23、90.082有效的 N(列表状态)3586离散点的中心点为(0.54,20.07,466.90,289.03,313.78,246.68),我们所做的圆的半径为8.15。当点到中心的距离大于8.15时,我们可以认为它是异常数据。表 10工作环境B(有故障)的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23456010.570.0080.4950.245-0.2830.042-1.9210.083参数334560600.3690.36921.686470.2721.1550.042-0.3080.083参数434560900

24、7.1637.163421.086177313.6080.7130.042-1.4810.083参数5345603201.8501.850108.74611825.7011.2610.042-0.0120.083参数6345604000.9570.95752.27830167.1950.8050.0423.4140.083参数734563043620.1500.1508.81677.7181.3080.0422.3870.083有效的 N(列表状态)3456我们得到的点为(0.57,13.65,298.18,65.87,263.17,324.62),经过计算发现该点与我们的中心点距离是375.

25、11,不在我们所描述的范围内,故该模型有一定的正确性。3)结果分析该模型进过验证有较高的准确性,从以上过程能看到,通过引进故障范围的这个方法来判断一个电器是否故障准确率还是比较高的,说明此方法确实可行. 通过此方法得到了大量数据的验证,但是故障判别的模型没有理论依据,也许这只是数据上的重合,要想结果更加具有说服力,还得需要很多不同工作情况下的大量数据来进行验证。 5.3 问题三的求解I. 是否适用于附件二表 11工作环境C(正常)的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23468010.510.0080.5000.2

26、50-0.0220.042-2.0010.083参数3346805716.630.31818.740351.1930.5080.042-1.1530.083参数434680900426.047.619448.675201309.1330.1060.042-1.9870.083参数534680832232.244.537267.15571371.9600.6000.042-0.9510.083参数63468180333315.010.40623.893570.873-4.2710.04217.9420.083参数73468320360346.970.18210.746115.482-0.4350

27、.042-1.4020.083有效的 N(列表状态)3468离散点的中心点为(0.5,16.03,426.04,3.24,315.01,346.97),我们所做的圆的半径为7.69。当点到中心的距离大于7.69时,我们可以认为它是异常数据。表 12工作环境C(有故障)的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数229851010.400.0090.4900.2400.4070.045-1.836参数329856606613.530.41922.865522.8031.2270.045-0.211参数42985900090

28、0262.617.445406.757165451.6150.9120.045-1.156参数52985352035271.032.265123.76315317.3911.2950.045-0.069参数629853330333293.500.72539.6361570.996-3.4760.04518.085参数7298580300380327.610.25814.087198.4443.0090.0458.255有效的 N(列表状态)2985我们选取的平均值点是(0.40,13.56,262.31,71.03,293.50,327.61)他与中心点的距离是1.83,小于我们所选取的圆的半

29、径,故我们呢在上面所建立的模型并不适用于附件二的数据。II. 修改模型为什么会出现这样的情况呢?我们初步的想法是我们对于圆的半径的选择上出现了问题。我们在之前的考虑中,想的是将正常情况下所有的样本数据有包含在一个以中心点为圆心的圆内。虽然我们在进行验证时去掉了一部分的相对异常的数据,但是对于那些偏离幅度不大的数据我们还将之发在试验数据中,所以我们在选择实验数据时比更不需要将所有的点都包含进去,大部分在里面就行。所以我们将对圆的半径的求取按照我们每个参数对故障系数的影响程度来进行一个比例划分(表13)。表13 解释的总方差III. 判断附件三根据以上改进我么所求的C环境下的非故障的圆的半径是1.

30、26.满足我们定下的要求。同时我们也将这个代入进A,B这两个工作环境中去验证也是符合定义的。IV. 判断附件三中的两个工作环境表 14工作环境D的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数2175723221232377.659.900414.978172206.4965.2320.05825.403参数317576006028.910.61425.729661.961-0.1230.058-1.797参数4175790000900561.4110.311432.219186813.041-0.5180.058-1.71

31、7参数517572880288133.282.992125.43215733.290-0.0230.058-1.844参数6175731122333254.681.37357.5553312.543-0.1150.058-0.515参数7175748304352328.910.25710.775116.091-0.6570.058-0.217有效的 N(列表状态)1757离散点的中心点为(77.65,28.91,561.41,133.28,254.68,328.91),我们所做的圆的半径为3.12。当点到中心的距离大于3.12时,我们可以认为它是异常数据。表 15我们可以从图中看到这个参数随时

32、间的变化,除了参数2在一段时间内发现了较大的变化,其他的因素在这些时间点的呈周期性的变化。参数二对判断故障程度的影响为53.093%。虽然参数二对其影响较大,但是其变化的所占时间太短,而且在之后的时段内没有发生这样的变化,而且一直很稳定。故工作环境D是正常的。表 16工作环境E的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数2347223230232313.852.983175.79030902.26213.0670.042168.848参数334726006027.310.49429.1368489260.1530.042

33、-1.944参数434729000900424.687.612448.543201191.1990.1120.042-1.985参数534726400640285.765.238308.61995245.8640.1890.042-1.920参数63472147186333295.360.40723.960574.090-2.8940.0429.301参数7347232328360352.160.1116.55742.999-1.0010.0420.836有效的 N(列表状态)3472离散点的中心点为(2.983,0.494,424.68,285.76,295.36,0.407,0.111),

34、我们所做的圆的半径为2.09。当点到中心的距离大于2.09时,我们可以认为它是异常数据。表 17我们可以从图中看到这个参数随时间的变化,除了参数5在一段时间内发现了较大的变化,其他的因素在这些时间点的变化都较小。参数5对判断故障程度的影响为0.685%。虽然参数5在一段时间之后发生了较大的变化,但是其对故障程度影响很小几乎可以忽略不计。故工作环境E是正常的。5.4 问题四的解答由于我们在进行异常数据筛选时,去掉了这个时间点的所有异常数据,其中可能有一些有用的数据被我们筛除了,所以必然会出现误判,我们更应该避免将异常数据判断为正常的这一种错误。在寻找异常数据时我们发现了这样一个规律,异常数据及其周围的时间点大部分也是异常数据。所以我们可以把这一段时间的数据改为这些数据的一个平均值,以减少出现错误的几率,提高我们判断的准确性。5.5 问题五的解答从问题二中的数据可以看出,参数6、参数7对故障判断的影响程度几乎可以忽略不计,所以我们可以通过筛除这两个参数来达到简化计算的目的。同时我们在测量数据时不需要每分每秒都进行检测,我们可以重新设计一个测量时间体系,以达到减少电器控制的负担。六、参考文献

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!