Word文档

上传人:仙人****88 文档编号:162014106 上传时间:2022-10-17 格式:DOC 页数:5 大小:32KB
收藏 版权申诉 举报 下载
Word文档_第1页
第1页 / 共5页
Word文档_第2页
第2页 / 共5页
Word文档_第3页
第3页 / 共5页
资源描述:

《Word文档》由会员分享,可在线阅读,更多相关《Word文档(5页珍藏版)》请在装配图网上搜索。

1、x:80,90,100,110,120,130,140,150,160,170,180320y:79,89, 98,109,119,128,134,147, 157,166,177,如何把偏离线性的数据给挑出来?用什么方法比较好。用拟合曲线求出实际y值再用标准偏差法判断就可以Hough 变换拟合直线,不过这个是数字图像处理里面比较专业的知识。1。对于线性数列,求出所有相邻两树差,得到一个新的数列,然后统计新数列的众数(就是出现最多的那个)得到线性数列的公差。2。然后假设第一个个数是非异常数字。3。假设数据不断加公差,看看绝大大多数是不是在原线性数列中,分情况: 3.1若是 : 则第一个数以及第

2、一个数+公差与原数列相同的元素均为非异常数据,其他则为异常数据。 3.2若不是:则第一个数为异常数列,在假设第2个非异常数据,返回到第3步。一直找到满足条的的数。注 : 异常数据毕竟是少数,计算次数与线性数列内元素个数正相关。假设个数为n最小计算次数;2*n最大计算次数:n*(n-1)理论平均: n*log(n)实验数据其实一般用图表,把所有元素对应点放在一张图上,找直线,使最多点落在直线上,不在直线上的数据去掉就可以了用拟合曲线求出实际y值再用标准偏差法判断就可以了标准偏差(Standard Deviation) 一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差

3、越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。主要是理解标准偏差的数学含义,标准是衡量分散程度的标准。其他计算 Mean、Deviation 的方法不胜枚举, 以它为标准,承认目前的理论中没有更好的方法?仅仅是权宜之法? 那真正的标准又是什么?我认为,标准偏差,只是一种命名,满足一定范围的统计要求,对数据的离散程度能做到有效的度量。如果放在特殊的条件下,它的有效性可能比其他的方法差。最小二乘法 在我们研究两个变量(x, y)之间的相互关系时,通常可以得到一系列成对的数据(x1, y1、x2, y2. xm , ym);将这些数据描绘在x -y直角

4、坐标系中(如图1), 若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。 Y计= a0 + a1 X (式1-1) 其中:a0、a1 是任意实数 为建立这直线方程就要确定a0和a1,应用最小二乘法原理,将实测值Yi与利用(式1-1)计算值(Y计=a0+a1X)的离差(Yi-Y计)的平方和(Yi - Y计)2最小为“优化判据”。 令: = (Yi - Y计)2 (式1-2) 把(式1-1)代入(式1-2)中得: = (Yi - a0 - a1 Xi)2 (式1-3) 当(Yi-Y计)平方最小时,可用函数 对a0、a1求偏导数,令这两个偏导数等于零。 (式1-4) (式1-5) 亦即:

5、 m a0 + (Xi ) a1 = Yi (式1-6) (Xi ) a0 + (Xi2 ) a1 = (Xi, Yi) (式1-7) 得到的两个关于a0、 a1为未知数的两个方程组,解这两个方程组得出: a0 = (Yi) / m - a1(Xi) / m (式1-8) a1 = Xi Yi - (Xi Yi)/ m / Xi2 - (Xi)2 / m) (式1-9) 这时把a0、a1代入(式1-1)中, 此时的(式1-1)就是我们回归的元线性方程即:数学模型。 在回归过程中,回归的关联式是不可能全部通过每个回归数据点(x1, y1、 x2, y2.xm,ym),为了判断关联式的好坏,可借助

6、相关系数“R”,统计量“F”,剩余标准偏差“S”进行判断;“R”越趋近于 1 越好;“F”的绝对值越大越好;“S”越趋近于 0 越好。 R = XiYi - m (Xi / m)(Yi / m)/ SQRXi2 - m (Xi / m)2Yi2 - m (Yi / m)2 (式1-10) 在(式1-1)中,m为样本容量,即实验次数;Xi、Yi分别任意一组实验X、Y的数值。微积分应用课题一 最小二乘法 从前面的学习中, 我们知道最小二乘法可以用来处理一组数据, 可以从一组测定的数据中寻求变量之间的依赖关系, 这种函数关系称为经验公式. 本课题将介绍最小二乘法的精确定义及如何寻求 与 之间近似成线

7、性关系时的经验公式. 假定实验测得变量之间的 个数据 , , , , 则在 平面上, 可以得到 个点 , 这种图形称为“散点图”, 从图中可以粗略看出这些点大致散落在某直线近旁, 我们认为 与 之间近似为一线性函数, 下面介绍求解步骤. 考虑函数 , 其中 和 是待定常数. 如果 在一直线上, 可以认为变量之间的关系为 . 但一般说来, 这些点不可能在同一直线上. 记 , 它反映了用直线 来描述 , 时, 计算值 与实际值 产生的偏差. 当然要求偏差越小越好, 但由于 可正可负, 因此不能认为总偏差 时, 函数 就很好地反映了变量之间的关系, 因为此时每个偏差的绝对值可能很大. 为了改进这一缺陷, 就考虑用 来代替 . 但是由于绝对值不易作解析运算, 因此, 进一步用 来度量总偏差. 因偏差的平方和最小可以保证每个偏差都不会很大. 于是问题归结为确定 中的常数 和 , 使 为最小. 用这种方法确定系数 , 的方法称为最小二乘法.如何用据spss剔除异常数,比如跟其他数据不相关的数据,或者一些突变数据要是说把不相关的数据剔除,可能不太好弄。但是可以剔除异常值。但是仍然不推荐使用spss来做这个分析,需要更专业的,实在要用,做残差图吧。用克里格插值前如何用SPSS软件对数据进行处理(相关性分析等)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!