用身高和体重数据进行性别分类的实验报告

上传人:lis****210 文档编号:113228942 上传时间:2022-06-24 格式:DOCX 页数:10 大小:74.34KB
收藏 版权申诉 举报 下载
用身高和体重数据进行性别分类的实验报告_第1页
第1页 / 共10页
用身高和体重数据进行性别分类的实验报告_第2页
第2页 / 共10页
用身高和体重数据进行性别分类的实验报告_第3页
第3页 / 共10页
资源描述:

《用身高和体重数据进行性别分类的实验报告》由会员分享,可在线阅读,更多相关《用身高和体重数据进行性别分类的实验报告(10页珍藏版)》请在装配图网上搜索。

1、用身高和体重数据进行性别分类的实验报告一、基本要求用FAMALE.TXT和MALE.TXT勺数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。二、具体做法(1) 应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5vs.0.

2、5,0.75vs.0.25,0.9vs.0.1等)进行实验,考察对决策和错误率的影响。(2) 自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验。A. 三、原理简述及程序框图正态分布的监督参数估计监督参数估计:样品所属的类别及类条件总体概率密度函数的形式为已知,而表征概率密度函数的某些参数是未知的。本实验符合上述条件且在正态分布假设下估计分布密度参数故使用正态分布的监督参数估计对于多元正态分别,其最大似然估计的结果为:1NXknkm1NTXk-?Xk?NKd最小错误率Bayes分类器在多元正态模型下的最小错误率角度来分析Bayes分类器(1)假设身高与体重不相关令协方差矩阵次对角元

3、素为零判别函数可简化为gj(x)=xTWfx+WiTx+w0其中吩-!,Wi-11npZj+1nPj具体算法步骤如下:第一步将训练样本集数据转为矩阵FAMA第二步分别对FAMA求取协方差2,令协方差矩阵次对角元素为零,平均值叫,并输入先验概率P1,P2第三步将第二步所得数值代入判别函数表达式得gx,g2x。第四步将待测样本集数据转为矩阵T,将T中数值依次代gx-g2x,若gix-g2x0,则判断其为第一类,反之,第二类。(2)假设身高与体重相关判别函数可简化为gix=xTW(xwiTxwi0其中Wj二-丄,Wj72wi0=丄uT为m丄In爲+InP(i)2j2具体算法步骤如下:第一步将训练样本

4、集数据转为矩阵FA,MA第二步分别对FAMA求取协方差H2平均值并输入先验概率P.1,P.2第三步将第二步所得数值代入判别函数表达式得g1x,g2x。第四步将待测样本集数据转为矩阵T,将T中数值依次代gix-g2x,若g1x-g2x0,则判断其为第一类,反之,第二类。最小风险Bayes分类器(1)在已知先验概率P和类条件概率密度Pxj,j=1,-c及给出带识别的x的情况下,根据Bayes公式计算后验概率:P(X&j)Pj).Pj.X-J=1;,cSP(x)P(创)i=1(2)利用后验概率及决策表,计算条件风险RakxcR:Jx:二-i-i/jPj/x,i=1,ai#(3)Rax二mjnRarx

5、,ak就是最小风险Bayes决策。其中(1)中先验概率Pj根据自行输入,类条件概率密度1(1tPx.j=PXi:d1expXu、(xu),本实验(2兀汀|打2I2J(1)用最小错误率Bayes决策假设身高与体重相关(以训练样本建立判别函数)性别为女生性别为男生训练样本判训练样本的测试样本判测试样本的的先验概率的先验概率错的个数错误率错的个数错误率P(1)P(2)N1H1N2H20.10.92424%165.33%0.17(1/6)0.83(5/6)1919%144.67%0.40.61313%248%0.50.51212%3210.67%0.750.251414%6020.00%由表可知:对于

6、训练样本,当女生先验概率为0.5时,判别错误率最小对于测试样本,当女生先验概率为1/6时,判别错误率最小故可推测用最小错误率Bayes决策假设身高与体重相关当女生先验概率等于待测样本中女生样本占待测样本的概率时,错误率最小,且越远离此概率,错误率越大。最佳决策对于训练样本,当女生先验概率为0.5对于测试样本,当女生先验概率为1/6假设身高与体重不相关(以训练样本建立判别函数)性别为女生性别为男生训练样本判训练样本的测试样本判测试样本的的先验概率的先验概率错的个数错误率错的个数错误率PPNiH1N2H20.10.91919%165.33%0.170.831414%175.67%0.40.6111

7、1%268.67%0.50.51212%299.67%0.750.251313%4515.00%对于训练样本当女生先验概率接近0.5时错误率最小最佳决策对于训练样本,当女生先验概率为0.5(2)用最小风险的Bayes决策性别为女生性别为男生训练样本判训练样本的测试样本判测试样本的的先验概率的先验概率错的个数错误率错的个数错误率P(1)PN1H1N2H20.10.92626%196,33%0.250.751919%155,00%0.40.61414%196,33%0.50.51313%248,00%0.750.251616%4715,67%对于训练样本,当女生先验概率为0.5时,判别错误率最小对

8、于测试样本,当女生先验概率为1/6时,判别错误率最小故可推测用最小风险Bayes决策假设身高与体重相关当女生先验概率等于待测样本中女生样本占待测样本的概率时,错误率最小,且越远离此概率,错误率越大。最佳决策对于训练样本,当女生先验概率为0.5对于测试样本,当女生先验概率为1/6身高体重不相关性别为女生性别为男生训练样本判训练样本的测试样本判测试样本的的先验概率的先验概率错的个数错误率错的个数错误率P(1)P(2)N1H1N2H20.10.91818%165.53%0.250.751414%175.67%0.40.61515%227.33%0.50.51111%268.67%0.750.2515

9、15%4113.67%最佳决策对于训练样本,当女生先验概率为0.5心得体会拿到大作业题目,我们首先对题目进行了分析,并且根据以前所学过的知识和做过的例题找到了解题方法,然后先制定解题步骤,画出解题流程图。再根据流程图编写出MATLAB码,最后进行调试,运行,得出结果。整个过程中,我们在编程部分遇到了一些麻烦,但很快我们就通过查找资料解决了这个问题。再给老师审核时,发现我们并没有完完全全达到题目要求,后来我们又再次修改。通过这次大作业,我们从原来拿到题目时的迷茫,到制定出解题方案,再到最后具体操作,体会到了通过自己的努力解决一个问题的快乐,同时,也懂得了遇到任何问题,只要通过认真分析,最终都会得

10、到解决的道理,而且我们也发现审题不清是我们小组的薄弱环节,我们将吸取教训认真读题审题,且当身高体重不相关时,输出的结果可能有问题,还需修改。%一?i?a1?,?D士e2ae?u?clc;clearall;%e?-?e?e?eP1=input(?eu?e?e?ee?;P2=input(?Deu?e?e?ee?;%?卩匕?u士?FHFW=textread(C;UsersxuydDesktophomeworkFEMALE.txt,%f%f);MHMW=textread(C;UsersxuydDesktophomeworkMALE.txt,%f%f);FA=FHFW;FA=FA;MA=MHMW;MA=

11、MA;a=cov(FA)*(length(FA)-1)/length(FA);b=cov(MA)*(length(MA)-1)/length(MA);W1=-1/2*inv(a);W2=-1/2*inv(b);Ave1=(sum(FA)/length(FA);Ave2=(sum(MA)/length(MA);w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1*inv(a)*Ave1-1/2*log(det(a)+log(P1);w20=-1/2*Ave2*inv(b)*Ave2-1/2*log(det(b)+log(P2);%symsa;%symsb;%h=

12、ab;%h仁h*W1*h+w1*h+w10?D士eo_ey%h2=h*W2*h+w2*h+w20%2ae?u士?tHT=tHtW;T=T;%?2ae?u?i?D士eforj=1:300g1=T(:,j)*W1*T(:,j)+w1*T(:,j)+w10;g2=T(:,j)*W2*T(:,j)+w2*T(:,j)+w20;ifg1=g2XF(:,j)=T(:,j);elseXM(:,j)=T(:,j);endendn=0;fori=1:50ifXF(1,i)0n=n+1;endendm=0;fork=51:300ifXM(1,k)0m=m+1;endendN=300-m-n;H=N/300;NH%

13、XF%XM%一?i?2?a1?D士e2ae?u士?clc;clearall;%?e?e?eP1=input(?eu?e?e?ee?;P2=input(?Deu?e?e?ee?;%?卩匕?u士?%f););FHFW=textread(C;UsersxuydDesktophomeworkFEMALE.txt,%fMHMW=textread(C;UsersxuydDesktophomeworkMALE.txt,%f%fFA=FHFW;FA=FA;MA=MHMW;MA=MA;a=cov(FA)*(length(FA)-1)/length(FA);b=cov(MA)*(length(MA)-1)/len

14、gth(MA);a(1,2)=0;a(2,1)=0;b(1,2)=0;b(2,1)=0;W1=-1/2*inv(a);W2=-1/2*inv(b);Ave1=(sum(FA)/length(FA);Ave2=(sum(MA)/length(MA);w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1*inv(a)*Ave1-1/2*log(det(a)+log(P1);w20=-1/2*Ave2*inv(b)*Ave2-1/2*log(det(b)+log(P2);%symsa;%symsb;%h=ab;%h仁w1*h+w10?D士eoey%h2=w2*h+w

15、20%2ae?u士?tH,%f%f%*s);tW=textread(C:UsersxuydDesktophomeworktest2.txtT=tHtW;T=T;%?2ae?u士?卩?D?forj=1:300g1=T(:,j)*W1*T(:,j)+w1*T(:,j)+w10;g2=T(:,j)*W2*T(:,j)+w2*T(:,j)+w20;ifg1=g2XF(:,j)=T(:,j);elseXM(:,j)=T(:,j);endendn=0;fori=1:50ifXF(1,i)0n=n+1;endendm=0;fork=51:300ifXM(1,k)0m=m+1;endendN=300-m-n;

16、H=N/300;NH%XF%XM洽?D?Bayes?2?ei?i?a1?D士e2ae?u?clc;clearall;%?卩匕?u士?FHFW=textread(C:UsersxuydDesktophomeworkFEMALE.txt,%fMHMW=textread(C:UsersxuydDesktophomeworkMALE.txt,%f%fFA=FHFW;FA=FA;MA=MHMW;MA=MA;Ave1=(sum(FA)/length(FA);Ave2=(sum(MA)/length(MA);a=cov(FA)*(length(FA)-1)/length(FA);b=cov(MA)*(len

17、gth(MA)-1)/length(MA);W1=-1/2*inv(a);W2=-1/2*inv(b);w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1*inv(a)*Ave1;w20=-1/2*Ave2*inv(b)*Ave2;%2ae?u士?tHtW=textread(C:UsersxuydDesktophomeworktest2.txt,%f%f%*sT=tHtW;T=T;%?e?e?e?2?士P1=input(?eu?e?e?ee?;P2=input(?Deu?e?e?ee?;R=input(?2?士?ao);R11=R(1,1);R12=R(1,

18、2);R21=R(2,1);R22=R(2,2);%?2ae?u士?卩?D士eforj=1;300g1=T(;,j)*W1*T(;,j)+w1*T(;,j)+w10;g2=T(;,j)*W2*T(;,j)+w2*T(;,j)+w20;%f);););P1F=1/(2*pi)/(det(a)F0.5*exp(g1);P1M=1/(2*pi)/(det(b)F0.5*exp(g2);PF1=P1F*P1/(P1F*P1+P1M*P2);PM1=1-PF1;R1=R11*PF1+R12*PM1;R2=R21*PF1+R22*PM1;ifR2=R1XF(:,j)=T(:,j);elseXM(:,j)=

19、T(:,j);endendn=0;fori=1:50ifXF(1,i)0n=n+1;endendm=0;fork=51:300ifXM(1,k)0m=m+1;endendN=300-m-n;H=N/300;RNH洽?D?Bayes?2?ei?i?2?a1?D士e2ae?u?clc;clearall;%?卩匕?u士?%f););FHFW=textread(C:UsersxuydDesktophomeworkFEMALE.txt,%fMHMW=textread(C:UsersxuydDesktophomeworkMALE.txt,%f%fFA=FHFW;FA=FA;MA=MHMW;MA=MA;Av

20、e1=(sum(FA)/length(FA);Ave2=(sum(MA)/length(MA);a=cov(FA)*(length(FA)-1)/length(FA);b=cov(MA)*(length(MA)-1)/length(MA);a(1,2)=0;a(2,1)=0;b(1,2)=0;b(2,1)=0;W1=-1/2*inv(a);W2=-1/2*inv(b);w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1*inv(a)*Ave1;w20=-1/2*Ave2*inv(b)*Ave2;%2ae?u?tH,%f%f%*s);tW=textread(C

21、:UsersxuydDesktophomeworktest2.txtT=tHtW;T=T;%?e?e?e?2?iP1=input(?eu?e?e?ee?;P2=input(?Deu?e?e?eeR=input(?2?ao);R11=R(1,1);R12=R(1,2);R21=R(2,1);R22=R(2,2);%?2ae?u?卩?Deforj=1;300g1=T(;,j)*W1*T(;,j)+w1*T(;,j)+w10;g2=T(;,j)*W2*T(;,j)+w2*T(;,j)+w20;P1F=1/(2*pi)/(det(a)F0.5*exp(g1);P1M=1/(2*pi)/(det(b)F0.5*exp(g2);PF1=P1F*P1/(P1F*P1+P1M*P2);PM1=1-PF1;R1=R11*PF1+R12*PM1;R2=R21*PF1+R22*PM1;ifR2=R1XF(;,j)=T(;,j);elseXM(;,j)=T(;,j);endendn=0;fori=1;50ifXF(1,i)0n=n+1;endendm=0;fork=51:300ifXM(1,k)0m=m+1;endendN=300-m-n;H=N/300;RNH

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!