iris数据集下的朴素贝叶斯
《iris数据集下的朴素贝叶斯》由会员分享,可在线阅读,更多相关《iris数据集下的朴素贝叶斯(5页珍藏版)》请在装配图网上搜索。
1、数据挖掘(计科一班杨平1025115034)题目iris数据集下的朴素贝叶斯实现一问题描述:Iris 数据集是在分类和模式识别研究中常用的基准数据。它 是根据花瓣和萼片的长度和宽度来对Iris进行分类。Iris数据集 包含3类4维样本,分别标为1, 2, 3。其中, 每类样本数目为50, 且 服从正态分布,每个数据样本有 4 个特征向量,分别代表萼片长 度, 萼片宽度, 花瓣长度和花瓣宽度。分类是利用预定的已分类数据集构造出一个分类函数或分 类模型(也称作分类器),并利用该模型把未分类数据映射到某一 给定类别中的过程。原理描述:贝叶斯公式P I X) = max卩(X 1巴)PV)的实质是通过
2、观察样本将状态的i冃P( X)先验概率转化为状态的后验概率,给定一个未知类别的数据样本 X ,贝叶斯分 类法将预测 X 属于具有最高后验概率的类。本问题可以数学描述为多元正态概 率型下的最小错误率贝叶斯分类。1)先验概率设数据库表有d个属性,因此,可以用一个d维列向量x = x ,xx T来表12d示。同时,假定有c个类,,。如果类的先验概率未知,则可以假定这些12 c类是等概率的,即SP()=P()=.=P(),且 P(w ) = i12ci S其中,S是类w中的训练样本数,而S是训练样本总数。ii2)参数估计对于多变量正态分布,估计其均值和方差匚丄区(x_n)( x_n)tN kk其中,x
3、为多元正态分布总体中第K个抽样,是d维向量,0是均值向量R k的最大似然估计,Y是协方差矩阵的最大似然估计。二利用 python 调用 matlab 函数,实现联合开发.m 文件见于附录下面是 python 调用 matlab 方法实现from win32com.client import Dispatchh = Dispatch(Matlab.application)#启动 MATLAB 自动化服务器 h.execute(Iris_import.m)h.execute(compare3.m)三.附录(1). “compare3.m”文件 function max=compare3(a,b,c
4、) max=a;if maxbmax=b;endif maxcmax=c;End(2) . “Iris_import.m”文件 clc;clear all;d=4;c=3;N=50;D=load(Iris_data.txt);data=zeros(150,d);G1=zeros(50,d);G2=zeros(50,d);G3=zeros(50,d);for i=1:1:4data(:,i)=D(:,i+1);endfor i=1:1:NG1(i,:)=data(i,:);G2(i,:)=data(i+N,:);G3(i,:)=data(i+2*N,:);enddisp(G1);disp(G2)
5、;disp(G3);%计算各组的均值向量和协方差矩阵miu1=mean(G1,1)miu2=mean(G2,1)miu3=mean(G3,1)sigma1=zeros(d,d);sigma2=zeros(d,d);sigma3=zeros(d,d);for i=1:1:Nsigma1=sigma1+(G1(i,:)-miu1)*(G1(i,:)-miu1);sigma2=sigma2+(G2(i,:)-miu2)*(G2(i,:)-miu2);sigma3=sigma3+(G3(i,:)-miu3)*(G3(i,:)-miu3);endsigma1=sigma1/Nsigma2=sigma2/
6、Nsigma3=sigma3/N%代入判别函数,实现分类R=zeros(150,3);fid=fopen(classifier_result.txt,wt);for i=1:1:150R(i,1)=-1/2*(data(i,:)-miu1)*inv(sigma1)*(data(i,:)-miu1)-1/2*log(det(sigma1);R(i,2)=-1/2*(data(i,:)-miu2)*inv(sigma2)*(data(i,:)-miu2)-1/2*log(det(sigma2);R(i,3)=-1/2*(data(i,:)-miu3)*inv(sigma3)*(data(i,:)-
7、miu3)-1/2*log(det(sigma3); switch (compare3(R(i,1),R(i,2),R(i,3)case R(i,1) fprintf(fid,第-2d 个样本属于第 1 类n,i);case R(i,2)fprintf(fid,第-2d 个样本属于第 2 类n,i); otherwise R(i,3)fprintf(fid,第%-2d 个样本属于第 3 类n,i);endendfclose(fid);(3) ” Iris data”Zri5_data -记事本 E5. 13. 51.40.24. 93. 01.40.24. 73. 21.30.24. 63.
8、11.50.25. 03. 61.40.25. 43. 91.70.44. 63. 41.40.35. 03. 41.50.24. 42. 9|1.40.2104. 93. 11.50.1115. 43. 71.50.2124. 83. 41.60.2134. 83. 01.40.1144. 33. 01.10.1155. 84. 01.20.2165. 74. 41.50.4175. 43. 91.30.4IS5. 13. 51.40.319573. 81.70.320513. 81.50.321543. 41.70.222513. 71.50.4234. 63. 61.00.224513.
9、 31.70.5254. 83. 41.90.226503. 01.60.2四实验结果得到每一类的协方差矩阵如下:sigmal 二sigma2 =0. 12180. 09720. 01500.01010. 26110.08350. 17920.05470. 09720. 14080. 01150.00910. 08350.09650. 08100. 04040. Q1600. 01150.02360.00590. 17920.08100. 21640.071fi0. 01010.00910.00590.01090. 05470.04040. 07160.0383siginaS 二0.站閃0.0
10、9190. 29720.04810. 09190.10190. 07000. 04670. 29720.07000. 29850.04780. 04S10.04670. 047S0.0735类 分 的 现 实 终 最in3 3 3 3 3 0第第第第第里第第第第第第第第第第第第第1 于于于于于工属属属属属屋属一US耳严 FAxlxlx8 9 o 1 22 2 3 3 3 0TI TI _ _ 11 1till!于一其 emmm 3 3 3 3 3 3.。43第第第第第冕第第第第第第第第第第第第1丁于一庸属属属属属属属属属属属属一 耒 广 Jc. Jc. Jc. Inr严=F、产_ _ TTTX
11、1X1X1TTTT b6789ol234567 33333444-4-4444I 11 11 11 11 11 11 _ 11 11 TI TI 1I于于于于于于于于于_liif 2222222P 弟第第第第第第第第第第第第第第第第第第第7r于于于于于于干于 属1-1-1-1-属属 mi- 二丿一二丄二丄二一- -J 二一 二-一二.1 TTTTTTTV 34567890- 6666666771777777700000 弟第第第第第第第第第第第第第第第第第第第iil一I丁于于于于于于于于于于 sfi!-fi QK!药药药不不不芯衣慈 -II - - II - - - 1 - - - 1 FTI- - - - - - - - - - - - 二 丿 厂一广孑孑k云云云 TTTTTITTTT类类类类类类类类类类类类类类类类类 1 1 111111 1 1 1 1 11111 JU 第第第第第第第第第第第第第第第第第訓 于于于于于于于于于于于于于于于于于炜 属-fi-属属属属B-属属属JE-JE-属属属W =!K 尺尺尺大巨兀兀 jT-K F 尺尺尺士口01234567 址 一II-Z.一.-.:Li) r卜-rlI 一:-=ofa-1| 一| T| 1| 1| 1| 1| 1|rM 第第第第第第第第第第第第第第第第第心
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工过程开发导论教学课件
- PXGL05SSGF下的运营管理课件
- (部编版教材)三年级上册《金色的草地》经典ppt课件
- 第二课-展示自己的职业风采课件
- (新课标)高三化学一轮总复习第6章化学反应与能量变化同步测试卷ppt课件
- (新课标)高考数学大一轮复习第一章集合与常用逻辑用语1.1集合ppt课件文
- 第五讲法家思想现代解读课件
- 第二章-人工晶体的生长2122课件
- 第三章学前儿童身体保健教育分析课件
- (部编版)祖父的园子优秀ppt课件
- 第七章老年心理学-课件
- 趣味竞赛—成语猜猜看82张课件
- 化工过程开发与设计-绪论-第1章课件
- 路基路面弯沉试验(贝克曼梁)课件
- (部编版)小学语文一级上册《项链》教学ppt课件