iris数据集下的朴素贝叶斯

上传人:m**** 文档编号:187645621 上传时间:2023-02-16 格式:DOCX 页数:5 大小:26.31KB
收藏 版权申诉 举报 下载
iris数据集下的朴素贝叶斯_第1页
第1页 / 共5页
iris数据集下的朴素贝叶斯_第2页
第2页 / 共5页
iris数据集下的朴素贝叶斯_第3页
第3页 / 共5页
资源描述:

《iris数据集下的朴素贝叶斯》由会员分享,可在线阅读,更多相关《iris数据集下的朴素贝叶斯(5页珍藏版)》请在装配图网上搜索。

1、数据挖掘(计科一班杨平1025115034)题目iris数据集下的朴素贝叶斯实现一问题描述:Iris 数据集是在分类和模式识别研究中常用的基准数据。它 是根据花瓣和萼片的长度和宽度来对Iris进行分类。Iris数据集 包含3类4维样本,分别标为1, 2, 3。其中, 每类样本数目为50, 且 服从正态分布,每个数据样本有 4 个特征向量,分别代表萼片长 度, 萼片宽度, 花瓣长度和花瓣宽度。分类是利用预定的已分类数据集构造出一个分类函数或分 类模型(也称作分类器),并利用该模型把未分类数据映射到某一 给定类别中的过程。原理描述:贝叶斯公式P I X) = max卩(X 1巴)PV)的实质是通过

2、观察样本将状态的i冃P( X)先验概率转化为状态的后验概率,给定一个未知类别的数据样本 X ,贝叶斯分 类法将预测 X 属于具有最高后验概率的类。本问题可以数学描述为多元正态概 率型下的最小错误率贝叶斯分类。1)先验概率设数据库表有d个属性,因此,可以用一个d维列向量x = x ,xx T来表12d示。同时,假定有c个类,,。如果类的先验概率未知,则可以假定这些12 c类是等概率的,即SP()=P()=.=P(),且 P(w ) = i12ci S其中,S是类w中的训练样本数,而S是训练样本总数。ii2)参数估计对于多变量正态分布,估计其均值和方差匚丄区(x_n)( x_n)tN kk其中,x

3、为多元正态分布总体中第K个抽样,是d维向量,0是均值向量R k的最大似然估计,Y是协方差矩阵的最大似然估计。二利用 python 调用 matlab 函数,实现联合开发.m 文件见于附录下面是 python 调用 matlab 方法实现from win32com.client import Dispatchh = Dispatch(Matlab.application)#启动 MATLAB 自动化服务器 h.execute(Iris_import.m)h.execute(compare3.m)三.附录(1). “compare3.m”文件 function max=compare3(a,b,c

4、) max=a;if maxbmax=b;endif maxcmax=c;End(2) . “Iris_import.m”文件 clc;clear all;d=4;c=3;N=50;D=load(Iris_data.txt);data=zeros(150,d);G1=zeros(50,d);G2=zeros(50,d);G3=zeros(50,d);for i=1:1:4data(:,i)=D(:,i+1);endfor i=1:1:NG1(i,:)=data(i,:);G2(i,:)=data(i+N,:);G3(i,:)=data(i+2*N,:);enddisp(G1);disp(G2)

5、;disp(G3);%计算各组的均值向量和协方差矩阵miu1=mean(G1,1)miu2=mean(G2,1)miu3=mean(G3,1)sigma1=zeros(d,d);sigma2=zeros(d,d);sigma3=zeros(d,d);for i=1:1:Nsigma1=sigma1+(G1(i,:)-miu1)*(G1(i,:)-miu1);sigma2=sigma2+(G2(i,:)-miu2)*(G2(i,:)-miu2);sigma3=sigma3+(G3(i,:)-miu3)*(G3(i,:)-miu3);endsigma1=sigma1/Nsigma2=sigma2/

6、Nsigma3=sigma3/N%代入判别函数,实现分类R=zeros(150,3);fid=fopen(classifier_result.txt,wt);for i=1:1:150R(i,1)=-1/2*(data(i,:)-miu1)*inv(sigma1)*(data(i,:)-miu1)-1/2*log(det(sigma1);R(i,2)=-1/2*(data(i,:)-miu2)*inv(sigma2)*(data(i,:)-miu2)-1/2*log(det(sigma2);R(i,3)=-1/2*(data(i,:)-miu3)*inv(sigma3)*(data(i,:)-

7、miu3)-1/2*log(det(sigma3); switch (compare3(R(i,1),R(i,2),R(i,3)case R(i,1) fprintf(fid,第-2d 个样本属于第 1 类n,i);case R(i,2)fprintf(fid,第-2d 个样本属于第 2 类n,i); otherwise R(i,3)fprintf(fid,第%-2d 个样本属于第 3 类n,i);endendfclose(fid);(3) ” Iris data”Zri5_data -记事本 E5. 13. 51.40.24. 93. 01.40.24. 73. 21.30.24. 63.

8、11.50.25. 03. 61.40.25. 43. 91.70.44. 63. 41.40.35. 03. 41.50.24. 42. 9|1.40.2104. 93. 11.50.1115. 43. 71.50.2124. 83. 41.60.2134. 83. 01.40.1144. 33. 01.10.1155. 84. 01.20.2165. 74. 41.50.4175. 43. 91.30.4IS5. 13. 51.40.319573. 81.70.320513. 81.50.321543. 41.70.222513. 71.50.4234. 63. 61.00.224513.

9、 31.70.5254. 83. 41.90.226503. 01.60.2四实验结果得到每一类的协方差矩阵如下:sigmal 二sigma2 =0. 12180. 09720. 01500.01010. 26110.08350. 17920.05470. 09720. 14080. 01150.00910. 08350.09650. 08100. 04040. Q1600. 01150.02360.00590. 17920.08100. 21640.071fi0. 01010.00910.00590.01090. 05470.04040. 07160.0383siginaS 二0.站閃0.0

10、9190. 29720.04810. 09190.10190. 07000. 04670. 29720.07000. 29850.04780. 04S10.04670. 047S0.0735类 分 的 现 实 终 最in3 3 3 3 3 0第第第第第里第第第第第第第第第第第第第1 于于于于于工属属属属属屋属一US耳严 FAxlxlx8 9 o 1 22 2 3 3 3 0TI TI _ _ 11 1till!于一其 emmm 3 3 3 3 3 3.。43第第第第第冕第第第第第第第第第第第第1丁于一庸属属属属属属属属属属属属一 耒 广 Jc. Jc. Jc. Inr严=F、产_ _ TTTX

11、1X1X1TTTT b6789ol234567 33333444-4-4444I 11 11 11 11 11 11 _ 11 11 TI TI 1I于于于于于于于于于_liif 2222222P 弟第第第第第第第第第第第第第第第第第第第7r于于于于于于干于 属1-1-1-1-属属 mi- 二丿一二丄二丄二一- -J 二一 二-一二.1 TTTTTTTV 34567890- 6666666771777777700000 弟第第第第第第第第第第第第第第第第第第第iil一I丁于于于于于于于于于于 sfi!-fi QK!药药药不不不芯衣慈 -II - - II - - - 1 - - - 1 FTI- - - - - - - - - - - - 二 丿 厂一广孑孑k云云云 TTTTTITTTT类类类类类类类类类类类类类类类类类 1 1 111111 1 1 1 1 11111 JU 第第第第第第第第第第第第第第第第第訓 于于于于于于于于于于于于于于于于于炜 属-fi-属属属属B-属属属JE-JE-属属属W =!K 尺尺尺大巨兀兀 jT-K F 尺尺尺士口01234567 址 一II-Z.一.-.:Li) r卜-rlI 一:-=ofa-1| 一| T| 1| 1| 1| 1| 1|rM 第第第第第第第第第第第第第第第第第心

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!