地区农林牧渔产业聚类分析研究

上传人:仙*** 文档编号:37399540 上传时间:2021-11-03 格式:DOC 页数:10 大小:396.50KB
收藏 版权申诉 举报 下载
地区农林牧渔产业聚类分析研究_第1页
第1页 / 共10页
地区农林牧渔产业聚类分析研究_第2页
第2页 / 共10页
地区农林牧渔产业聚类分析研究_第3页
第3页 / 共10页
资源描述:

《地区农林牧渔产业聚类分析研究》由会员分享,可在线阅读,更多相关《地区农林牧渔产业聚类分析研究(10页珍藏版)》请在装配图网上搜索。

1、地区农林牧渔产业聚类分析研究 农林牧渔业是最为基础的上游行业,各个地区的农林牧渔业的发展是该城市中游行业(加工业)和下游行业(市场导向)的基础。为研究我国各地区农林牧渔业产业结构的分布规律,搜集了2010年全国内地各地区的数据资料,并抽取了其中24个地区的粮食产量、油料产量、水果产量、大牲畜期末存栏头数、猪牛羊肉产量以及水产品产量的数据样本进行聚类研究分析。本文的研究意义在于将24个样本分类,并分析各地区的区别和分类的原因,研究各地区在农林牧渔业方面的发展优势,为各类地区的未来几年的经济发展提出建设性的建议。这里我们运用统计软件SAS软件进行帮助分析。首先采用系统聚类CLUSTER过程其中的W

2、ard法(即离差平方和法)分析将24个样本分为几类最为合适,Ward法的基本思想是,现将n个样品各自成一类,此时W=0;然后每次将其中某两类合并为一类,因每缩小一类离差平方和就要增加,每次选择是W增加最小的两类进行合并,直至所有的样品合并为一类为止。使用Wrad法我们得到的结果如下:一、采用系统聚类法进行聚类分析1)采用Ward最小方差聚类法进行聚类分析所得结果:就上表我们可以从4个数据结果进行讨论:(1) 由RSQ的变化情况看,当分为4个类之前,并类过程中减少是逐渐的,改变不大,当分为4个类和3个类时差别较大,所以从看分为4个类较合适。(2)由SPRSQ(半偏)知,某步的半偏值越大说明上一步

3、合并的效果好此例中NCL1,2和3时,较大,故分为2个类、3个类或4个类是较合适的。(3)伪F统计量(列标题为PSF)越大表示这些观测样品可显著地分为NCL个类。此例伪F最大和次大分别为NCL5和4 (当NcL7),说明根据伪F准则分为5个类或4个类是较合适的。(4)伪统计量值大表明上一次合并的两个类是很分开的也就是上一次聚类的效果是好的此例伪 最大和次大分别为NCL1和3,说明根据伪准则分为3个类或4个类是较合适的。综上所述,讨论的结果大致确定下来,分为3个类或4个类是较合适的。2)然后使用Ward法中的TREE过程绘制聚类过程图得到的谱系聚类图如下:上图是已将分组确定为4组得到的分类过程步

4、骤,从上图观察可得,山东处于一个比较尴尬的分类位置,它和其他其他三类都有点格格不入,所以它自成一组,第四组也就山东一个地区。3)同样的,Ward法分为四类的结果也是与该图相对应的,其分类结果如下:根据上表显示,分类的结果为:=北京、天津、上海、海南、山西、重庆、甘肃、贵州、吉林、云南、陕西=辽宁、浙江、福建、广东=河北、江苏、安徽、湖南、湖北、四川、黑龙江、河南=山东(4)为了更明确该种分类的合理性,我整理了每个组合包含样品的各个数据水平的平均值,如下:类别第一类第二类第三类第四类该类包含的地区北京,天津,上海,海南,吉林,重庆,甘肃,贵州,云南,山西,陕西广东,福建,浙江,辽宁河南,四川,河

5、北,黑龙江,安徽,江苏,湖北,湖南山东粮食产量平均数901.1241090.38253419.81784316.3油料产量平均数32.35852.3757232.7653334.5水果产量平均数286.055703.89905631.402492728.2548大牲畜期末存栏头数平均数330.20814817.2086532.647445335.6142猪牛羊肉产量平均数98.791527203.39693354.89785684.1329水产品产量平均数28.566618559.19443185.17578753.5939上表数据表明第一类地区属于农林牧渔业发展水平比较低的城市,特别是粮食产

6、量,第二类地区的发展水平相对较高,第三类地区是属于农业大省,它的粮食产量占了全国总样本粮食产量的很大一部分,而第四类山东,既是粮食产量大省,水产品产量也特别大,考虑到它是沿海地区,这也是很合理的。第一类样本2010年农林牧渔业总产值均值为1018.5777亿元;第二类样本2010年农林牧渔业总产值均值为2835.3211亿元;第三类样本2010年农林牧渔业总产值均值为3590.9612亿元;第四类样本2010年农林牧渔业总产值均值为6650.94亿元;通过上面的分析,我们可以发现Ward法的分类结果得到每类的农林牧渔业总产值之间的差距很明显,所以采用Ward法得到分类效果较好。下面我们采用另一

7、种分类方法动态聚类法,其基本思想是,开始先粗略地分一下类,然后按照某种最优的原则修改不合理的分类,直至分类比较合理为止,这样就形成一个最终的分类结果。它对应的SAS过程为FASTCLUS(快速聚类)过程。二、采用动态聚类法进行聚类分析首先调用STANDARD过程将数据标准化,然后用标准化变换后的数据进行动态聚类分析。(1)动态聚类的初始凝聚点,凝聚点是一批具有代表性的点,是欲形成类的中心的点。下面的初始点是从标准化数据集中按指定规则选取的4个观测样品。(2)动态聚类的分类结果(数据标准化)=天津、上海、北京、江苏、海南、安徽、甘肃、贵州、重庆、山西、吉林、云南、湖南、湖北、黑龙江、陕西、河北=

8、山东=浙江、福建、辽宁、广东=河南、四川(3)结果分析类别第一类第二类第三类第四类该类包含的地区北京,天津,上海,海南,吉林,重庆,甘肃,贵州,云南,陕西,陕西,河北,黑龙江,安徽,江苏,湖北,湖南山东广东,福建,浙江,辽宁河南,四川粮食产量平均数1687.48864316.31090.38254291.8油料产量平均数83.72213334.552.3757397.39水果产量平均数404.329122728.2548703.89905662.115大牲畜期末存栏头数平均数335.639095335.6142817.20861093.8023猪牛羊肉产量平均数163.72833684.132

9、9203.39693571.254水产品产量平均数94.209941753.5939559.1944397.035观察上表,我们发现动态聚类法的分类结果中有两类是和Ward法是相同的,即第二类和第三类。根据上表的数据,山东省粮食产量、水果产量、大牲畜期末存栏数以及水产品产量比一般的地区都高,这可能是它区别于其他城市另成一组的原因。根据实际情况,由于山东省的地理位置和气候环境,比较适合农作物水果种植,饲养牲畜以及发展水产品产业。所以山东利用这些优势,近年来经济发展水平稳步提高,2010年山东的农林牧渔业生产总值达6650.94亿元。而第四类地区的油料产量最大,粮食产量也很高,结合其地理位置我们推

10、测,这两个地区的农业应该发展得比较好,四川、河南2010年的农林牧渔业总产值分别为4081.81亿元和3258.11亿元。第三类地区水产品产量比较高,这四个地区2010年农林牧渔业总产值平均值为2835.3211亿元。第一类包含17个地区,其农林牧渔业总产值平均值为1917.1838亿元,但是考虑到这17个地区中有相对而言面积比较小的直辖市,它们的农林牧渔业总产值比较小也是理所当然,并且像北京、上海这样的比较发达的城市,它们是主要的经济活动中心城市,发展农林牧渔业是比较次要的。就从农林牧渔业总产值均值来看,动态聚类法是比较合理的,但是第一类中最大值是河北达4309.42亿元,而最小值是上海为2

11、87.03亿元,这样看来分类的效果似乎不是非常理想。三、结果与讨论1、Ward法所得结果为:=北京、天津、上海、海南、山西、重庆、甘肃、贵州、吉林、云南、陕西=辽宁、浙江、福建、广东=河北、江苏、安徽、湖南、湖北、四川、黑龙江、河南=山东类别第一类第二类第三类第四类该类包含的地区北京,天津,上海,海南,吉林,重庆,甘肃,贵州,云南,山西,陕西广东,福建,浙江,辽宁河南,四川,河北,黑龙江,安徽,江苏,湖北,湖南山东农林牧渔业总产值均值(亿元)1018.57772835.32113590.96126650.942、动态聚类法所得结果为:=天津、上海、北京、江苏、海南、安徽、甘肃、贵州、重庆、山西

12、、吉林、云南、湖南、湖北、黑龙江、陕西、河北=山东=浙江、福建、辽宁、广东=河南、四川类别第一类第二类第三类第四类该类包含的地区北京,天津,上海,海南,吉林,重庆,甘肃,贵州,云南,陕西,陕西,河北,黑龙江,安徽,江苏,湖北,湖南山东广东,福建,浙江,辽宁河南,四川农林牧渔业总产值均值(亿元1917.18386650.942835.32113458.5656就从分类后各组农林牧渔业总产值来看,是Ward法分类效果较好,而且在实际应用中,离差平方和法的应用比较广泛,它要求样品间距离采用欧式距离。总之不同的分类方法会得到不同的分类结果,以上分析结果可以总结为以下几点:(1)山东省是农林牧渔业发展较

13、好的地区,该地区应该充分利用其气候地理优势,更好的发展农林牧渔业,为山东省的经济发展作出贡献;(2)各地区有各地区的发展优势,对于经济发达的地区(例如北京,上海)发展农林牧渔业则放在比较次要的地位;(3)内陆土地面积较广阔的地区的粮食产量较大,可以推断出那些地区发展农业比较合适;例如:河北、吉林、黑龙江、安徽、河南等(4)沿江海地区应该凭借这种优势更好地发展水产职业。例如:广东、江苏、山东、浙江附录:1、数据表1 关于农林牧渔业各地区抽取数据地区粮食产量(万吨)x1油料产量(万吨)x2水果产量(万吨)x3大牲畜期末存栏头数(万头)x4猪牛羊肉产量(万吨)x5水产品产量(万吨)x6beijing

14、124.81.890.323.3727.65.8tianjin156.290.5467.049728.2230.6934.17hebei2910.17143.271578.62536.66336.8100.41shanxi9428.3991449.2008133.688361.07983.1liaoning159155.3499477.2144515.6266.8534.7jilin246050.464.06556.65158.633116.5heilongjiang435328.249.3241567.4156.638.07shanghai121.683.3879104.68616.5218

15、.118330.8986jiangsu3230.1162.23235.4139.645215.24443.22zhejiang789.1543.24712.4120.37130.95429.6anhui3069.8725240.3472745.7591149.47261.1648183.1462fujian666.8826.27564.0870.2841146.81569.67shandong4316.3334.52728.25485335.6142684.1329753.5939henan5389532.98755.91080.11615.193.94hubei2309.1314.05402

16、.15335.56304.77333.9hunan2902.7179.2449715.7267444.84422.1188.59guangdong1314.584.64291061.89182662.5803269.0277702.8077hainan187.6049.1042267.9486575.9743.0518145.49chongqing1137.240.54212.87122.85154.487520.39shanxi1131.454.381150.45193.0290.15.6gansu906.258.5447277.56623.2277.33631.1942yunnan1576

17、.9250.16342.74742.57270.8843.06guizhou1168.2778.6782119.74626.2112154.738.03sichuan3194.6261.8568.331107.4945527.408100.13注:数据来自ccer数据库。时间:2010年表2 各地区2010年农林牧渔业总产值地区农林牧渔业总产值(亿元)beijing328tianjin317.33hebei4309.42shanxi1047.8483liaoning3106.5jilin1850.28heilongjiang2536.3004shanghai287.03jiangsu4297.

18、14zhejiang2172.86anhui2955.449fujian2307.06shandong6650.94henan3258.11hubei3501.99hunan3787.47guangdong3754.8644hainan821.3089chongqing1021.1328shanxi1666.0575gansu1057.0174yunnan1810.53guizhou997.82sichuan4081.81注:数据来自ccer数据库。时间:2010年2、程序:data nlmy;input region$ x1-x6;cards;beijing124.81.890.323.37

19、27.65.8tianjin156.290.5467.049728.2230.6934.17hebei2910.17143.271578.62536.66336.8100.41shanxi9428.3991449.2008133.688361.07983.1liaoning159155.3499477.2144515.6266.8534.7jilin246050.464.06556.65158.633116.5heilongjiang435328.249.3241567.4156.638.07shanghai121.683.3879104.68616.5218.118330.8986jiang

20、su3230.1162.23235.4139.645215.24443.22zhejiang789.1543.24712.4120.37130.95429.6anhui3069.8725240.3472745.7591149.47261.1648183.1462fujian666.8826.27564.0870.2841146.81569.67shandong4316.3334.52728.25485335.6142684.1329753.5939henan5389532.98755.91080.11615.193.94hubei2309.1314.05402.15335.56304.7733

21、3.9hunan2902.7179.2449715.7267444.84422.1188.59guangdong1314.584.64291061.89182662.5803269.0277702.8077hainan187.6049.1042267.9486575.9743.0518145.49chongqing1137.240.54212.87122.85154.487520.39shanxi1131.454.381150.45193.0290.15.6gansu906.258.5447277.56623.2277.33631.1942yunnan1576.9250.16342.74742

22、.57270.8843.06guizhou1168.2778.6782119.74626.2112154.738.03sichuan3194.6261.8568.331107.4945527.408100.13;proc cluster data=nlmy method=ward std pseudo outtree=nlmy;var x1 x2 x3 x4 x5 x6;id region;proc tree data=nlmy horizontal graphics n=4 out=wardnlmy ;copy x1 x2 x3 x4 x5 x6;titletable ward;run;ti

23、tleward;proc sort data=wardnlmy;by cluster;run;proc print data=wardnlmy;var cluster x1 x2 x3 x4 x5 x6;run;proc means data=wardnlmy ;by cluster;var x1-x6;run;proc standard data=nlmy mean=0 std=1 out=outsta ;var x1-x6;proc fastclus data=outsta out=outstaa maxc=4 list;var x1-x6;id region;run;3、主要参考资料:应用多元统计分析 高惠璇 北京大学出版社

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!