2023年《Python数据分析和应用》实验二--pandas统计分析基础

上传人:h****3 文档编号:222378283 上传时间:2023-07-10 格式:DOCX 页数:7 大小:12.33KB
收藏 版权申诉 举报 下载
2023年《Python数据分析和应用》实验二--pandas统计分析基础_第1页
第1页 / 共7页
2023年《Python数据分析和应用》实验二--pandas统计分析基础_第2页
第2页 / 共7页
2023年《Python数据分析和应用》实验二--pandas统计分析基础_第3页
第3页 / 共7页
资源描述:

《2023年《Python数据分析和应用》实验二--pandas统计分析基础》由会员分享,可在线阅读,更多相关《2023年《Python数据分析和应用》实验二--pandas统计分析基础(7页珍藏版)》请在装配图网上搜索。

1、2023年Python数据分析和应用实验二-pandas统计分析基础下面是我为大家整理的Python数据分析和应用实验二-pandas统计分析基础,供大家参考。实验二s Pandas 统计分析基础任务 1 读取 mtcar 数据并实现以下操作 (1)查看 mtcar 数据集的元素的个数、维度、大小等信息,输出表的列名。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(mtcars 的元素个数为:n,mtcars.size) print(mtcars 的元素维度为:n,mtcars.ndim) print(mt

2、cars 的元素大小为:n,mtcars.shape) print(mtcars 的表的列名为:n,mtcars.columns) (2)使用 describe 方法对整个 mtcar 数据集进行描述性统计。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(对整个 mtcar 数据集进行描述性统计为:n,mtcars.describe() (3)计算不同 cyl(气缸数)、carb(化油器)对应的 mpg(油耗)和 hp(马力)的均值。import pandas as pd mtcars=pd.read_cs

3、v(D:桌面实验二datamtcars.csv) x=mtcars.loc:,cyl,carb,mpg,hp y=x.groupby(cyl,carb).mean() print(不同 cyl(气缸数)、carb(化油器)对应的 mpg(油耗)和 hp(马力)的均值为:n,y)(4)输出 mpg 和 hp 前 5 个元素。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) x=mtcarsmpg,hp:5 print(mpg 和 hp 前 5 个元素为:n,x) (5)输出 mtcar 数据的前 3 行元素。import

4、pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) x=mtcars:1:3 print(mtcar 数据的前 3 行元素为:n,x) (6)使用 head()和 tail()方法输出前后 5 行数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(mtcar 数据的前 5 行元素为:n,mtcars.head() print(mtcar 数据的后 5 行元素为:n,mtcars.tail()(7)用 loc 和 iloc 分别提取第 1 列和第 3

5、 列的数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(mtcar 数据的第 1 列和第 3 列的数据为:n,mtcars.loc:,mpg,disp) print(mtcar 数据的第 1 列和第 3 列的数据为:n,mtcars.iloc:,1,3) (8)取出列名为 mpg、hp,行名为 2,3,4 的数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(列名为 mpg、hp,行名为 2,3,4 的数据为:n,

6、mtcars.loc2:4,mpg,hp) (9)取出列位置为 2 和 4,行位置为 5,6,7 的数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv)print(列位置为 2 和 4,行位置为 5,6,7 的数据为:n,mtcars.iloc5:8,2,4) #前闭后开区间 (10)取出列位置为 3,行名为 2-6 的数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(列位置为 3,行名为 2-6 的数据为:n,mtcars.l

7、oc2:6,disp) (11)新增 1 列,名称为 abc(abc=mpg+hp),输出前 5 行数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) mtcarsabc=mtcarsmpg+mtcarshp print(输出前 5 行数据为:n,mtcars.head() (12)删除前两行数据。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) print(删除前两行数据前的长度为:n,len(mtcars) mtcars.drop(labe

8、ls=range(0,2),axis=0,inplace=True) print(删除前两行数据后的长度为:n,len(mtcars) print(前五行数据为:n,mtcars.head()(13)删除 abc 列。import pandas as pd mtcars=pd.read_csv(D:桌面实验二datamtcars.csv) mtcarsabc=mtcarsmpg+mtcarshp print(删除 abc 前列索引为:n,mtcars.columns) mtcars.drop(labels=abc,axis=1,inplace=True) print(删除 abc 后列索引为:

9、n,mtcars.columns) 任务 2 导入鸢尾花数据,实现以下操作 特别注意:导入后的 DataFrame 仅含 5 列:Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species(1)读入数据,输出前五行 import pandas as pd iris=pd.read_csv(D:桌面实验二datairis.csv) print(前五行的数据为:n,iris.head() (2)统计每个品种的数量 import pandas as pd iris=pd.read_csv(D:桌面实验二datairis.csv)print(每个

10、品种的数量为:n,irisSpecies.value_counts() (3)按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少? import pandas as pd iris=pd.read_csv(D:桌面实验二datairis.csv) print(每个品种的数量为:n,iris.groupby(Species).max() (4)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值 import pandas as pd iris=pd.read_csv(D:桌面实验二datairis.csv) def range_iris(arr): re

11、turn arr.max()-arr.min() print(每个品种所有属性数值的跨度范围为:n,iris.groupby(Species).agg(range_iris) (5)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值 import pandas as pd iris=pd.read_csv(D:桌面实验二datairis.csv) print(每个品种所有属性数值的平均值、最大值为:n, iris.groupby(Species).mean(),iris.groupby(Species).max()任务 3从 excel 文件 foods.xlsx 读取数据,并

12、将 ID 列作为索引。(1)输出该 DataFrame。import pandas as pd foods=pd.read_excel(D:桌面实验二datafoods.xlsx) print(输出为:n,foods) (2)生成如下样式的透视表,统计不同产地和类别食品价格及数量的平均值。 import pandas as pd foods=pd.read_excel(D:桌面实验二datafoods.xlsx) print(透视表为:n,foods.pivot_table(价格,数量,index=产地,columns=类别) (3)生成如下样式的透视表,统计不同产地和类别食品价格的最大值,缺

13、失值填充 0。import pandas as pd foods=pd.read_excel(D:桌面实验二datafoods.xlsx) print(透视表为:n,foods.pivot_table(价格,index=产地,columns=类别,fill_value=0) (4)生成如下样式的透视表,统计不同产地和类别食品价格的均值,缺失值填充 0,并提供分项统计。 import pandas as pd foods=pd.read_excel(D:桌面实验二datafoods.xlsx) print(透视表为:n,foods.pivot_table(价格,index=产地,columns=类别, aggfunc=mean,margins=True) (4)生成如下样式的交叉表,统计不同产地和类别食品的频次。import pandas as pd foods=pd.read_excel(D:桌面实验二datafoods.xlsx) print(透视表为:n,pd.crosstab(foods产地,foods类别)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!