南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10

上传人:住在山****ck 文档编号:111928495 上传时间:2022-06-21 格式:DOCX 页数:12 大小:19.35KB
收藏 版权申诉 举报 下载
南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10_第1页
第1页 / 共12页
南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10_第2页
第2页 / 共12页
南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10_第3页
第3页 / 共12页
资源描述:

《南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10》由会员分享,可在线阅读,更多相关《南开大学21春“物联网工程”《数据科学导论》离线作业(一)辅导答案10(12页珍藏版)》请在装配图网上搜索。

1、长风破浪会有时,直挂云帆济沧海。 住在富人区的她 南开大学21春“物联网工程”数据科学导论离线作业(一)辅导答案一.综合考核(共50题)1.为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。()A.正确B.错误参考答案:A2.利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。()A.正确B.错误参考答案:B3.下面不是分类的常用方法的有()。A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场参考答案:D4.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产

2、量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C5.聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A6.支持度是衡量关联规则重要性的一个指标。()A.正确B.错误参考答案:A7.平均减少的不纯度越大,则特征重要度越高。()A.正确B.错误参考答案:A8.比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()A.异常值B.不一致的值C.重复值D.缺失值参考答案:C9.手肘法的核心指标是()A.SESB.SSEC.RMSED

3、.MSE参考答案:B10.神经网络中误差精度的提高可以通过增加隐含层中的神经元数目来实现。()A.正确B.错误参考答案:A11.信息熵越大,数据信息的不确定性越小。()A.正确B.错误参考答案:B12.设X=1,2,3是频繁项集,则可由X产生()个关联规则。A.4B.5C.6D.7参考答案:C13.以下属于关联分析的是()。A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模参考答案:B14.Apriori算法的加速过程依赖于以下哪个策略?()A.抽样B.剪枝C.缓冲D.并行参考答案:B15.多层感知机的学习能力有限,只能处理线性可分的二分类问题。()A.正确B.错误参考答案

4、:B16.朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。()A.正确B.错误参考答案:A17.在一元线性回归模型中,残差项服从()分布。A.泊松B.正态C.线性D.非线性参考答案:B18.通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C19.单层感知机是由()层神经元组成。A.一B.二C.三D.四参考答案:B20.利用K近邻法进行分类时,k值过小容易发生过拟合现象。()A.正确B.错误参考答案:A21.置信度(confiden

5、ce)是衡量兴趣度度量()的指标。A.简洁性B.确定性C.实用性D.新颖性参考答案:B22.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C23.K均值(K-Means)算法是密度聚类。()A.正确B.错误参考答案:B24.多层感知机是由()层神经元组成。A.二B.三C.大于等于二层D.大于等于三层参考答案:D25.对于项集来说,置信度没有意义。()A.正确B.错

6、误参考答案:A26.什么情况下结点不用划分()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC27.聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习参考答案:B28.通过变量标准化计算得到的回归方程称为()A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程参考答案:A29.关联规则可以用枚举的方法产生。()A.正确B.错误参考答案:A30.聚合方法是自底向上的方法。()A.正确B.错误参考答案:A31.相关性分析主要是分析个别独立

7、变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。()A.正确B.错误参考答案:B32.剪枝是决策树学习算法对付“过拟合”的主要手段。()A.正确B.错误参考答案:A33.两个对象越相似,他们的相异度就越高。()A.正确B.错误参考答案:B34.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C35.BFR聚类用于()在欧氏空间中对数据进行聚类。A.高维B.中维C.

8、低维D.中高维参考答案:A36.K-means算法采用贪心策略,通过迭代优化来近似求解。()A.正确B.错误参考答案:A37.下列两个变量之间的关系中,哪个是函数关系?()A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度参考答案:C38.数据科学具有哪些性质?()A.有效性B.可用性C.未预料D.可理解参考答案:ABCD39.赤池信息准则是衡量统计模型拟合优良性的一种标准。()A.正确B.错误参考答案:A40.相关性的分类,按照相关的方向可以分为()。A.正相关B.负相关C.左相关D.右相关参考答案:AB41.聚类的主要方法有()。A.划分聚类B.层次聚类C.密度聚

9、类D.距离聚类参考答案:ABC42.通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C43.决策树的输入为训练集,输出为以node为根结点的一棵决策树。()A.正确B.错误参考答案:A44.聚类的最简单最基本方法是()A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A45.在树的结构中,特征越重要,就越远离根节点。()A.正确B.错误参考答案:B46.特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。()A.正确B.错误参考答案:A47.数据分析师的任务用模型来回答具体问题,了解数据,其来源和结构。()A.正确B.错误参考答案:B48.BFR聚类是用于处理数据集()的k-means变体。A.大B.中C.小D.所有参考答案:A49.Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。()A.正确B.错误参考答案:A50.集中趋势能够表明在一定条件下数据的独特性质与差异。()A.正确B.错误参考答案:B

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!