南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75

上传人:住在****她 文档编号:85566773 上传时间:2022-05-06 格式:DOCX 页数:13 大小:14.02KB
收藏 版权申诉 举报 下载
南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75_第1页
第1页 / 共13页
南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75_第2页
第2页 / 共13页
南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75_第3页
第3页 / 共13页
资源描述:

《南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75》由会员分享,可在线阅读,更多相关《南开大学2022年3月《数据科学导论》期末考核试题库及答案参考75(13页珍藏版)》请在装配图网上搜索。

1、南开大学2022年3月数据科学导论期末考核试题库及答案参考1. BFR聚类簇的坐标可以与空间的坐标保持一致。( )A.正确B.错误参考答案:B2. 2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?答案:大乔3. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A4. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T5. 用于描述相等时间间隔下连续数据随时间变化趋势的是( )A.折线图B.散点图C.条形图D.饼图参考答案:A6. K-means

2、算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A7. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B8. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A9. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B10. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A11. ECR系统由哪些部分组成的?ECR系统由哪些部分组成的?参考答案:ECR系统的基本结构包括两个部分,即基础设施和管理系统,其中,基础设施包括信息

3、系统和物流系统,管理系统包括营销管理和组织革新。12. 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。( )T.对F.错参考答案:T13. 如何理解计算机网络?如何理解计算机网络?参考答案:计算机网络就是将地理位置不同、具有独立功能的多个计算机系统,用通信线路和通信设备连接起来,在网络软件支持下,实现数据通信和资源共享的系统。14. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B15. k值增大意味着整体模型变得复杂

4、。( )k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B16. 关于网络推广与网络营销,以下表述错误的是( )A:在范围上,网络推广包括网络营销B:在投入上,网络关于网络推广与网络营销,以下表述错误的是( )A:在范围上,网络推广包括网络营销B:在投入上,网络推广投入比较少C:在执行上,网络推广的关键是执行力D:在目的上,网络推广重在“推广”答案:A17. for循环和while循环中都存在一个else扩展用法,continue关键字对else没有影响。( )A.正确B.错误参考答案:A18. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分

5、到超平面的两侧,则称该数据集是线性可分数据集。( )给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B19. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上

6、限也为200,总共每日最多获得400好心值。20. Netware采用的通信协议是( )A.NETBEUIB.NETXC.IPX/SPXD.TCP/IP参考答案:C21. 梦幻西游手游情缘使者在哪?梦幻西游手游情缘使者在哪?点击活动因缘际会,这样就可以自动寻路找到情缘使者了。22. 全局变量一定不能和局部变量同名。( )A.正确B.错误参考答案:B23. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F24. 以下属于关联分析的是( )。A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模参考答案:B25. 地下城与勇士(DNF)宠物学习终结技能的等级地下城与

7、勇士(DNF)宠物学习终结技能的等级学习技能级别根据宠物种类不同而不同,一般在2025级即可自动学习终结技能。26. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC27. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T28. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A29. 根据映射关系的不同可以分为线性回归和( )。A.对数回归B.非线性回归C.逻辑回归D.多元回归参考答案:B30. BFR聚类

8、是用于处理数据集( )的k-means变体。BFR聚类是用于处理数据集( )的k-means变体。A.大B.中C.小D.所有参考答案:A31. 以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感性D:购买频率更低答案:D32. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B33. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.

9、最小化标准差参考答案:C34. k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B35. 关联规则的评价度量主要有( )。A.支持度B.置信度C.准确率D.错误率参考答案:AB36. IPsec处于OSI七层模型的哪一层( )A、物理层B、链路层C、网络层D、应用层参考答案:C37. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A38. 在一元线性回归模型中,残差项服从( )分布。A.泊松B.正态C.线性D.非线性参考答案:B39. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C

10、.海量级数据分析D.巨量级数据分析参考答案:ABC40. 聚类的最简单最基本方法是( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A41. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考答案:ABCD42. 关于Python语言的注释,以下描述错误的是( )。A.Python语言的多行注释以(三个单引号)开头和结尾B.Python语言的单行注释以#开头C.Python语言有两种注释方式:单行注释和多行注释D.Python语言的单行注释以单引号开头参考答案:D43. 随着特征维数的增加,特征空间呈指数倍增长,样本密度急

11、剧减小,样本稀疏。( )A.正确B.错误参考答案:A44. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量参考答案:D45. 主流分布式计算平台有( )A.googleB.IBMC.baiduD.Amazon参考答案:ABD46. 不满足给定评价度量的关联规则是无趣的。( )不满足给定评价度量的关联规则是无趣的。( )A.正确B.错误参考答案:B47. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B48. 聚类是一种( )。A.有监督学习B.无监

12、督学习C.强化学习D.半监督学习参考答案:B49. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B50. 函数可以看作是一段具有名字的子程序,在需要的地方调用执行,不需要在每个执行地方重复编写这些语句。( )A.正确B.错误参考答案:A51. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B52. 规划一个C类网,需要将网络分为20个子网,每个子网最多5台主机,下列哪个是合适的子网掩码( )A、255. 255. 255.0。B、 255. 255. 255.224。C、 255. 255. 255.240。D、 255. 255.

13、 255.248参考答案:D53. 下面哪一项不是中国发展大数据产业的基础( )。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱参考答案:D54. 在数据预处理时,无论什么情况,都可以直接将异常值删除。( )A.正确B.错误参考答案:B55. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C56. 相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。( )A.正确B.错误参考答案:B57. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D58. 医疗大数据的来源主要包括( )A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络参考答案:ABCD59. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A60. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!