南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5

上传人:住在****帅小... 文档编号:154777952 上传时间:2022-09-21 格式:DOCX 页数:13 大小:17.76KB
收藏 版权申诉 举报 下载
南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5_第1页
第1页 / 共13页
南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5_第2页
第2页 / 共13页
南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5_第3页
第3页 / 共13页
资源描述:

《南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5》由会员分享,可在线阅读,更多相关《南开大学2022年3月“计算机科学与技术”《网络爬虫与信息提取》平时作业一(答案参考)试卷号:5(13页珍藏版)》请在装配图网上搜索。

1、书山有路勤为径,学海无涯苦作舟! 住在富人区的她南开大学2022年3月“计算机科学与技术”网络爬虫与信息提取平时作业一(答案参考)一.综合考核(共45题)1.Python中一个函数可以有()个return语句。A.0B.1C.多个D.2参考答案:ABCD2.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()。A.列表B.元组C.字典D.集合参考答案:C3.自动填充验证码的方式有()A.手动识别填写B.图像识别C.打码网站D.浏览器自动识别参考答案:BC4.下面Python代码输出为():def default_para_trap(para=, value=0):par

2、a.append(value)return paraprint(第一步:.format(default_para_trap(value=100)print(第二步:.format(default_para_trap(value=50)A.第一步:100第二步:100,50B.第一步:100第二步:50C.第一步:100第二步:D.第一步:100第二步:100参考答案:A5.“curl http:/爬虫服务器IP地址:6800/cancel.json-d project=工程名-d job=爬虫JOBID”该命令的作用是启动爬虫。()A.正确B.错误参考答案:B6.最常见的HTTP请求类型有()

3、A.GETB.POSTC.SENDD.RECEIVE参考答案:AB7.使用UI Automatorr操作实体键的命令为device.press.实体按键名称。()A.正确B.错误参考答案:A8.当爬虫创建好了之后,可以使用scrapy()命令运行爬虫。A.startupB.starwarC.drawlD.crawl参考答案:D9.Python中以下哪个容器里的元素不能重复()A.列表B.元组C.字典D.集合参考答案:D10.网站返回的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。()T.对F.错参考答案:F11.Charles是一个

4、收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次。()A.正确B.错误参考答案:A12.以下哪些方法属于Python写CSV文件的方法?()A.writeheadersB.writeheaderC.writerrowsD.writerow参考答案:ACD13.以下HTTP状态码表示服务器本身发生错误的是()A.400B.503C.302D.500参考答案:BD14.Python中定义函数关键字为()。A.defB.defineC.funcD.function参考答案:A15.Python中条件语句在使用or连接的多

5、个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。()A.正确B.错误参考答案:A16.Robo 3T与RoboMongo是完全不一样的软件。()A.正确B.错误参考答案:B17.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题。A.sB.cC.dD.r参考答案:D18.需要登录的网站一般通过GET请求就可以实现登录。()A.正确B.错误参考答案:B19.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.EclipseD.Visual Studio 2010参考答案:AB20.Python正则表达式中“.*?”是非贪婪模式,获取

6、最短的能满足条件的字符串。()A.正确B.错误参考答案:A21.PyMongo中逻辑查询表示不等于的符号是()A.$gtB.$ltC.$eqD.$ne参考答案:C22.数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。()T.对F.错参考答案:T23.Python读CSV文件需要哪个方法?()A.CSVReaderB.CsvReaderC.DictReaderD.FileReader参考答案:C24.浏览器用来记录用户状态信息的数据叫()A.sessionB.cookiesC.moonpiesD.selenium参考答案:B25.在使用多线程处理问题时,线程池设置

7、越大越好。()A.正确B.错误参考答案:B26.Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本。()T.对F.错参考答案:T27.xpath中extract方法返回值类型是()A.列表B.元组C.字典D.集合参考答案:A28.使用python定制mitmproxy,下面的语句请求的是()。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent参考答案:D29.下列说法错误的是()A.小程序的请求极其简单,基本上没有验证信息B.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多C.

8、如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据D.小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率参考答案:B30.RoboMongo是MongoDB的管理软件。()T.对F.错参考答案:T31.查看网站请求一般在Chrome开发者模式下的()选项卡中查看A.ConsoleB.SourcesC.NetworkD.Perance参考答案:C32.requests中post请求方法的第二个参数可以为()。A.字典B.列表C.json数据D.字符串参考答案:AC33.要使用Python来操作UI Automator从而控制手机,需要安

9、装一个第三方库()A.uiautomatorB.automatorC.ui_automatorD.pyautomator参考答案:A34.UI Automator Viewer与Python uiautomator可以同时使用。()A.正确B.错误参考答案:B35.windows中创建定时任务的命令为()。A.taskB.schtasksC.createtasksD.maketasks参考答案:B36.cookies的缺点是()A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量参考答案:CD37.为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法?()A.

10、仔细检查代码B.开发爬虫中间件C.开发下载器中间件D.等待参考答案:AB38.Python中有哪些实现多线程方法?()A.multiprocess.dummyB.threading.ThreadC.processD.PyMongoDB参考答案:AB39.Python中通过Key来从字典object中读取对应的Value的方法有()A.objectkeyB.object.get(key)C.object.pop(key)D.object.pop()参考答案:AB40.Python中退出循环应用关键字()A.breakB.continueC.exitD.return参考答案:A41.Python正则表达式模块的findall方法返回结果为()A.列表B.元组C.字典D.集合参考答案:A42.使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward()。()T.对F.错参考答案:F43.Python中使用下面代码打开文件也需要对文件进行close关闭操作 with open(文件路径,文件操作方式,encoding=utf-8)as f。()A.正确B.错误参考答案:B44.Cookies一般包含在请求头Headers中。()A.正确B.错误参考答案:A45.HTTP状态码302表示资源永久重定向。()T.对F.错参考答案:F

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!