南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35

上传人:住在山****ck 文档编号:109398050 上传时间:2022-06-16 格式:DOCX 页数:7 大小:21.18KB
收藏 版权申诉 举报 下载
南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35_第1页
第1页 / 共7页
南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35_第2页
第2页 / 共7页
南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35_第3页
第3页 / 共7页
资源描述:

《南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35》由会员分享,可在线阅读,更多相关《南开大学22春“计算机科学与技术”《网络爬虫与信息提取》离线作业(一)辅导答案35(7页珍藏版)》请在装配图网上搜索。

1、书山有路勤为径,学海无涯苦作舟! 住在富人区的她南开大学22春“计算机科学与技术”网络爬虫与信息提取离线作业(一)辅导答案一.综合考核(共50题)1.以下哪些方法属于Python写CSV文件的方法?()A.writeheadersB.writeheaderC.writerrowsD.writerow参考答案:ACD2.下列关于在IOS上配置charles的说法正确的是()A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口B.手机和电脑需要在同一个局域网下C.HTTP代理可以使用“自动”选项D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charle

2、s中有数据包在流动参考答案:BD3.对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888。()T.对F.错参考答案:T4.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令scroll.vert.forward。()A.正确B.错误参考答案:B5.Python中一个函数没有返回值则可以写()。A.没有returnB.returnC.return NoneD.return NULL参考答案:ABC6.HTTP常用状态码表明服务器上没有请求的资源的是()A.500B.503C.403D.404参考答案:D7.HTTP常用状态码表明服务器正忙的是()

3、A.500B.503C.403D.404参考答案:B8.下列说法错误的是()。A.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本,并在Python脚本里面直接操作HTTP和HTTPS的请求,以及返回的数据包B.命令行中执行mitmdump -s parse_request.py即可运行python脚本C.使用python可以自定义返回的数据包,如response.headers,就是返回的头部信息D.如果返回的是JSON类型的字符串,python无法进行解析参考答案:D9.查看网站请求一般在Chrome开发者模式下的()选项

4、卡中查看A.ConsoleB.SourcesC.NetworkD.Perance参考答案:C10.服务器端记录信息确定用户身份的数据是()。A.sessionB.cookiesC.moonpiesD.localstorage参考答案:A11.使用UI Automator打开微信的操作是获取相应图标后使用命令()。A.touchB.clickC.pushD.hover参考答案:B12.PyMongoDB中排序方法sort第二个参数1表示降序。()T.对F.错参考答案:F13.Scrapy的工程名字不能使用scrapy,否则爬虫会无法运行。除此以外工程名不受限制。()T.对F.错参考答案:F14.

5、下面代码一共执行循环多少次(): for i in range(10): print(i * i)A.9B.10C.11D.0参考答案:B15.Python中若定义object=“12345”,则print(object:-1)输出()。A.1B.5C.54321D.程序报错参考答案:C16.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()。A.列表B.元组C.字典D.集合参考答案:C17.以下HTTP状态码表示服务器没有正常返回结果的是()。A.200B.301C.404D.500参考答案:BCD18.网络爬虫的用途有()。A.收集数据B.尽职调查C.提高流量D.

6、攻击服务器参考答案:ABC19.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取。()A.正确B.错误参考答案:B20.爬虫中间件的作用对象是请求request和返回response。()A.正确B.错误参考答案:B21.为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。()T.对F.错参考答案:T22.Python中Object=1, 2, 3, 4, 5,则Objcet是()A.列表B.元组C.字典D.集合参考答案:A23.在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()A.spiders文件夹B.item.

7、pyC.pipeline.pyD.settings.py参考答案:B24.HTTP常用状态码表明服务器正忙的是()。A.500B.503C.403D.404参考答案:B25.MongoDB中获取名字为db的库的语句为()A.client.dbB.client(db)C.clientdbD.clientdb参考答案:AC26.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行。()A.正确B.错误参考答案:B27.device.sleep()方法是使用UI Automatorr关闭屏幕的命令。()A.正确B.错误参考答案:A28.引用中间件时后面的数字代表的是中间件的执行顺序,例如

8、AdvanceSpider.middlewares.ProxyMiddleware:543 中的543。()A.正确B.错误参考答案:A29.设置了这个中间件以后,仍然需要输入账号密码可以成功得到登录以后才能看到的HTML。()A.正确B.错误参考答案:B30.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.EclipseD.Visual Studio 2010参考答案:AB31.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。()A.正确B.错误参考答案:A32.插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1

9、。()A.正确B.错误参考答案:B33.当运行爬虫代码后,出现“Forbidden by robots.txt”提示后,说明当前时间段被爬取的网站无法访问。()A.正确B.错误参考答案:B34.使用python定制mitmproxy,下面的语句请求的是()。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent参考答案:D35.Python中通过Key来从字典object中读取对应的Value的方法有()。A.objectkeyB.object.get(key)C.object.pop(key)D.object.pop()参考答案:AB36

10、.Python正则表达式中“.*?”是非贪婪模式,获取最短的能满足条件的字符串。()A.正确B.错误参考答案:A37.当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入就可以了。()A.正确B.错误参考答案:B38.lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据。A.etree.tostringB.etree.convertBytesC.etree.toBytesD.etree.convertstring参考答案:A39.Python中()与元组由类似的数据读取方式A.字符串B.列表C.字典D

11、.集合参考答案:AB40.PyMongo删除操作有()A.deleteB.delete_allC.delete_oneD.delete_many参考答案:ACD41.windows中创建定时任务的命令为()。A.taskB.schtasksC.createtasksD.maketasks参考答案:B42.HTTP状态码302表示资源永久重定向。()T.对F.错参考答案:F43.Python中一个函数可以有()个return语句A.0B.1C.多个D.2参考答案:ABCD44.Python可以将列表或字典转换成Json字符串。()T.对F.错参考答案:T45.Redis中的值可以支持()。A.列

12、表B.哈希C.集合D.有序集合参考答案:ABCD46.Python中一个函数没有返回值则可以写()A.没有returnB.returnC.return NoneD.return NULL参考答案:ABC47.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库。()T.对F.错参考答案:T48.在配置ios使用Charles的操作中,正确的有()A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任参考答案:ABCD49.在Windows中下若要运行Redis可以运行redis-server/usr/local/etc/redis.conf。()T.对F.错参考答案:F50.HTTP常用状态码表明表明服务器本身发生错误的有()A.403B.404C.500D.503参考答案:CD

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!