单选题 下面不属于爬虫的基本流程是( )

A、 发起请求
B、 获取响应内容
C、 使用throw语句抛出异常
D、 保存数据
下载APP答题
由4l***y2提供 分享 举报 纠错

相关试题

单选题 下面的代码运行打印结果正确的是:()

from Pandas import Series,DataFrame

import numpy as np

frame=DataFrame({"a":[1,6,5,3],"b":[4,-3,7,np.nan]})

print(frame.sum(axis=0))

A、
  1. a     15.0
    b     8.0
B、
  1. 0     5.0
    1     3.0
    2     12.0
    3     3.0
C、
  1. a     15.0 

b     Nan

D、
  1. 运行报错

单选题 以下不是请求头信息的是()

A、 Authenticate
B、 User-Agent
C、 Host
D、 Cookies

单选题 Beautiful Soup不支持解析的是:( )

A、 Html
B、 lxml
C、 Xml
D、 pdf

单选题 re模块的常用方法中,扫描整个字符串,并返回第一个成功匹配的结果的方法是()

A、 re.match()方法
B、 re.findall()方法
C、 re.search()方法
D、 re.sub()方法

单选题 \d 正则表示( )

A、 匹配任意非数字
B、 匹配任意数字
C、 匹配字母、数字及下划线
D、 匹配一个换行符

单选题 下列哪个状态代码表示请求成功()

A、 404
B、 200
C、 500
D、 302

单选题 下列不是request请求方式的是()

A、 GET
B、 POST
C、 POST
D、 ChangEvent

单选题 关于在urllib库中robotparser模块说法正确的是:()

A、 主要用来做可以用来识别网站的robots.txt文件,判断网站是否可以抓取数据
B、 出现错误捕获这些异常
C、 用来模拟发送请求
D、 提供了许多url处理方法,例如,拆分、解析和合并