题目
A.数据回收
B.数据采集
C.数据编辑
D.数据共享
第1题
A、网络爬虫实际上是一种"自动化浏览网络”的程序,或者说是一种网络机器人
B、网络爬虫被广泛用于互联网搜索引擎或其他类似网站
C、传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列直到满足系统的一定停止条件
D、目前互联网上的信息分类大多数都是人工完成的
第2题
A.在索引数据库中排序->从互联网上抓取网页->建立索引数据库
B.从互联网上抓取网页->建立索引数据库->在索引数据库中排序
C.建立索引数据库->从互联网上抓取网页->在索引数据库中排序
D.以上都不正确
第8题
A.暗网是一些垂直领域网站,它们通常是网站提供组合查询界面,用户按照需求输入查询之后,才能获取相关数据
B.爬虫的作用是为搜索引擎抓取大量的数据,抓取的对象是整个互联网上的网页
C.倒排列表是指记载出现过某个单词的所有文档的文档列表、以及单词在该文档中出现的位置信息
D.根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫
第10题
搜索引擎派出的一个能够在网上发现新网页并抓取文件的程序被称为蜘蛛 (spider)或机器人(robot)。()
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!