一、简介
1、名称:又被称为网页蜘蛛,网络机器人。
2、解释:是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
3、背景:随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。
二、功能
1、 对抓取目标的描述或定义。
2、对网页或数据的分析与过滤。
3、对网页或数据的搜索策略。
三、分类
1、通用网络爬虫。
2、聚焦网络爬虫。
3、增量式网络爬虫。