这节我们介绍爬虫能用来干什么.如今每天互联网上的流量足足有10亿GB左右,不可能毫无选择的全部爬取下来,这是要根据我们自己的需求来有选择的爬取相对应的数据.那爬虫可以用来干什么呢?我们根据实际需要将爬虫的目标分为三类.第一类是通过搜索引擎的网络爬虫来充实搜索引擎的索引列表.这部分需求所需要的数据是各种网页的地址,标题,主题字等等.
关注时代Java