寻找爬虫入口 1 .本次任务的入口 这个爬虫的更好的入口就是我们平常使用的搜索引擎.搜索引擎虽然有很多种,但是其实都是在干一件事,收录网页,处理,然后提供搜索服务.在平时使用的过程中,我们通常都是直接输入了关键词就直接搜索了,但是其实还有很多的搜索技巧, 比如对于这个任务来说,只要我们这样搜索,就可以得到我们想要的数据了. site:zybang.com 现在我们在百度,谷歌, 搜狗, 360,必应里都分别试一下: 从上面的图中可以发现返回的数据量都在百万甚至是千万级别. 所以把这些数据作为这个