TuChong
这是一个图虫网的小爬虫/ A spider of TuChong
首先,图虫网是一个很棒的图片网站,这里的爬虫只是为了研究技术,请读者朋友们,不要大量采集网站信息,爬取的图片,请取得版权后再使用…
根据”分类名称”,获取json数据
根据json数据,获取图集url与title
#爬虫架构:
运行界面:
最终效果
会在同级目录下生成一个images的文件夹,里面有按照原主题命名的图片…
这是一个图虫网的小爬虫/ A spider of TuChong
首先,图虫网是一个很棒的图片网站,这里的爬虫只是为了研究技术,请读者朋友们,不要大量采集网站信息,爬取的图片,请取得版权后再使用…
#爬虫架构:
会在同级目录下生成一个images的文件夹,里面有按照原主题命名的图片…