know.py 爬虫的基本知识
平台:
Ubuntu
Python3
urllib库
chrome浏览器,抓包使用f12
spider_wallhalla.py
简单使用静态方法爬取https://wallhalla.com 网站的图片
参考:
https://blog.csdn.net/cquptcmj/article/details/53526137
https://www.cnblogs.com/zhouxuchen/p/4341034.html
spider_huaban.py
动态的花瓣网站,我们要抓包
实现自定义搜索,页数来进行下载,
多线程,速度飞起
教程写在文件里,不懂留言问我