说明:本教程使用的是基于Python3图片采集爬虫,自动采集1024img并发布到WordPress博客展示,需要配合Chevereto图床一起使用,这里说下搭建教程,且只适用于国外的服务器。
使用教程
1、安装Python 3.6
#检查系统是否有Python3
python3 -V
#安装Python3
#CentOS系统
wget https://www.moewah.com/source/CentOS_Python3.6.sh && sh CentOS_Python3.6.sh
#Debian系统
wget https://www.moewah.com/source/Debian_Python3.6.sh && sh Debian_Python3.6.sh2、安装Python所需库
pip3 install requests
pip3 install pymysql3、下载并编辑爬虫
wget https://www.moewah.com/source/Python3/1024-spider.py
nano 1024-spider.py修改如下:
1、设置连接的Mysql数据库信息,在代码第11行。
2、还有要修改第26、28行的图床Key,和图床url,只支持chevereto。
3、第80行文章分类ID(默认未分类)。
4、保留了采集一次后停止60s后再采集,如果不需要,删除第121行即可。4、运行爬虫
chmod +x 1024-spider.py
python3 1024-spider.py建议配合screen一起使用,参考:Screen 命令安装及使用方法 & 让进程在后台稳定运行的几种方法。
爬虫来源:Github地址

