1024.py 从1024 爬取 图片和bt 保存到D://1024/(根页面标题)// 目录 下, 并且bt的名称和最近一张图片保持一致,目录清晰明了!默认 只爬取二级页面第一页的所有的根页面 但还有少部分图像和bt下载失败,原因可能是部分连接失效或者post参数问题。可设置代理下载,由于代理体验不好默认不走代理。由于我电脑八核,默认开了七个进程爬取,在开始的地方可以修改 getProxy.py 获取代理ip并保存验证通过的ip
※下一步将主演关键字追加到bt文件名后面!
※这是python代码,如果小白想要运行的话 window下建议安装 pycharm 其他需要的模块直接通过pycharm安装,基本不需要改动就可以运行。