Skip to content

Latest commit

 

History

History
20 lines (18 loc) · 593 Bytes

README.md

File metadata and controls

20 lines (18 loc) · 593 Bytes

bttwo

LICENSE

使用python3爬取bttwo全站bt文件,并利用mongodb来存储二进制文件和去重

Usage

使用之前请安装lxml,requests,BeautifulSoup以及mongodb

pip3 install lxml requests beautifulsoup4

修改bttwo.py文件里的下载路径,运行

python3 bttwo.py

Known issue

  • 使用代理并不能有效解决爬取速度过快而导致的爬取出错的问题

TODO LIST

  1. 尝试不用sleep函数解决爬取中断问题
  2. 尝试多线程 ​