爬虫日常篇,不定时更新,所有文件均在spider下,其他目录是给朋友写的脚本
爬虫目标网站是:H网站,小说网站等等,如果你有更好的h网站,可以共享出来,好人一生平安
我是Lovesosoi,你身边的爬虫小帮手
喜欢的话,点个star支持下
Reptile daily articles, updated from time to time, all files are under the spider, other directories are scripts written for friends
The crawler target website is: H website, novel website, etc. If you have a better website, you can share it, and a good man's life is happy
I am Lovesosoi, the reptile helper around you.
Like it, click on a star to support it.
├── README.md -------------------- Readme
├── friend -------------------- 帮别人改的脚本
│ ├── __init__.py
│ └── zk
│ ├── __init__.py
│ └── gainMzPic.py
├── other ---------------------- 其他小脚本
│ ├── __init__.py
│ └── tuling.py ------------------ 图灵机器人
├── spider
│ ├── __init__.py
│ ├── bowl_ml ------------------- bowl 爬虫
│ │ ├── __init__.py
│ │ └── url_spider.py
│ ├── dmmsee -------------------- dmmsee 爬虫
│ │ ├── __init__.py
│ │ └── runSpider.py
│ ├── javhoo ---------------------- javhoo 爬虫
│ │ ├── __init__.py
│ │ └── runSpider.py
│ ├── meizitu --------------------- 妹子图 爬虫
│ │ ├── Spider_Meizi.py
│ │ └── __init__.py
│ ├── movie
│ │ └── __init__.py
│ ├── pronhd --------------------- prohd 爬虫
│ │ ├── __init__.py
│ │ └── spider_pronhd.py
│ ├── qingyule9--------------------- qingyule9爬虫
│ │ ├── Spider_QYL9.py
│ │ ├── Spider_info.py
│ │ └── __init__.py
│ └── s_566ii -------------------- s_566ii爬虫
│ ├── Spider_566ii.py
│ └── __init__.py
├── test ----------------------------- 测试包请忽略
│ ├── __init__.py
│ ├── download_test.py
│ ├── image.jpg
│ ├── py_torrent.py
│ └── test.torrent
├── utils -------------------------- 工具类
│ ├── BsUtil.py
│ ├── CiyunUtil.py ---------------- 词云工具类
│ ├── DownloadUtil2.py ------------ 下载工具类二 不建议使用请用下载工具一
│ ├── DownloadUtils.py ------------ 下载工具类一 建议使用
│ ├── GetEncoding.py -------------- 获取当前页面的编码
│ ├── MysqlUtil.py ---------------- 数据库工具类
│ ├── SpiderUtil.py --------------- 爬虫工具类
│ ├── UserAgentSeed.py
│ ├── __init__.py
文件路径:/spider/bowl_ml
网站:http://cape.gq.gq/ (H网站大全)
目标:爬下所有h站的链接
产物:csv (已完成,待上传)
文件路径:/spider/dmmsee
网站:https://www.dmmsee.net/(AV磁力链接大全)
目标:获取所有女优的所有视频链接
产物:csv(未完成)
文件路径:/spider/javhoo
网站:https://www.javhoo.ca/(AV磁力连接大全)
目标:获取所有女优的所有视频链接
产物:csv (未完成)
文件路径:/spider/meizitu
网站:https://www.mzitu.com/all(妹子图)
目标:获取所有妹子的所有图片
产物:妹子图(已完成,待上传)
文件路径:/spider/pronhd
网站:https://www.pornhd.com/ (H网站)
目标:获取H视频链接
产物:H视频链接(未完成)
文件路径:/spider/qingyule9
网站:http://qingyule9.com/(H网站)
目标:获取H视频链接
产物:H视频链接(未完成)
文件路径:/spider/s_566ii
网站:https://www.566ii.com/(H网站)
目标:获取H视频链接
产物:H视频链接(未完成)
待更新
待更新