Skip to content

lvm0306/HSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

42 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

爬虫日常篇,不定时更新,所有文件均在spider下,其他目录是给朋友写的脚本

爬虫目标网站是:H网站,小说网站等等,如果你有更好的h网站,可以共享出来,好人一生平安

我是Lovesosoi,你身边的爬虫小帮手

喜欢的话,点个star支持下

Reptile daily articles, updated from time to time, all files are under the spider, other directories are scripts written for friends

The crawler target website is: H website, novel website, etc. If you have a better website, you can share it, and a good man's life is happy

I am Lovesosoi, the reptile helper around you.

Like it, click on a star to support it.

如果你有好的爬虫脚本,H网站,小说网站,电影网站等等也都也欢迎提交,我会将爬好的内容做成app,方便大家使用,喜欢的话,点个star呗

目录简介

├── README.md  -------------------- Readme
├── friend     -------------------- 帮别人改的脚本
│   ├── __init__.py
│   └── zk
│       ├── __init__.py
│       └── gainMzPic.py
├── other     ---------------------- 其他小脚本
│   ├── __init__.py
│   └── tuling.py ------------------ 图灵机器人
├── spider
│   ├── __init__.py
│   ├── bowl_ml  ------------------- bowl 爬虫
│   │   ├── __init__.py
│   │   └── url_spider.py
│   ├── dmmsee  -------------------- dmmsee 爬虫
│   │   ├── __init__.py
│   │   └── runSpider.py
│   ├── javhoo ---------------------- javhoo 爬虫
│   │   ├── __init__.py
│   │   └── runSpider.py
│   ├── meizitu --------------------- 妹子图 爬虫
│   │   ├── Spider_Meizi.py
│   │   └── __init__.py
│   ├── movie
│   │   └── __init__.py
│   ├── pronhd   --------------------- prohd 爬虫
│   │   ├── __init__.py
│   │   └── spider_pronhd.py
│   ├── qingyule9--------------------- qingyule9爬虫
│   │   ├── Spider_QYL9.py
│   │   ├── Spider_info.py
│   │   └── __init__.py
│   └── s_566ii  -------------------- s_566ii爬虫
│       ├── Spider_566ii.py
│       └── __init__.py
├── test ----------------------------- 测试包请忽略
│   ├── __init__.py
│   ├── download_test.py
│   ├── image.jpg
│   ├── py_torrent.py
│   └── test.torrent
├── utils  -------------------------- 工具类
│   ├── BsUtil.py  
│   ├── CiyunUtil.py ---------------- 词云工具类
│   ├── DownloadUtil2.py ------------ 下载工具类二 不建议使用请用下载工具一
│   ├── DownloadUtils.py ------------ 下载工具类一 建议使用
│   ├── GetEncoding.py -------------- 获取当前页面的编码
│   ├── MysqlUtil.py ---------------- 数据库工具类
│   ├── SpiderUtil.py --------------- 爬虫工具类
│   ├── UserAgentSeed.py 
│   ├── __init__.py

项目简介

bowl

文件路径:/spider/bowl_ml
网站:http://cape.gq.gq/ (H网站大全)
目标:爬下所有h站的链接
产物:csv (已完成,待上传)

dmmsee

文件路径:/spider/dmmsee
网站:https://www.dmmsee.net/(AV磁力链接大全)
目标:获取所有女优的所有视频链接
产物:csv(未完成)

javhoo

文件路径:/spider/javhoo
网站:https://www.javhoo.ca/(AV磁力连接大全)
目标:获取所有女优的所有视频链接
产物:csv (未完成)

meizitu

文件路径:/spider/meizitu
网站:https://www.mzitu.com/all(妹子图)
目标:获取所有妹子的所有图片
产物:妹子图(已完成,待上传)

pronhd

文件路径:/spider/pronhd
网站:https://www.pornhd.com/ (H网站)
目标:获取H视频链接
产物:H视频链接(未完成)

qingyule9

文件路径:/spider/qingyule9
网站:http://qingyule9.com/(H网站)
目标:获取H视频链接
产物:H视频链接(未完成)

s_566ii

文件路径:/spider/s_566ii
网站:https://www.566ii.com/(H网站)
目标:获取H视频链接
产物:H视频链接(未完成)

工具类的使用

待更新

App

待更新

Releases

No releases published

Packages

No packages published

Languages