Skip to content

Latest commit

 

History

History
50 lines (40 loc) · 1016 Bytes

README.md

File metadata and controls

50 lines (40 loc) · 1016 Bytes

电影爬虫及搜索网站说明

本份代码中包含了国内大多数电影网站的爬虫,详细列表为:

  1. 爱奇艺
  2. 乐视
  3. m1905
  4. PPTV
  5. QQ电影
  6. 搜狐电影
  7. 土豆电影
  8. 迅雷电影
  9. 优酷
  10. 豆瓣电影库

爬虫

代码是一年前写好的,所以爬虫可能已经失效,不过在此基础上改改应该就可以了。

K:\GIT\dianying\scripts>tree /f
文件夹 PATH 列表
卷序列号为 EE77-EC45
K:.
│  iqiyi_movie_test.pyletv_movie_test.pym1905_movie_test.pypps_movie_test.pypptv_movie_test.pyqq_movie_test.pysohu_movie_test.pytudou_movie_test.pyxunlei_movie_test.pyyouku_movie_test.py
│
└─douban
        doubanapi_1.py
        doubanapi_2.py
        doubanapi_3.py
        doubanapi_xj.py
        douban_movie_test.py

搜索网站

dianying_web.py支持将爬虫保存到mongodb中的数十万条记录以WEB方式的形式展示,并支持关键字查询。