知乎问题图片爬虫

python版

python + selenium

selenium 打开知乎主页，点击登录按钮弹出登录框
用户手动输入用户名密码并登录（在代码中设置用户名和密码后，可自动填充）
时限过后，根据用户指定的问题URL开始模拟浏览并爬取图片
将图片存入本地

nodejs版 v1.0

nodejs + puppeteer

跳转到用户指定的问题URL开始模拟浏览并爬取图片
正则筛选img标签中的src部分
TODO:图片保存至本地

nodejs版 v2.0

nodejs + ES6 + request-promise

基于知乎问题api，用request重写的2.0版本

摈弃了无头浏览器，解决了1.0版本由于使用无头浏览器导致的爬取效率低下的问题

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
nodejs_ver		nodejs_ver
python_ver		python_ver
LICENSE		LICENSE
README.md		README.md
package.json		package.json
puppeteer_crawler.js		puppeteer_crawler.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

知乎问题图片爬虫

python版

python + selenium

nodejs版 v1.0

nodejs + puppeteer

nodejs版 v2.0

nodejs + ES6 + request-promise

About

Releases

Packages

Languages

License

n8659150/zhihuCrawler

Folders and files

Latest commit

History

Repository files navigation

知乎问题图片爬虫

python版

python + selenium

nodejs版 v1.0

nodejs + puppeteer

nodejs版 v2.0

nodejs + ES6 + request-promise

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages