Skip to content

moenn/shanbay-get

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

shanbay-get

与扇贝网相关的小爬虫

依赖的第三方库:
selenium
BeautifulSoup4
phantomJS

用来获取扇贝今日更新的所有文章,一般有 15 篇左右。文章链接存放到 get_today_article_links.py 所在目录下的  %Y%m%d.txt 文件中。 需要更改这行代码 >> driver = webdriver.PhantomJS(executable_path=r'你的phantomJS可执行文件所在路径')

获取今日更新文章上的所有笔记。
爬取规则有遗漏,需要更改...

获取扇贝小组里每个人的贡献值,并以 .pkl 文件存储到本地.

About

与扇贝网相关的小爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages