Releases: JimSunJing/douban_crawler
Releases · JimSunJing/douban_crawler
书影个人详细备份
书影个人详细备份(PersonalCrawler.py)
导出 csv 比较适合导入到 Notion
DouList+Photo Album Back-up
豆列爬取上线,相册爬取是内置在doulist.exe内的。
Movie+Book Feature Clawer
增加了电影特征的爬取。会比较慢以及产生大量网页访问。
Diary+Critique back-up
新增豆瓣日记与评论备份
这次写了class,代码不再那么烂了(虽然还是很菜)
boardcast back-up plan
保存广播的HTML文件和txt文件,有可能需要你提供cookie。
abandon selenium
一些bug的修复以及用requests代替了易出错的selenium(感谢@yuanjingsong 提供的思路
MusicBugfix
有的音乐条目居然没有intro。。。修复了无intro导致程序中断的问题。
movie+music+read_backup
得到的文件编码是'Utf-8',excel打开乱码的解决方案:【excel:数据:自文本:打开文件:选择编码方式:Unicode(utf-8)】
read备份你实在不行的话就放弃吧,豆瓣已读的防爬虫做的挺不错的。
anyway,你也可以豆邮我看下我有没有时间帮你备份,或者在我日记下求助其他成功的人也可以。
我豆瓣id:91835006