从 https://weibo.cn/search/ 搜索页面检索主题词,爬取下面所有原创微博以及发博人信息,可选择使用代理服务器并可设定爬取的发博时间段
微博爬虫基于以下两个开源代码开发:
https://github.com/dataabc/weiboSpider https://github.com/Python3Spiders/WeiboSuperSpider
另外,本爬虫使用的代理池构建代码来自开源代码: https://github.com/WiseDoge/ProxyPool
在此向以上代码作者表示感谢!