python新闻爬虫

新闻网站爬虫，课程设计与人合作完成的小项目，基于python3 scrapy，UI界面采用tkinter，数据库采用mongodb，利用机器学习训练数据，对新闻进行分类，并存储到mongo数据库中，通过用户界面展示出来

目前由于训练集内容过大，暂时没有上传机器学习部分

scrapy爬虫代码学习自网上，仅作个人学习使用。以下是原版说明：

作者：jasonren0403 ———————————————————————————————————————————————————————————

news_hotspot_crawler

基于scrapy的国内各大新闻网站内容爬虫
入口文件还未编写，请进入hotspot_crawler文件夹中，运行
scrapy crawl 爬虫名
以开始爬虫过程，爬虫结果将保存在news_items文件夹中，日志将保存在hotspot_crawler/logs文件夹中

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
__pycache__		__pycache__
hotspot_crawler		hotspot_crawler
.gitignore		.gitignore
GUI1.py		GUI1.py
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
scrapy.cfg		scrapy.cfg
spider.png		spider.png