Skip to content

新闻网站爬虫,在课程设计与人合作完成的小项目,基于python3 scrapy,UI界面采用tkinter,,数据库采用mongodb,利用机器学习训练数据

License

Notifications You must be signed in to change notification settings

xiaqiyang/PyNewsSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

python新闻爬虫

新闻网站爬虫,课程设计与人合作完成的小项目,基于python3 scrapy,UI界面采用tkinter,数据库采用mongodb,利用机器学习训练数据,对新闻进行分类,并存储到mongo数据库中,通过用户界面展示出来

目前由于训练集内容过大,暂时没有上传机器学习部分

scrapy爬虫代码学习自网上,仅作个人学习使用。 以下是原版说明:

作者:jasonren0403 ———————————————————————————————————————————————————————————

news_hotspot_crawler

基于scrapy的国内各大新闻网站内容爬虫
入口文件还未编写,请进入hotspot_crawler文件夹中,运行
scrapy crawl 爬虫名
以开始爬虫过程,爬虫结果将保存在news_items文件夹中,日志将保存在hotspot_crawler/logs文件夹中

About

新闻网站爬虫,在课程设计与人合作完成的小项目,基于python3 scrapy,UI界面采用tkinter,,数据库采用mongodb,利用机器学习训练数据

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages