- 添加测试配置
- 添加 Makefile
- 添加git提交预检查
- 自动继承上个请求的cookie(假设存在)
- 中间件添加
- 请求头
- 代理
- 请求间隔
- 重定向
- 统计响应状态
- 其他
- 添加管道
- mysql
- mongodb
- local csv/json/xlsx
- 其他
- 添加解析字段的额外处理逻辑
- 解析前
- 解析后
- 添加浏览器的抓取方式 (中间件形式)
- 添加通过点击生成配置的前端展示 生成配置
- 其他
- 添加接口方式提交配置进行抓取
- 封装成容器
- 根据通用配置生成requests爬虫
-
Notifications
You must be signed in to change notification settings - Fork 4
基于scrapy的通用爬虫框架
License
ling-yuan/base_spider
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
基于scrapy的通用爬虫框架