首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(一)
首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(二)
首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(三)
首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(四)
先发一个最终效果图的网址:https://www.cnvar.cn/ipostatus/(已删)
后期版本(参考,代码相差不大):https://cnf10.com/#ipo
最近我的同事跟我讨论起在某微信公众号看到的IPO发行情况,他说他比较好奇这些数据的来源出处。于是乎,我就把整个证监会网站都找了一遍,最终找到了一个并不起眼的网页:[【行政许可事项】发行监管部首次公开发行股票审核工作流程及申请企业情况 ][1] ,一番研究之后确定这个网页就是每周IPO发行情况的数据出处。本来这事应该就此结束,但鉴于这些用excel展示的数据并不直观,于是乎我就打算将其图像化。
页面数据和excel文件的爬取 -> 读取excel文件并将其合并统计-> 将此表格转为markdown形式(方便放在HEXO上显示)
+--main.py
+--processing
| +--data
| | +--graph.html
| | +--index.md
| | +--IPOstatus
| | | +--data
| | | | +--20180727.xls
| | | | +--20180803.xls
| | | | +--20180810.xls
| | | | +--20180817.xls
| | | | +--20180824.xls
| | | +--md
| | | | +--20180727.md
| | | | +--20180803.md
| | | | +--20180810.md
| | | | +--20180817.md
| | | | +--20180824.md
| | | +--stat.csv
| | | +--termination
| | | | +--20180803.xls
| | | | +--20180810.xls
| | | | +--20180817.xls
| | | | +--20180824.xls
| +--datatomd.py
| +--data_crawler.py
| +--generator.py
| +--__init__.py