###爬取微信公众号文章
- Python 3.4+
- BeautifulSoup
- requests
- selenium
- phantomjs
在搜狗微信搜索平台搜公众号名称,在url里获得公众号的openid
get_account_info()
获取账号信息,可传入openid、url、cookies
parse_list()
获取文章列表,可传入openid、link
parse_essay()
获取文章内容,传入文章链接
update_cookies()
更新cookies,触发反爬虫时使用
open_id = 'oIWsFt3nvJ2jaaxm9UOB_LUos02k'
cookies = update_cookies()
print(get_account_info(open_id,cookies=cookies))
#{'description': '一个基于内容分享的社区——「交流故事·沟通想法」', 'logo'...
print(parse_list(open_id))
#[{'link': 'http://mp.weixin.qq.com/s?__biz=MjM5NjM4OTAyMA==&mid=206650