WEIBOSpider

This is project that capture sina weibo datas

第一种方式

原理就是抓页面html元素来获取数据

第一种方式是抓取网页DOM中的元素，那是否有更直接的方式？当然，可以请求API并取用返回数据，而且可以获得更详细的数据。
移动端微博的API:https://m.weibo.cn/api/container/getIndex?containerid={containerid}_-_WEIBO_SECOND_PROFILE_WEIBO&page_type=03&page={page}
可通过get方法请求上面的API，再将数据结构JSON反序列化一下，直接从API结果获取数据。

    if 'reads_count' in mblog:
        list1.append(mblog['reads_count'])
    else:
        list1.append(0)

如上代码，reads_count只有在当前cookie和爬取的微博账户是同一个账号时才起作用，因为微博只有自己才能看到个人微博阅读量。爬取非cookie账户的微博时阅读量默认是0。

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
assets		assets
src		src
.gitignore		.gitignore
README.md		README.md