-
Notifications
You must be signed in to change notification settings - Fork 1.2k
数据库表字段说明
thekingofcity edited this page Nov 9, 2018
·
9 revisions
鉴于部分同学对于数据库表结构理解比较吃力,所以添加表字段信息说明。
该表主要管理微博账号和密码
id | name | password | enable |
---|---|---|---|
主键,自增长,不用用户管理 | 登陆账号 | 登陆密码 | 账号是否有效,1表示有效,0表示无效,在程序运行的时候,如果账号被封,该字段会被程序置为0,如果账号密码不对,那么程序会把该字段设置为2 |
该表主要是配合做微博话题搜索使用,请在搜索话题之前向该表中插入关键词
id | keyword | enable |
---|---|---|
主键,自增长,不用用户管理 | 搜索关键词 | 关键词是否有效,1表示有效,0表示无效 |
该表主要存储种子用户,根据该表可抓取种子用户信息、种子用户的主页所有原创微博及其相关粉丝和关注
id | uid | is_crawled | other_crawled | home_crawled |
---|---|---|---|---|
主键,自增长,不用用户管理 | 种子用户id | 是否抓取过该用户信息,1表示已成功抓取,0表示未抓取,2表示抓取出错 | 是否抓取过该用户粉丝和关注,1表示是,0表示否 | 是否抓取过该用户主页微博,1表示是,0表示否 |
该表主要存储用户关系
id | user_id | follow_or_fans_id | type | crawl_time | from_where |
---|---|---|---|---|---|
主键,自增长,不用用户管理 | 当前用户id | 用户的关注或者粉丝id | 1表示粉丝,2表示关注 | 爬取时间 | 通过何种方式关注 |
该表主要存储用户个人信息
id | uid | name | gender | birthday | location | description | register_time | verify_type | verify_info | follows_num | fans_num | wb_num | level | tags | work_info | contact_info | education_info | head_img | isFan |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
主键 | 用户id | 昵称 | 性别,0表示未知,1表示男,2表示女 | 生日 | 位置 | 简介 | 注册时间 | 认证类型,0表示未认证,1表示个人认证,2表示企业认证 | 认证信息 | 关注数 | 粉丝数 | 微博数 | 等级 | 标签 | 工作信息 | 联系方式 | 教育信息 | 头像url | 已废弃 |
该表主要存储微博信息,目前微博信息有两个来源:1.通过抓取种子用户主页所有原创微博获取 2.通过搜索指定话题获取
id | weibo_id | weibo_cont | weibo_img | weibo_img_path | weibo_vedio | repost_num | comment_num | praise_num | uid | is_origin | device | weibo_url | create_time | comment_crawled | repost_crawled | dialogue_crawled | praise_crawled |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
主键 | 微博id | 微博内容 | 微博图片url | 微博图片保存路径 | 微博视频url | 转发数 | 评论数 | 点赞数 | 博主id | 是否是原创,1表示是,0表示否 | 发布设备 | 微博url | 发布时间 | 该微博评论是否已经抓取,1表示已经抓取,0表示未抓取 | 该微博的转发是否已经抓取,1表示已经抓取,0表示未抓取 | 该微博的对话是否已经抓取,1表示已经抓取,0表示未抓取 | 该微博的点赞是否已经抓取,1表示已经抓取,0表示未抓取 |
关键词--微博中间表,通过联结查询获取特定关键词相关微博
id | keyword_id | wb_id |
---|---|---|
主键 | 关键词主键 | 微博id(不是微博主键) |
微博评论表,存储微博id和其相关评论
id | comment_id | comment_cont | weibo_id | user_id | create_time |
---|---|---|---|---|---|
主键 | 评论id | 评论内容 | 微博id | 评论用户id | 评论时间 |
微博转发表,存储转发相关层级信息
id | user_id | user_name | weibo_id | parent_user_id | repost_time | repost_cont | weibo_url | parent_user_name | root_weibo_id |
---|---|---|---|---|---|---|---|---|---|
主键 | 当前转发用户id | 用户名 | 转发微博id | 上层用户id | 转发时间 | 转发内容 | 转发微博url | 上层用户名 | 源微博id |
微博点赞表,存储用户和微博id
id | user_id | weibo_id | crawl_time |
---|---|---|---|
主键 | 点赞用户id | 微博id | 抓取点赞时间 |