Skip to content

基于模块化的设计,提供丰富的视频算法实现、产业级的视频算法优化与应用,包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等,涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。

License

Notifications You must be signed in to change notification settings

wuyefa/PaddleVideo

 
 

Repository files navigation

English | 中文

PaddleVideo

近期活动

🌟 1月17号-21号《产业级视频技术与应用案例》 🌟

  • 【1月17号20:15-21:30】视频技术导论及医疗行业典型案例
  • 【1月18号20:15-21:30】视频内容智能分析和生产解决方案
  • 【1月19号20:15-21:30】体育+安全防范行业中的行为识别
  • 【1月20号20:15-21:30】顶会冠军视频分割算法深度解密
  • 【1月21号20:15-21:30】多模态学习和检索方法

👀 报名链接: https://paddleqiyeban.wjx.cn/vj/QIValIZ.aspx?udsid=419689 课程回放链接: https://aistudio.baidu.com/aistudio/course/introduce/6742

​ 💖 欢迎大家扫码入群讨论 💖

  • 添加成功后回复【视频】加入交流群

简介

python version paddle version

PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。


模型案例库

模型

行为识别方法
PP-TSM (PP series) PP-TSN (PP series) PP-TimeSformer (PP series) TSN (2D’) TSM (2D‘)
SlowFast (3D’) TimeSformer (Transformer‘) VideoSwin (Transformer’) AttentionLSTM (RNN‘)
基于骨骼点的动作识别方法
ST-GCN (Custom’) AGCN (Adaptive‘)
时序动作检测方法
BMN (One-stage‘)
时空动作检测方法
SlowFast+Fast R-CNN
多模态
ActBERT (Learning‘) T2VLAD (Retrieval‘)
视频目标分割
CFBI (Semi‘) MA-Net (Supervised‘)
单目深度估计
ADDS (Unsupervised‘)

数据集

动作识别
Kinetics-400 (Homepage) (CVPR'2017) UCF101 (Homepage) (CRCV-IR-12-01) ActivityNet (Homepage) (CVPR'2015) YouTube-8M (Homepage) (CVPR'2017)
动作定位
ActivityNet (Homepage) (CVPR'2015)
时空动作检测
AVA (Homepage) (CVPR'2018)
基于骨架的动作识别
NTURGB+D (Homepage) (IEEE CS'2016) FSD (Homepage)
单目深度估计
Oxford-RobotCar (Homepage) (IJRR'2017)
文本视频检索
MSR-VTT (Homepage) (CVPR'2016)
文本视频预训练
HowTo100M (Homepage) (ICCV'2019)

应用案例

Applications Descriptions
FootballAction 足球动作检测方案
BasketballAction 篮球动作检测方案
TableTennis 乒乓球动作识别方案
FigureSkating 花样滑冰动作识别方案
VideoTag 3000类大规模视频分类方案
MultimodalVideoTag 多模态视频分类方案
VideoQualityAssessment 视频质量评估方案
PP-Care 3DMRI医疗图像识别方案
EIVideo 视频交互式分割工具
Anti-UAV 无人机检测方案
AbnormalActionDetection 异常行为检测方案

文档教程

赛事支持

许可证书

本项目的发布受Apache 2.0 license许可认证。

致谢

About

基于模块化的设计,提供丰富的视频算法实现、产业级的视频算法优化与应用,包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等,涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 95.4%
  • Shell 3.0%
  • C++ 1.3%
  • CMake 0.3%