简体中文 | English

PP-YOLOE

内容

简介
模型库
使用说明
附录

简介

PP-YOLOE是基于PP-YOLOv2的卓越的单阶段Anchor-free模型，超越了多种流行的yolo模型。PP-YOLOE有一系列的模型，即s/m/l/x，可以通过width multiplier和depth multiplier配置。PP-YOLOE避免使用诸如deformable convolution或者matrix nms之类的特殊算子，以使其能轻松地部署在多种多样的硬件上。更多细节可以参考我们的report。

PP-YOLOE-l在COCO test-dev2017达到了51.4的mAP, 同时其速度在Tesla V100上达到了78.1 FPS。PP-YOLOE-s/m/x同样具有卓越的精度速度性价比, 其精度速度可以在模型库中找到。

PP-YOLOE由以下方法组成

可扩展的backbone和neck
Task Alignment Learning
Efficient Task-aligned head with DFL和VFL
SiLU激活函数

模型库

模型	GPU个数	每GPU图片个数	骨干网络	输入尺寸	Box AP^val	Box AP^test	Params(M)	FLOPs(G)	V100 FP32(FPS)	V100 TensorRT FP16(FPS)	模型下载	配置文件
PP-YOLOE-s	8	32	cspresnet-s	640	42.7	43.1	7.93	17.36	208.3	333.3	model	config
PP-YOLOE-m	8	28	cspresnet-m	640	48.6	48.9	23.43	49.91	123.4	208.3	model	config
PP-YOLOE-l	8	20	cspresnet-l	640	50.9	51.4	52.20	110.07	78.1	149.2	model	config
PP-YOLOE-x	8	16	cspresnet-x	640	51.9	52.2	98.42	206.59	45.0	95.2	model	config

注意:

PP-YOLOE模型使用COCO数据集中train2017作为训练集，使用val2017和test-dev2017作为测试集，Box AP^test为mAP(IoU=0.5:0.95)评估结果。
PP-YOLOE模型训练过程中使用8 GPUs进行混合精度训练，如果训练GPU数和batch size不使用上述配置，须参考FAQ调整学习率和迭代次数。
PP-YOLOE模型推理速度测试采用单卡V100，batch size=1进行测试，使用CUDA 10.2, CUDNN 7.6.5，TensorRT推理速度测试使用TensorRT 6.0.1.8。
PP-YOLOE推理速度测试使用tools/export_model.py并设置-o exclude_nms=True脚本导出的模型，并用deploy/python/infer.py设置--run_benchnark参数得到。测试结果均为不包含数据预处理和模型输出后处理(NMS)的数据(与YOLOv4(AlexyAB)测试方法一致)。
如果你设置了--run_benchnark=True, 你首先需要安装以下依赖pip install pynvml psutil GPUtil。

使用教程

1. 训练

执行以下指令使用混合精度训练PP-YOLOE

python -m paddle.distributed.launch --gpus 0,1,2,3,4,5,6,7 tools/train.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml --amp

** 注意: ** 使用默认配置训练需要设置--amp以避免显存溢出.

2. 评估

执行以下命令在单个GPU上评估COCO val2017数据集

CUDA_VISIBLE_DEVICES=0 python tools/eval.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams

在coco test-dev2017上评估，请先从COCO数据集下载下载COCO test-dev2017数据集，然后解压到COCO数据集文件夹并像configs/ppyolo/ppyolo_test.yml一样配置EvalDataset。

3. 推理

使用以下命令在单张GPU上预测图片，使用--infer_img推理单张图片以及使用--infer_dir推理文件中的所有图片。

# 推理单张图片
CUDA_VISIBLE_DEVICES=0 python tools/infer.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams --infer_img=demo/000000014439_640x640.jpg

# 推理文件中的所有图片
CUDA_VISIBLE_DEVICES=0 python tools/infer.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams --infer_dir=demo

4. 部署

Paddle Inference Python & C++
Paddle-TensorRT
Paddle2ONNX
PaddleServing

PP-YOLOE在GPU上部署或者推理benchmark需要通过tools/export_model.py导出模型。

当你使用Paddle Inference但不使用TensorRT时，运行以下的命令进行导出

python tools/export_model.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams

当你使用Paddle Inference的TensorRT时，需要指定-o trt=True进行导出

python tools/export_model.py -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams trt=True

deploy/python/infer.py使用上述导出后的Paddle Inference模型用于推理和benchnark.

# 推理单张图片
CUDA_VISIBLE_DEVICES=0 python deploy/python/infer.py --model_dir=output_inference/ppyolo_r50vd_dcn_1x_coco --image_file=demo/000000014439_640x640.jpg --device=gpu

# 推理文件夹下的所有图片
CUDA_VISIBLE_DEVICES=0 python deploy/python/infer.py --model_dir=output_inference/ppyolo_r50vd_dcn_1x_coco --image_dir=demo/ --device=gpu

# benchmark
CUDA_VISIBLE_DEVICES=0 python deploy/python/infer.py --model_dir=output_inference/ppyolo_r50vd_dcn_1x_coco --image_file=demo/000000014439_640x640.jpg --device=gpu --run_benchmark=True

如果你想将PP-YOLOE模型导出为ONNX格式，参考 PaddleDetection模型导出为ONNX格式教程

# 导出推理模型
python tools/export_model.py configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml --output_dir=output_inference -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams

# 安装paddle2onnx
pip install paddle2onnx

# 转换成onnx格式
paddle2onnx --model_dir output_inference/ppyoloe_crn_l_300e_coco --model_filename model.pdmodel --params_filename model.pdiparams --opset_version 11 --save_file ppyoloe_crn_l_300e_coco.onnx

5. 泛化性验证

模型	AP	AP₅₀
YOLOX	22.6	37.5
YOLOv5	26.0	42.7
PP-YOLOE	30.5	46.4

注意

试验使用VisDrone数据集, 并且检测其中的9类，包括 person, bicycles, car, van, truck, tricyle, awning-tricyle, bus, motor.
以上模型训练均采用官方提供的默认参数，并且加载COCO预训练参数
由于人力/时间有限，后续将会持续补充更多验证结果，也欢迎各位开源用户贡献，共同优化PP-YOLOE

附录

PP-YOLOE消融实验

序号	模型	Box AP^val	参数量(M)	FLOPs(G)	V100 FP32 FPS
A	PP-YOLOv2	49.1	54.58	115.77	68.9
B	A + Anchor-free	48.8	54.27	114.78	69.8
C	B + CSPRepResNet	49.5	47.42	101.87	85.5
D	C + TAL	50.4	48.32	104.75	84.0
E	D + ET-Head	50.9	52.20	110.07	78.1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_cn.md

README_cn.md

PP-YOLOE

内容

简介

模型库

使用教程

1. 训练

2. 评估

3. 推理

4. 部署

5. 泛化性验证

附录

Files

README_cn.md

Latest commit

History

README_cn.md

File metadata and controls

PP-YOLOE

内容

简介

模型库

使用教程

1. 训练

2. 评估

3. 推理

4. 部署

5. 泛化性验证

附录