Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Roadmap of PaddleDetection #7892

Closed
thinkthinking opened this issue Mar 8, 2023 · 27 comments
Closed

Roadmap of PaddleDetection #7892

thinkthinking opened this issue Mar 8, 2023 · 27 comments

Comments

@thinkthinking
Copy link
Collaborator

thinkthinking commented Mar 8, 2023

We will pin this issue to collect new features or anything you want to say to the PaddleDetection team. We will actively incorporate them into future version updates, and we also welcome everyone to participate in the open source development of PaddleDetection.

In this issue, you can leave a comment to:

  1. Suggest new features for PaddleDetection;
  2. Point out areas where PaddleDetection needs improvement or where it is not yet perfect (if you have technical issues during use, please ask questions by creating a new issue. Here, mainly suggestions and complaints are welcome);
  3. Support other people's comments with 👍, or against with 👎;

If you encounter technical issues during the business implementation process or have collaboration needs, please send an email to yezhenjie@baidu.com for communication.

我们将置顶这个issue以便于收集您对PaddleDetection新特性需求或者任何想对PaddleDetection团队说的话,我们会积极融入到后续的版本更新中,同时也欢迎大家参与到PaddleDetection的开源建设中。

您可以通过评论的方式:

  1. 提出对PaddleDetection新特性的需求;
  2. 提出PaddleDetection做的还不完善、需要改进的点(如果是在使用过程中遇到的技术问题,还是通过新建issue的方式进行提问,这里主要是一些描述性的建议、吐槽);
  3. 通过👍来支持其他人的评论,通过👎来反对其他人的评论;

如果在业务落地过程中遇到了技术问题或者有合作共建的需求,欢迎发送邮件到yezhenjie@baidu.com进行沟通。

@monkeycc
Copy link

monkeycc commented Mar 10, 2023

【希望增加手部关键点的模型】

隔壁家全家桶
甚至专门开创了一个新的框架 用于关键点检测
https://github.com/open-mmlab/mmpose

包括 2D多人姿态估计、2D手部姿态估计、2D人脸关键点检测、133关键点的全身人体姿态估计、3D人体形状恢复、服饰关键点检测、动物关键点检测等

说明还是有市场需求和用户需求的

@thinkthinking
Copy link
Collaborator Author

thinkthinking commented Mar 10, 2023

希望增加手部关键点的模型

隔壁家全家桶 甚至专门开创了一个新的框架 用于关键点检测 https://github.com/open-mmlab/mmpose

包括 2D多人姿态估计、2D手部姿态估计、2D人脸关键点检测、133关键点的全身人体姿态估计、3D人体形状恢复、服饰关键点检测、动物关键点检测等

说明还是有市场需求和用户需求的

@monkeycc 感谢建议,目前手势关键点检测已经在路上啦,黑客松悬赏已经有人揭榜,基于PP-TinyPose新增手势关键点检测模型预计下个版本可以和大家见面!
PaddleDetection也有关键点检测专区,比如PP特色模型PP-TinyPose应用在小度健身镜、添添自由屏等场景,3D关键点检测模型。欢迎体验!

@monkeycc
Copy link

monkeycc commented Mar 10, 2023

【增加补充 实例分割 模型】

Mask R-CNN (ICCV'2017)
Cascade Mask R-CNN (CVPR'2018)
SOLOv2 (NeurIPS'2020)

现在只有这三个
还有那么多还没加进来呢..

Mask Scoring R-CNN (CVPR'2019)
Hybrid Task Cascade (CVPR'2019)
YOLACT (ICCV'2019)
InstaBoost (ICCV'2019)
SOLO (ECCV'2020)
PointRend (CVPR'2020)
DetectoRS (CVPR'2021)
SCNet (AAAI'2021)
QueryInst (ICCV'2021)
Mask2Former (CVPR'2022)

@thinkthinking
Copy link
Collaborator Author

增加 实例分割 模型

Mask R-CNN (ICCV'2017) Cascade Mask R-CNN (CVPR'2018) SOLOv2 (NeurIPS'2020)

现在只有这三个 还有那么多还没加进来呢..

Mask Scoring R-CNN (CVPR'2019) Hybrid Task Cascade (CVPR'2019) YOLACT (ICCV'2019) InstaBoost (ICCV'2019) SOLO (ECCV'2020) PointRend (CVPR'2020) DetectoRS (CVPR'2021) SCNet (AAAI'2021) QueryInst (ICCV'2021) Mask2Former (CVPR'2022)

@monkeycc QueryInst本次v2.6版本已经更新了,我们不是所有的论文都做复现的,有高优需求的吗?您这边的主要用途是学术研究还是产业落地应用呀?

@nemonameless
Copy link
Collaborator

nemonameless commented Mar 13, 2023

增加 实例分割 模型

Mask R-CNN (ICCV'2017) Cascade Mask R-CNN (CVPR'2018) SOLOv2 (NeurIPS'2020)

现在只有这三个 还有那么多还没加进来呢..

Mask Scoring R-CNN (CVPR'2019) Hybrid Task Cascade (CVPR'2019) YOLACT (ICCV'2019) InstaBoost (ICCV'2019) SOLO (ECCV'2020) PointRend (CVPR'2020) DetectoRS (CVPR'2021) SCNet (AAAI'2021) QueryInst (ICCV'2021) Mask2Former (CVPR'2022)

@monkeycc 实例分割mask dino即将合入。现在发展很快,有些精度速度相对有点过时的模型论文,如果其方法思想或模块比较通用的,才可能会考虑排期复现。

@thinkthinking
Copy link
Collaborator Author

【输出所有类别的PR值和PR曲线】
suggested by @Dekadenc in #7864

@thinkthinking
Copy link
Collaborator Author

【支持单目标跟踪算法】
suggested by @qiyuezhiguang in #7780

@thinkthinking
Copy link
Collaborator Author

【支持眼动仪相关的算法】
suggested by @nine-city in #7914

@thinkthinking
Copy link
Collaborator Author

【add Salient Object Detection】
suggested by @bittergourd1224 in #7271

@blurmemo
Copy link

solov2是个强大的实例分割模型,但是如何正确配置训练自己的数据集有时候是个问题,希望官方可以出一个专场讲解solov2如何训练自定义类型数据集已经相关配置(在单卡gpu下和多卡gpu下)

@linchpinlin
Copy link

linchpinlin commented Mar 28, 2023

我希望能够复现Pix2seqV2版本。相比其他模型,Pix2seq在小团队中的使用非常友好,尽管它也有一些缺点。您可以在这里找到代码:https://github.com/google-research/pix2seq

@jiweizhangxu
Copy link

许愿能尽快集成meta的segment-anything模型

@nemonameless
Copy link
Collaborator

许愿能尽快集成meta的segment-anything模型

这个可能更偏向于交互式分割,暂时安排在 https://github.com/PaddlePaddle/PaddleSeg 。它的实例分割部分可能会接入 PaddleDetection

@yuwen37
Copy link

yuwen37 commented Apr 17, 2023

【希望增加solov2实例分割的小目标检测功能】
目前的小目标检测仅限于box级别的目标检测模型,对于实例分割模型还不支持小目标检测。希望实例分割也能支持像目标检测中的小目标检测一样的切图拼图功能,以满足高分辨率图片下的小目标分割

@lyuwenyu lyuwenyu unpinned this issue Apr 26, 2023
@zhengyuan-xie
Copy link

【希望能够实现对RT-DETR的量化】

@MINGtoMING
Copy link
Contributor

能否官方实现下VanillaNet 为Backbone换掉RT-DETR的ResNet,性能应该会更好

@MINGtoMING
Copy link
Contributor

我自己实现了一下推理速度有提升,但没法法做高质量的预训练和调参

@WisleyWang
Copy link

test time augment 没有啊 ,WBF 融合也没有啊 这些都是不增加资源的

@GuoQuanhao
Copy link

希望增加EarlyStopping功能

@bluceliuljx
Copy link

bluceliuljx commented Jul 18, 2023

RT-DETR 模型能支持 1280x1280或者1333x800这样的高分辨率的图片吗
在很多场景下,需要这些高分辨率的模型,不然很多小目标的检测效果还是很差的,有时候也不好做对比的
有没有团队一起来搞这个呀

@Alexhk01
Copy link

How to conduct incremental training in smd-det and few-shot detection?
In practical applications, adding new data does not need to re-use all the data for training.

@ucsk
Copy link
Contributor

ucsk commented Aug 4, 2023

Add an Open World Object Detection model that enables the detector to predict class agnostic objects.

@lrp123456
Copy link

lrp123456 commented Aug 6, 2023

【希望增加将单阶段检测器作为 RPN网络的实现】
目前的多阶段目标检测方案中RPN网络较为滞后,mmdetection已经实现https://mmdetection.readthedocs.io/zh_CN/3.x/user_guides/single_stage_as_rpn.html

@zhengwangwang
Copy link

pp-human希望增加对Deep Java Library的支持
Deep Java Library已经存在很长时间了,对于java开发人员来说修改python太痛苦了。

@sdreamforchen
Copy link

希望更新一下导出ONNX的说明。 最近导出PPYOLOE和RT-DETR的静态图,都试了很久很久。batchsize想配置为1,结果很麻烦,麻烦更新一下说明呐,谢谢谢谢。
去年初导出ppyoloe的时候还是蛮简单的!

@jianbin-zqu
Copy link

评估eval时能否像train时,可以记录(计算)loss,比较train loss 和val loss 可以大致判断模型是否过拟合。
(源码看了一一天,改了一天,没成功)
目前eval时可以看mAP,这么难的都实现,看val loss应该比较简单的功能也实现一下吧(给科研人一点小福利)。

Copy link

paddle-bot bot commented Oct 29, 2024

Since this issue has not been updated for more than three months, it will be closed, if it is not solved or there is a follow-up one, please reopen it at any time and we will continue to follow up.
It is recommended to pull and try the latest code first.
由于该问题超过三个月未更新,将会被关闭,若问题未解决或有后续问题,请随时重新打开(建议先拉取最新代码进行尝试),我们会继续跟进。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests