Paddle Inference 的 tensorrt int8 推理报错 #58674

Wanglongzhi2001 · 2023-11-03T14:06:39Z

bug描述 Describe the Bug

在 PaddleSlim PTQ量化后导出的模型在进行 Paddle Inference 的 int8 推理的时候会报如下所示的错误：

其他补充信息 Additional Supplementary Information

复现步骤：

download 我的这个 repo ：https://github.com/Wanglongzhi2001/repo-for-reproduction
运行 custom_infer 文件夹里的 infer.py 进行推理，代码是 paddle-inference-demo 里的示例

量化后的模型提供在 output_ptq 文件夹里，是运行 repo 里的 ptq_alexnet.py 文件夹而来，想要复现的话得自行配置好数据集，不想的话就直接用我提供的，代码参考自 PaddleSlim 的示例

6clc · 2023-11-04T02:48:03Z

可以提供一下paddle的版本吗，我这里直接跑你代码会有接口兼容问题？另外还有pdiparams文件也提供一下。

Wanglongzhi2001 · 2023-11-04T03:17:25Z

可以提供一下paddle的版本吗，我这里直接跑你代码会有接口兼容问题？另外还有pdiparams文件也提供一下。

抱歉，pdiparams文件有200多M，github 上传不了那么大的文件，之前没发现这个文件上传失败了。

请使用下面这个链接下载对应的模型和权重文件:

https://workdrive.zohopublic.com.cn/external/c00cacf9880dafd2ff3f8a5e0f331c2e35d070461549d6eec88df302cb3d219e/download

环境

paddle 版本就是 develop 版本
OS: Ubuntu22.04
python version: 3.10.12
cuda version: 12.2
cudnn version: 8.9
trt version: 8.6

使用的是 paddle 的 docker 镜像 2.5.2-gpu-cuda12.0-cudnn8.9-trt8.6 进行编译的。事实上在 windows 上我也用过之前好像是 2.5.0 还是 2.5.2 版本的 paddle，依然有这个报错，因为这个报错是从一个 pass 里传出的，而这个 pass 似乎不是最近修改的。

Wangzheee · 2023-11-06T02:37:41Z

这个错误是tensor的实际输入和模型描述的数据类型不匹配，错误的log上提示了错误的原因和解决方法，可以照着改一下输入

Wanglongzhi2001 · 2023-11-06T09:19:17Z

这个错误是tensor的实际输入和模型描述的数据类型不匹配，错误的log上提示了错误的原因和解决方法，可以照着改一下输入

能指出代码中我的模型输入哪里有问题吗? 复现代码我放在这个repo了。模型输入应该没有问题，模型输入就是paddle-inference-demo的示例代码(读取一张图片，float32类型)没有动过。

Wangzheee · 2023-11-07T07:06:32Z

看到您的pr了，这个确实这里的tensor的type不匹配。可能是slim的量化逻辑更新忽略了这个，应该是int8的权重，save成了float的权重（标准量化权重是int8），已经同步给slim的同学让他们查看、修改了

Wanglongzhi2001 · 2023-11-07T07:07:45Z

看到您的pr了，这个确实这里的tensor的type不匹配。可能是slim的量化逻辑更新忽略了这个，应该是int8的权重，save成了float的权重（标准量化权重是int8），已经同步给slim的同学让他们查看、修改了

好的，谢谢～

Wanglongzhi2001 added status/new-issue 新建 type/bug-report 报bug labels Nov 3, 2023

Wanglongzhi2001 mentioned this issue Nov 3, 2023

fix the bug of int8 trt infer #58672

Open

paddle-bot bot added the PFCC Paddle Framework Contributor Club，https://github.com/PaddlePaddle/community/tree/master/pfcc label Nov 3, 2023

paddle-bot bot added the type/debug 帮用户debug label Nov 7, 2023

paddle-bot bot added the status/following-up 跟进中 label Nov 7, 2023

Ligoml removed status/new-issue 新建 type/bug-report 报bug labels Nov 10, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Paddle Inference 的 tensorrt int8 推理报错 #58674

Paddle Inference 的 tensorrt int8 推理报错 #58674

Wanglongzhi2001 commented Nov 3, 2023

6clc commented Nov 4, 2023

Wanglongzhi2001 commented Nov 4, 2023

Wangzheee commented Nov 6, 2023

Wanglongzhi2001 commented Nov 6, 2023

Wangzheee commented Nov 7, 2023

Wanglongzhi2001 commented Nov 7, 2023

Paddle Inference 的 tensorrt int8 推理报错 #58674

Paddle Inference 的 tensorrt int8 推理报错 #58674

Comments

Wanglongzhi2001 commented Nov 3, 2023

bug描述 Describe the Bug

其他补充信息 Additional Supplementary Information

复现步骤：

6clc commented Nov 4, 2023

Wanglongzhi2001 commented Nov 4, 2023

请使用下面这个链接下载对应的模型和权重文件:

环境

Wangzheee commented Nov 6, 2023

Wanglongzhi2001 commented Nov 6, 2023

Wangzheee commented Nov 7, 2023

Wanglongzhi2001 commented Nov 7, 2023