PaddleOCR-json V1.4 Windows 构建指南

本文档帮助如何在Windows上编译 PaddleOCR-json V1.4 （对应PPOCR v2.6）。面向小白，用的最简单的步骤。大佬可酌情调整。

本文参考了 PPOCR官方的编译指南，但建议以本文为准。

1. 前期准备

资源链接后面的(括弧里是版本)，请看清楚。

1.1 需要安装的工具：

Visual Studio 2022 (2022或2019均可，Community)
Cmake (Windows x64 Installer)
Git (64-bit Git for Windows Setup)

1.2 需要下载的资源：

paddle_inference (Windows, 2.3.2, C++预测库, cpu_avx_mkl)
Opencv (windows.exe)
模型库 (models.zip)

如果是 Linux / Mac 平台，则paddle_inference和Opencv需选择对应平台的资源。模型库通用，无需改。

拉取 PaddleOCR-json 仓库，并切换到 v1.4.1 稳定版分支：

git clone https://github.com/hiroi-sora/PaddleOCR-json.git
cd PaddleOCR-json
git checkout -b release/1.4.1 origin/release/1.4.1

[可选] 如果需要自动内存清理功能，拉取并切换到 release/1.4.0_autoclean 分支：
git checkout -b release/1.4.0_autoclean origin/release/1.4.0_autoclean

1.3 放置资源

按上述说明 clone 本仓库。在 PaddleOCR-json/cpp 下新建一个文件夹 .source 来存放外部资源。（前面加点是为了按文件名排列更顺眼）
将下载好的 models.zip 、 paddle_inference 和 Opencv 解压进.source。
- paddle_inference 应该解压后放入一个单独文件夹内，并且根据版本给文件夹改个后缀，比如是cpu_avx_mkl版，就叫 paddle_inference_cpu_avx_mkl ，以便区分。
- Opencv看起来是个exe，实际上是个自解压包，运行并选择目录解压。

完成后应该是这样：

PaddleOCR-json
└─ cpp
    ├─ .source
    │    ├─ opencv
    │    ├─ models
    │    └─ paddle_inference_cpu_avx_mkl
    ├─ CMakeLists.txt
    ├─ README.md
    ├─ docs
    ├─ external-cmake
    ├─ include
    └─ src

2. 构建项目

cmake安装完后系统里会有一个cmake-gui程序，打开cmake-gui。在第一个输入框处填写源代码路径，第二个输入框处填写编译输出路径，见下面的模板。
然后，点击左下角第一个按钮Configure，第一次点它会弹出提示框进行Visual Studio配置，选择你的Visual Studio版本（2019、2022均可），目标平台选择x64。然后点击finish按钮即开始自动执行配置。

Where is the source code: ……/PaddleOCR-json/cpp

Where to build the binaries: ……/PaddleOCR-json/cpp/build

执行完会报错，很正常，点OK。

填写三项配置：

OPENCV_DIR 和 OpenCV_DIR:
……/PaddleOCR-json/cpp/.source/opencv/build/x64/vc16/lib

PADDLE_LIB:
……/PaddleOCR-json/cpp/.source/paddle_inference_cpu_avx_mkl

下面 WITH_GPU 确保不要勾选。

其他项就不要动了！

点击左下角 第一个按钮Configure 应用配置，等待几秒，看到输出 Configuring done 即可。

点击左下角 第二个按钮Generate 即可生成Visual Studio 项目的sln文件。看到输出 Generating done 即可。那么，你会看到 PaddleOCR-json/cpp/build 下生成了 PaddleOCR-json.sln 及一堆文件。

CMake构建参数说明

像刚才我们勾选/填写的那些CMake选项（WITH_GPU、OPENCV_DIR、PADDLE_LIB这些），它们是CMake的参数。你也可以自行参考并修改这些参数。

以下参数是一些编译参数：

参数名	描述
`WITH_MKL`	使用MKL或OpenBlas，默认使用MKL。
`WITH_GPU`	使用GPU或CPU，默认使用CPU。
`WITH_STATIC_LIB`	编译成static library或shared library，默认编译成static library。（Linux下这个参数设置成 `ON` 时无法编译，所以它是强行设置成 `OFF` 的。）
`WITH_TENSORRT`	使用TensorRT，默认关闭。

以下是一些依赖库路径相关参数。除了 PADDLE_LIB 是必填的以外其他的视情况而定。

参数名	描述
`PADDLE_LIB`	paddle_inference的路径
`OPENCV_DIR`	库的路径
`CUDA_LIB`	库的路径
`CUDNN_LIB`	库的路径
`TENSORRT_DIR`	使用TensorRT编译并设置其路径

以下是一些PaddleOCR-json功能相关参数。

参数名	描述
`ENABLE_CLIPBOARD`	启用剪贴板功能。默认关闭。
`ENABLE_REMOTE_EXIT`	启用远程关停引擎进程命令。默认开启。
`ENABLE_JSON_IMAGE_PATH`	启用json命令image_path。默认开启。

Note

ENABLE_REMOTE_EXIT: 这个参数控制着 “传入 exit 关停引擎进程” 的功能。
ENABLE_JSON_IMAGE_PATH: 这个参数控制着 “使用{"image_path":""}指定路径” 的功能。

关于剪贴板读取

在Windows下，从剪贴板中读取数据的功能存在，不过已经弃用。所有剪贴板相关的代码是默认不编译的。如果你需要PaddleOCR-json去读取剪贴板，请自行修改CMake参数 ENABLE_CLIPBOARD=ON 并重新编译。

构建失败？

如果报错中含有 Could NOT find Git (missing: GIT_EXECUTABLE) ，原因是电脑上未安装Git，请先安装（尽量装在默认目录下）。

如果报错中含有 unable to access 'https://github.com/LDOUBLEV/AutoLog.git/': gnutls_handshake() failed: The TLS connection was non-properly terminated. ，原因是网络问题，请挂全局科学上网。如果没有科学，那么可尝试将 deploy/cpp_infer/external-cmake/auto-log.cmake 中的github地址改为 https://gitee.com/Double_V/AutoLog 。

其他原因，请确认您操作的步骤与本文一致，尤其是点击按钮的先后顺序。

3. 配置项目

回到工程目录下的build文件夹，打开 PaddleOCR-json.sln 。将Debug改为Release。

调整项目设置。

解决方案管理器 → ALL_BUILD → 右键 → 属性，进行修改：
- 常规 → 输出目录：$(ProjectDir)\bin\Release
- 调试 → 命令：$(ProjectDir)\bin\Release\PaddleOCR-json.exe
- 调试 → 工作目录：$(ProjectDir)\bin\Release
解决方案管理器 → PaddleOCR-json → 右键 → 属性，进行修改：
- 常规 → 输出目录：$(ProjectDir)\bin\Release

按F5编译。如果输出类似 生成：成功4个，失败0个…… 的语句，然后弹出一个控制台窗口，并报错 找不到 opencv_world***.dll ，那么编译正常。你能在 build/bin/Release 下找到生成的 PaddleOCR-json.exe 。

Tip

如果编译时，报了大量的语法错误，如：

C2447 "{"缺少函数标题
C2059 语法错误："if"
C2143 语法错误：缺少";"
…………等等

那么可能是源代码文件的换行符编码问题。
解决方法一：通过git clone下载本仓库代码，而不要直接在Github下载zip文件包。
解决方法二：批量将所有.h和.cpp文件的换行符转换为CRLF 。

拷贝必要的运行库。将以下文件拷贝到 build/bin/Release 文件夹下。

opencv_world***.dll: PaddleOCR-json/cpp/.source/opencv/build/x64/vc16/bin/opencv_world***.dll

当然，你也可以直接将 opencv 的运行库放到Windows的 PATH 环境变量中。参考这篇文档，把路径 opencv/build/x64/vc16/bin/ 加入 PATH。这样就不需要拷贝 opencv 运行库了。

拷贝模型库。将 .source 中的 models 整个拷贝到 build/bin/Release 文件夹下。
在build/bin/Release下，Shift+右键，在此处打开终端（或PowerShell），输入 ./PaddleOCR-json.exe 。如果输出下列文字，就正常。

OCR anonymous pipe mode.
OCR init completed.

如果你需要移植其他平台，可以参考文档移植指南

4. 安装

你可以使用CMake来安装PaddleOCR-json。在cpp下，Shift+右键，在此处打开终端（或PowerShell），运行下面这条命令。

cmake --install build

CMake会将 build 文件夹下的可执行文件和运行库给安装到 build/install/bin 文件夹下。CMake无法在Windows下把软件安装到系统文件夹中，不过你可以将文件夹 cpp/build/install/bin 添加到Windows的 PATH 环境变量中。参考这篇文档。

如果你希望安装到指定位置，你可以为上面这条命令加上参数 --prefix /安装路径/ 来指定一个安装路径。比如 --prefix build/install 会将所有的文件都安装到 build/install 文件夹下。

5. 其他问题

关于内存泄漏 / 长期高内存占用

由于本项目是基于 PaddleOCR v2.6 C++ 写的，它的内存占用非常激进。但是占用率不会无限制的上升，达到一定值后会放缓直至停止。官方在 PaddleOCR v2.7+ 之后修复了这个问题，不过本项目在短期内还无法跟进新版本。

当前，可以绕过内存问题的方法有：

外部重启引擎，用另一个程序 / 脚本来监听引擎的输出，然后在引擎不工作时重启引擎进程（Umi-OCR就是这么做的）。
从引擎内部来清理内存。在分支 release/1.4.0_autoclean 里面是一个修改过的引擎。新增了一个参数 -auto_memory_cleanup，它会开启一条线程来检查引擎状态，然后在其闲置时释放内存。

Caution

但是，这个方法无法清理干净内存里所有的资源，PaddleOCR底层的某些库所调用的资源会一直占用着一小块内存。到最后引擎闲置时的内存占用大约为600MB。这些没有正常释放资源的操作有可能会引发一些问题。

更多细节请看这些Issue：#43、#90、#135

如果你打算使用上面提到的方法2，你可以重新clone本仓库的 autoclean 分支，然后再自行构建编译整个项目。

git clone --single-branch --branch autoclean https://github.com/hiroi-sora/PaddleOCR-json.git

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

PaddleOCR-json V1.4 Windows 构建指南

1. 前期准备

1.1 需要安装的工具：

1.2 需要下载的资源：

1.3 放置资源

2. 构建项目

CMake构建参数说明

关于剪贴板读取

构建失败？

3. 配置项目

4. 安装

5. 其他问题

关于内存泄漏 / 长期高内存占用

Files

README.md

Latest commit

History

README.md

File metadata and controls

PaddleOCR-json V1.4 Windows 构建指南

1. 前期准备

1.1 需要安装的工具：

1.2 需要下载的资源：

1.3 放置资源

2. 构建项目

CMake构建参数说明

关于剪贴板读取

构建失败？

3. 配置项目

4. 安装

5. 其他问题

关于内存泄漏 / 长期高内存占用