Skip to content

Latest commit

 

History

History
12 lines (10 loc) · 554 Bytes

README.md

File metadata and controls

12 lines (10 loc) · 554 Bytes

规则分类

OCR文本后处理

文本清洗:对大写字母进行小写转换,去除空格,去除特殊字符,去除重复字符,去除无意义字符,去除无意义词语,去除无意义行,去除无意义段落

文本校正:对识别结果进行校正,如:O -> 0l -> 1I -> 1S -> 5B -> 8Z -> 2D -> 0Q -> 0G -> 6A -> 4

文本提取:暂时不知道怎么做

规则库

发票规则库

提单规则库

...

返回识别结果