规则分类 OCR文本后处理 文本清洗:对大写字母进行小写转换,去除空格,去除特殊字符,去除重复字符,去除无意义字符,去除无意义词语,去除无意义行,去除无意义段落 文本校正:对识别结果进行校正,如:O -> 0,l -> 1,I -> 1,S -> 5,B -> 8,Z -> 2,D -> 0,Q -> 0,G -> 6,A -> 4, 文本提取:暂时不知道怎么做 规则库 发票规则库 提单规则库 ... 返回识别结果