有效
光学字符序列识别方法以及装置
张丽、陈志强、李元景、邢宇翔、郑大川、刘永春、黄日辰、王午羲
同方威视技术股份有限公司
张
张丽机构 暂无
技术领域 暂无
陈
陈志强机构 暂无
技术领域 暂无
李
李元景机构 暂无
技术领域 暂无
邢
邢宇翔机构 暂无
技术领域 暂无
郑
郑大川机构 暂无
技术领域 暂无
刘
刘永春机构 暂无
技术领域 暂无
黄
黄日辰机构 暂无
技术领域 暂无
王
王午羲机构 暂无
技术领域 暂无
摘要
本申请提供了一种基于二叉树的字符排序方法、基于二叉树的字符排序装置、光学字符序列定位和识别方法、光学字符序列定位和识别装置、电子设备以及计算机可读存储介质。所述基于二叉树的字符排序方法包括:在包括目标字符序列的区域中进行图案采集,以获得图案集合;对图案集合中的每一个图案进行遍历,将处于相同行或列中的图案置于相同二叉树中;以及从二叉树中顺序识别各个节点处的图案,以获得目标字符序列。
1.一种基于二叉树的字符排序方法,包括:在包括目标字符序列的区域中进行图案采集,以获得图案集合;对所述图案集合中的每一个图案进行遍历,将处于相同行或列中的图案置于相同二叉树中,以及从二叉树中顺序识别各个节点处的图案,以获得所述目标字符序列,其中,所述二叉树中的左子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之前的图案,并且其中,所述左子树中的每个图案所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应,以及所述二叉树中的右子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之后的图案,并且其中,所述右子树中的每个图案所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应,其中,所述二叉树中的节点处放置的图案均为字符,并且其中所述二叉树中的根节点处放置的所述基准图案为起始字符,将处于相同行或列中的字符置于相同二叉树中包括:计算被遍历的字符与所述起始字符的质心连线与预定轴线之间的角度;响应于所计算的角度小于或等于预定角度阈值,确定被遍历的字符与所述起始字符处于相同的行或列中,并且将被遍历的字符置于以所述起始字符为根节点的二叉树中;以及响应于所计算的角度大于所述预定角度阈值,确定被遍历的字符与所述起始字符处于不同的行或列中,并且将被遍历的字符置于新的二叉树中。
2.根据权利要求1所述的基于二叉树的字符排序方法,对所述图案集合中的每一个图案进行遍历包括:确定所述图案集合中的每一个图案与数据库中预先存储的字符匹配的概率;将概率大于第一预定阈值的图案确定为字符;利用所确定的字符形成字符集合;以及以所述字符集合之中的具有最大概率的字符作为起始字符,按照概率从大到小的顺序对所述字符集合中的每一个字符进行遍历。
3.根据权利要求2所述的基于二叉树的字符排序方法,在确定被遍历的字符与所述起始字符处于相同的行或列中之后,还执行如下操作:计算包围所述起始字符的最小矩形边框中的第一点与包围所述区域的最小矩形边框中的第二点之间的第一距离;计算包围被遍历的字符的最小矩形边框中的第三点与所述第二点之间的第二距离,其中所述第三点在包围被遍历的字符的最小矩形边框中的位置与所述第一点在包围所述起始字符的最小矩形边框中的位置相对应;以及基于所述第一距离与所述第二距离,确定被遍历的字符是在所述起始字符之前还是起始字符之后。
4.根据权利要求2所述的基于二叉树的字符排序方法,响应于所计算的角度大于所述预定角度阈值确定被遍历的字符与所述起始字符处于不同的行或列中包括:在所述区域中存在多个行或列的情况下,存在多个对应的预定角度阈值θ i ,其中i={1,2,……,N},其中,N为多个行或列的数量,并且其中,当所计算的角度大于θ i 且小于或等于θ i+1 时,确定被遍历的字符处于从所述起始字符所处的行或列起始的第i+1行中,并且对应地将被遍历的字符置于第i个新的二叉树中。
5.根据权利要求2所述的基于二叉树的字符排序方法,其中,新的二叉树中的字符的布置方式与以所述起始字符为根节点的所述二叉树中的字符的布置方式相同。
6.根据权利要求3所述的基于二叉树的字符排序方法,其中,所述第一点为以下项之一:中心点、左上角点、质心点;以及所述第二点为以下项之一:左上角点、右上角点、左下角点、右下角点。
7.一种基于二叉树的字符排序装置,包括:采集单元,被配置为在包括目标字符序列的区域中进行图案采集,以获得图案集合;以及第一处理单元,被配置为:对所述图案集合中的每一个图案进行遍历,将处于相同行或列中的图案置于相同二叉树中;以及从二叉树中顺序识别各个节点处的图案,以获得所述目标字符序列,其中,所述二叉树中的左子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之前的图案,并且其中,所述左子树中的每个图案所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应,以及所述二叉树中的右子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之后的图案,并且其中,所述右子树中的每个图案所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应,其中,所述二叉树中的节点处放置的图案均为字符,并且其中所述二叉树中的根节点处放置的所述基准图案为起始字符;其中,所述第一处理单元还被配置为:计算被遍历的字符与所述起始字符的质心连线与预定轴线之间的角度;响应于所计算的角度小于或等于预定角度阈值,确定被遍历的字符与所述起始字符处于相同的行或列中,并且将被遍历的字符置于以所述起始字符为根节点的二叉树中;以及响应于所计算的角度大于所述预定角度阈值,确定被遍历的字符与所述起始字符处于不同的行或列中,并且将被遍历的字符置于新的二叉树中。
8.一种光学字符序列定位和识别方法,包括:在输入图像中定位包括目标字符序列的区域;以及利用根据权利要求1至6中任一项所述的基于二叉树的字符排序方法,在所述区域中识别出所述目标字符序列。
9.根据权利要求8所述的光学字符序列定位和识别方法,所述方法还包括:在进行定位操作时,根据目标字符序列的特点、所述输入图像与包括目标字符序列的区域的尺寸对比、场景的复杂情况,进行至少一级的区域定位。
10.一种光学字符序列定位和识别装置,包括:定位单元,被配置为在输入图像中定位包括目标字符序列的区域;以及第二处理单元,利用根据权利要求1至6中任一项所述的基于二叉树的字符排序方法,在所述区域中识别出所述目标字符序列。
11.一种电子设备,包括:一个或多个处理器;以及存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据权利要求1至6中任一项或者根据权利要求8所述的光学字符序列定位和识别方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现根据权利要求1至6中任一项或者根据权利要求8所述的光学字符序列定位和识别方法。



