1.一种数据处理的方法,其特征在于,所述方法包括:获取待处理数据;所述待处理数据按行排列;识别所述待处理数据的每个数据字段的属性及位置;按照数据字段在行内的位置,确定所述数据字段所属的列位置;根据同一列中的各数据字段的属性,确定该列的属性;对属性与所在列的属性不同的数据字段进行修正处理。
2.如权利要求1所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理,包括:若所述数据字段的属性为未识别的,则将所述数据字段与相邻的数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置;若所述数据字段的属性为多个,则将所述数据字段分割为与所述多个属性中与每个属性相对的多个数据字段,并按照列的属性确定所述多个数据字段的在行内的位置。
3.如权利要求2所述的方法,其特征在于,所述识别合并后的数据字段的属性,包括:将各列的属性确定为所述待处理数据的属性集合中的属性;从所述待处理数据的属性集合中确定所述合并后的数据字段的属性。
4.如权利要求1所述的方法,其特征在于,所述根据同一列中的各数据字段的属性,确定该列的属性,包括:将同一列的各数据字段的属性占该列识别出的多个属性的比例大于第一阈值的属性,确定为该列的属性。
5.如权利要求1所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理,还包括:将所述待处理数据中相邻行的数据中,前一行数据的最后一个数据字段与后一行的第一个数据字段为未识别属性的数据字段,则将所述相邻行的数据合并为一行数据,并将所述前一行数据的最后一个数据字段与所述后一行的第一个数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置。
6.如权利要求1-5任一项所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理之后,还包括:对列进行重整,重整后的每列具有一个属性且按照同一属性的数据字段的数量进行列的排序;按照所述各数据字段的属性及重整后的列,调整所述各数据字段所在的行内位置,得到调整后的所述待处理数据。
7.一种数据处理的装置,其特征在于,所述装置包括:获取单元,用于获取待处理数据;所述待处理数据按行排列;处理单元,用于识别所述待处理数据的每个数据字段的属性及位置;按照数据字段在行内的位置,确定所述数据字段所属的列位置;根据同一列中的各数据字段的属性,确定该列的属性;对属性与所在列的属性不同的数据字段进行修正处理。
8.如权利要求7所述的装置,其特征在于,所述处理装置还用于:若所述数据字段的属性为未识别的,则将所述数据字段与相邻的数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置;若所述数据字段的属性为多个,则将所述数据字段分割为与所述多个属性中与每个属性相对的多个数据字段,并按照列的属性确定所述多个数据字段的在行内的位置。
9.如权利要求8所述的装置,其特征在于,所述处理单元还用于:将各列的属性确定为所述待处理数据的属性集合中的属性;从所述待处理数据的属性集合中确定所述合并后的数据字段的属性。
10.如权利要求7所述的装置,其特征在于,所述处理单元还用于:将同一列的各数据字段的属性占该列识别出的多个属性的比例大于第一阈值的属性,确定为该列的属性。
11.如权利要求7所述的装置,其特征在于,所述处理单元还用于:将所述待处理数据中相邻行的数据中,前一行数据的最后一个数据字段与后一行的第一个数据字段为未识别属性的数据字段,则将所述相邻行的数据合并为一行数据,并将所述前一行数据的最后一个数据字段与所述后一行的第一个数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置。
12.如权利要求7-11任一项所述的装置,其特征在于,所述处理单元还用于:对列进行重整,重整后的每列具有一个属性且按照同一属性的数据字段的数量进行列的排序;按照所述各数据字段的属性及重整后的列,调整所述各数据字段所在的行内位置,得到调整后的所述待处理数据。