有效
基于大语言模型的商品的税号推荐方法和装置
史曙光、张丽、黎盈婷、李博文、孙运达
同方威视科技江苏有限公司
史
史曙光机构 暂无
技术领域 暂无
张
张丽机构 暂无
技术领域 暂无
黎
黎盈婷机构 暂无
技术领域 暂无
李
李博文机构 暂无
技术领域 暂无
孙
孙运达机构 暂无
技术领域 暂无
摘要
本公开涉及基于大语言模型的商品的税号推荐方法和装置。该方法包括:接收由用户输入的商品信息;将商品信息输入至税号推荐大语言模型以获得商品的初始推荐税号;将基于商品信息的查询改写信息输入至查询改写大语言模型以获得商品名称和商品规格;将商品名称和商品规格输入至混合检索模块以获得税号混合检索结果;以及将初始推荐税号和税号混合检索结果输入至决策融合模块以获得商品的最终推荐税号。
1.一种基于大语言模型的商品的税号推荐方法,包括:接收商品信息;将所述商品信息输入至税号推荐大语言模型以获得所述商品的初始推荐税号;将基于所述商品信息的查询改写信息输入至查询改写大语言模型以获得商品名称和商品规格;将所述商品名称和所述商品规格输入至混合检索模块以获得税号混合检索结果;以及将所述初始推荐税号和所述税号混合检索结果输入至决策融合模块以获得所述商品的最终推荐税号,其中,将所述商品名称和所述商品规格输入至混合检索模块以获得税号混合检索结果包括:由所述混合检索模块对所述商品名称和所述商品规格进行向量化处理以获得向量化的商品名称和向量化的商品规格;由所述混合检索模块基于税号向量数据库对所述向量化的商品名称进行相似度计算,以获取所述税号向量数据库中的与所述向量化的商品名称最相似的前K个条目;以及由所述混合检索模块基于所述前K个条目对所述向量化的商品规格进行相似度计算,以获取所述前K个条目中的与所述向量化的商品规格最相似的前1个条目;其中,所述税号混合检索结果包括所述前1个条目中的商品名称、商品规格和商品税号以及所计算的相似度值,其中,在所述商品名称为空的情况下,由所述混合检索模块返回空,并且所述税号混合检索结果为空,其中,在所述商品名称不为空并且所述商品规格为空的情况下,所述K=1,其中,将所述初始推荐税号和所述税号混合检索结果输入至决策融合模块以获得所述商品的最终推荐税号包括:在所述税号混合检索结果不为空并且所述相似度值大于第一阈值的情况下,由所述决策融合模块将所述商品税号输出作为所述商品的最终推荐税号;以及在所述税号混合检索结果为空或者所述相似度值小于等于所述第一阈值的情况下,由所述决策融合模块将所述初始推荐税号输出作为所述商品的最终推荐税号。
2.根据权利要求1所述的方法,其中,所述商品信息是关于所述商品的用户提问文本。
3. 根据权利要求2所述的方法,其中,将所述商品信息输入至税号推荐大语言模型以获得商品的初始推荐税号包括:由所述税号推荐大语言模型判断所述用户提问文本中的商品描述是否完整;以及在所述商品描述是完整的情况下,由所述税号推荐大语言模型根据所述商品描述来输出所述商品的初始推荐税号。
4. 根据权利要求3所述的方法,其中,将所述商品信息输入至税号推荐大语言模型以获得商品的初始推荐税号还包括:在所述商品描述是不完整的情况下,由所述税号推荐大语言模型与用户进行一轮或多轮对话以补充所述商品描述,直到所述税号推荐大语言模型判断所述商品描述是完整的;以及由所述税号推荐大语言模型根据所述商品描述来输出所述商品的初始推荐税号;其中,在每轮对话中,所述税号推荐大语言模型输出提示问题,并且所述用户输入关于所述提示问题的附加用户提问文本。
5.根据权利要求3所述的方法,其中,将基于所述商品信息的查询改写信息输入至查询改写大语言模型以获得商品名称和商品规格包括:将所述用户提问文本输入至所述查询改写大语言模型以获得所述商品名称和所述商品规格。
6.根据权利要求4所述的方法,其中,将基于所述商品信息的查询改写信息输入至查询改写大语言模型以获得商品名称和商品规格包括:将所述用户提问文本以及所述一轮或多轮对话中的一个或多个提示问题和一个或多个附加用户提问文本一起输入至所述查询改写大语言模型以获得所述商品名称和所述商品规格。
7.根据权利要求1所述的方法,其中,所述商品信息是企业在申报所述商品时填写的申报商品名称、申报商品规格和申报商品税号。
8.根据权利要求7所述的方法,其中,将所述商品信息输入至税号推荐大语言模型以获得商品的初始推荐税号包括:将所述申报商品名称和所述申报商品规格输入至所述税号推荐大语言模型以获得所述商品的初始推荐税号。
9.根据权利要求7所述的方法,其中,将基于所述商品信息的查询改写信息输入至查询改写大语言模型以获得商品名称和商品规格包括:将所述申报商品名称和所述申报商品规格输入至所述查询改写大语言模型以获得所述商品名称和所述商品规格。
10.根据权利要求7所述的方法,还包括:将所述申报商品税号与所述最终推荐税号进行比较;在所述申报商品税号与所述最终推荐税号一致的情况下,向用户返回无异常;以及在所述申报商品税号与所述最终推荐税号不一致的情况下,向所述用户返回有异常。
11.根据权利要求1所述的方法,其中,所述税号推荐大语言模型是通过下列方式构建的:选择通用大语言模型作为基座模型;使用税号预训练数据集对所述通用大语言模型进行第一次训练,其中,训练方式为全参数微调;监测所述第一次训练期间的损失函数的差值曲线,并且在所述差值曲线收敛时,停止所述第一次训练;使用税号微调数据集对所述通用大语言模型进行第二次训练,其中,训练方式为部分参数微调;监测所述第二次训练期间的损失函数的差值曲线,并且在所述差值曲线收敛时,停止所述第二次训练;使用税号偏好优化数据集对所述通用大语言模型进行第三次训练,以获得所述税号推荐大语言模型。
12.根据权利要求11所述的方法,其中,所述税号预训练数据集包括中华人民共和国海关进出口税则、商品税号历史申报数据和互联网数据,其中,所述税号微调数据集包括预定义的税号多轮问答数据集,其中,所述税号偏好优化数据集包括预定义的税号偏好问答数据集。
13.根据权利要求1所述的方法,其中,所述查询改写大语言模型是通过下列方式构建的:将查询改写数据集划分为训练集和测试集;选择多个通用大语言模型作为基座模型;使用所述训练集对所述多个通用大语言模型分别进行训练,其中,训练方式为部分参数微调;针对每个通用大语言模型,监测训练期间的损失函数的差值曲线,并且在所述差值曲线收敛时,停止训练;使用测试集对经训练的每个通用大语言模型进行测试,选择测试得分最高的经训练的通用大语言模型作为所述查询改写大语言模型。
14.根据权利要求13所述的方法,其中,所述查询改写数据集包括预定义的税号查询改写多轮问答数据集。
15.根据权利要求1所述的方法,其中,所述税号向量数据库是通过下列方式构建的:对商品税号历史申报数据进行清洗,以获得包括商品名称、清洗后的商品规格、和商品税号的数据库;分别对商品名称和清洗后的商品规格进行向量化处理,以获得包括商品名称、清洗后的商品规格、向量化的商品名称、向量化的清洗后的商品规格、和商品税号的所述税号向量数据库。
16. 一种基于大语言模型的商品的税号推荐装置,包括:处理器,以及存储器,存储有指令,所述指令在由所述处理器执行时,使得所述处理器执行根据权利要求1-15中任一项所述的方法。
17.一种计算机可读存储介质,在其上存储有指令,所述指令在由计算机执行时,使得所述计算机执行根据权利要求1-15中任一项所述的方法。



