WEPO: Web Element Preference Optimization for LLM-based Web Navigation

联系合作
新一代信息技术
区块链与先进计算
成果单位: 北京邮电大学
合作方式: 面议
所处阶段: 概念
关键词: 网页导航LLM微调DOM树负样本采样Direct Preference Optimization无监督对比
总得分 (满分100)
0
资本强度 (满分0)
该成果得分:0
刘嘉润
查看详情

刘嘉润,北京邮电大学信息与通信工程学院本科生,专注于信息与通信工程领域的学习与研究,积极参与课程学习、科研项目和学术活动。

所在机构:
北京邮电大学

核心问题

在网页导航任务中,代理对网页元素的识别与操作准确率不足,影响网页自动化智能体的效率和可靠性。

解决方案

提出一种在网页导航任务中融合偏好优化的LLM微调框架WEPO。该框架通过对DOM树中距离目标元素最近的非关键元素进行负样本采样,并采用Direct Preference Optimization实现无监督对比学习,从而显著提升代理对网页元素的识别与操作准确率。

竞争优势

该成果通过创新的负样本采样和对比学习方法,显著提升了网页导航任务中代理的识别与操作准确率,具有原始创新性。其无监督学习特性减少了人工标注的需求,提高了模型的适应性和效率,为网页自动化智能体的发展提供了新的技术路径。

成果公开日期

20251201

成果类型

应用研究

市场分析

智能网页代理、RPA流程自动化、浏览器插件、智能客服与信息检索系统

成果体现形式

新技术

摘要

提出一种在网页导航任务中融合偏好优化的LLM微调框架 WEPO,通过对DOM树中距离目标元素最近的非关键元素进行负样本采样,采用Direct Preference Optimization实现无监督对比学习,显著提升代理对网页元素的识别与操作准确率。

试试对话AI技术经理人
WENXIAOGUO
问小果
该成果有哪些相似成果?
该成果可能有哪些需求方?
该成果的市场前景如何?
北京邮电大学的相关成果还有哪些?