
刘嘉润,北京邮电大学信息与通信工程学院本科生,专注于信息与通信工程领域的学习与研究,积极参与课程学习、科研项目和学术活动。
在网页导航任务中,代理对网页元素的识别与操作准确率不足,影响网页自动化智能体的效率和可靠性。
提出一种在网页导航任务中融合偏好优化的LLM微调框架WEPO。该框架通过对DOM树中距离目标元素最近的非关键元素进行负样本采样,并采用Direct Preference Optimization实现无监督对比学习,从而显著提升代理对网页元素的识别与操作准确率。
该成果通过创新的负样本采样和对比学习方法,显著提升了网页导航任务中代理的识别与操作准确率,具有原始创新性。其无监督学习特性减少了人工标注的需求,提高了模型的适应性和效率,为网页自动化智能体的发展提供了新的技术路径。
20251201
应用研究
智能网页代理、RPA流程自动化、浏览器插件、智能客服与信息检索系统
新技术
提出一种在网页导航任务中融合偏好优化的LLM微调框架 WEPO,通过对DOM树中距离目标元素最近的非关键元素进行负样本采样,采用Direct Preference Optimization实现无监督对比学习,显著提升代理对网页元素的识别与操作准确率。
