WEPO: Web Element Preference Optimization for LLM-based Web Navigation

关注

联系合作

成果单位：北京邮电大学

合作方式：面议

所处阶段：概念

关键词：网页导航LLM微调DOM树负样本采样Direct Preference Optimization无监督对比

成果评价

总得分（满分100）

资本强度（满分0）

该成果得分：0

项目负责人

刘嘉润

查看详情

所在机构：

北京邮电大学

小果解读

核心问题

在网页导航任务中，代理对网页元素的识别与操作准确率不足，影响网页自动化智能体的效率和可靠性。

解决方案

提出一种在网页导航任务中融合偏好优化的LLM微调框架WEPO。该框架通过对DOM树中距离目标元素最近的非关键元素进行负样本采样，并采用Direct Preference Optimization实现无监督对比学习，从而显著提升代理对网页元素的识别与操作准确率。

竞争优势

该成果通过创新的负样本采样和对比学习方法，显著提升了网页导航任务中代理的识别与操作准确率，具有原始创新性。其无监督学习特性减少了人工标注的需求，提高了模型的适应性和效率，为网页自动化智能体的发展提供了新的技术路径。

成果描述

成果公开日期

20251201

成果类型

应用研究

市场分析

智能网页代理、RPA流程自动化、浏览器插件、智能客服与信息检索系统

成果体现形式

新技术

摘要

提出一种在网页导航任务中融合偏好优化的LLM微调框架 WEPO，通过对DOM树中距离目标元素最近的非关键元素进行负样本采样，采用Direct Preference Optimization实现无监督对比学习，显著提升代理对网页元素的识别与操作准确率。

试试对话AI技术经理人

WENXIAOGUO

问小果

该成果有哪些相似成果？

该成果可能有哪些需求方？

该成果的市场前景如何？

北京邮电大学的相关成果还有哪些？

北京科技成果转化智能服务平台北京市官方认证公益技术转移平台

电话：010-64841342-8832

邮箱：zhuanguoguo@bstig.cn

单位：北京首发展智能科技有限公司

地址：北京市朝阳区安翔北里甲11号‌‌北京创业大厦B座18楼

资源中心

服务中心

关于我们

意见反馈

官方服务

转果果小程序

转果果公众号