
吴偶,中国科学院自动化研究所及国科大杭州高等研究院智能科学与技术学院教授,主要研究方向为数据挖掘与机器学习,特别是深度学习数据优化、可解释性、数据合成与安全等领域。
网页表观挖掘的关键问题研究旨在解决当前Web视觉与挖掘领域中对于网页表观属性分析不足的痛点。用户在访问网页时,除了内容质量,网页的美学设计、复杂度、可读性等表观属性也显著影响其访问体验。然而,现有研究主要聚焦于网页内容分析,对表观属性的挖掘和理解相对匮乏,本项目旨在填补这一空白。
本项目通过以下技术解决方案来深入研究网页表观挖掘的关键问题:首先,研究网页表观特征提取方法,将图像领域的局部描述子应用于网页表观,实现精准的特征捕捉;其次,进行网页表观多属性分析,挖掘并构建多个表观属性之间的关联关系;接着,构建表观属性的评价与度量模型,实现对网页的分类、打分及排序;最后,结合表观挖掘与计算机图形学方法,实现网页的自动编辑与视觉增强。项目融合了Web挖掘、机器学习、人机交互、视觉与图形学等多学科理论和方法,形成系统性的创新。
本项目在网页表观挖掘领域具有显著的竞争优势。通过系统性的创新研究,项目不仅完善了Web视觉和Web挖掘理论,还推动了相关技术的发展。项目成果能够显著提升网页的用户体验,通过精准的表观属性分析和优化,提高网页的吸引力、可读性和易用性。此外,项目在跨学科融合方面取得了重要突破,为网页表观挖掘的未来发展奠定了坚实基础。
20190301
信息传输、软件和信息技术服务业
基础理论
论文
网页表观挖掘的关键问题研究
国家科技计划
独立研究
现有的Web视觉与挖掘研究主要集中在网页的内容分析与理解上,对其视觉表观进行分析的研究相对较少。而用户对网页的访问是一个人机交互过程,除了内容之外,网页还有很多因素特别是其表观属性影响着用户的访问过程。这些属性包括美学、复杂度以及可读性等。本项目针对网页表观分析与挖掘的研究现状,拟从四个方面来深入研究网页表观挖掘的关键科学问题:(1)网页表观的特征提取,要研究如何将图像领域的局部描述子应用于网页表观上。(2)网页表观的多属性分析,要挖掘并构建多个表观属性之间的关联关系。(3)表观属性的评价与度量模型构建,以实现对网页的分类、打分以及排序。(4)表观挖掘应用,要结合表观挖掘与计算机图形学方法来实现网页的自动编辑与视觉增强。项目要借鉴并利用Web挖掘、机器学习、人机交互、视觉与图形学等多学科的理论和方法,在网页表观挖掘上形成系统性的创新,进一步完善并推动Web视觉和Web挖掘理论的发展。 。
