| 基于网页聚类的Web信息自动抽取 | |
| 所属分类:技术论文 | |
| 上传者:aet | |
| 文档大小:305 K | |
| 所需积分:0分积分不够怎么办? | |
| 文档介绍:针对现今较流行的动态Web网页数量巨大,数据价值高,并且网页结构高度模板化的特点,设计了一个基于网页聚类的Web信息自动抽取系统.在DOM抽取技术基础上利用网页聚类寻找高相似簇,并引入列相似度和全局自相似度计算方法,提高了聚类结果的准确性.抽取模板中应用了可选节点对模板的修正和调整,以提高内容节点的正确标识,实验结果表明,该方法能够自动寻找并抽取网页主要信息,达到了较高的准确率和查全率. | |
| 现在下载 | |
| VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。 | |
Copyright © 2005-2024 华北计算机系统工程研究所版权所有 京ICP备10017138号-2