安全类文章的多文本分类系统的设计与实现
所属分类:技术论文
上传者:muyx
文档大小:568 K
标签: 深度学习 文本分类 爬虫
所需积分:0分积分不够怎么办?
文档介绍:目前安全类网站信息的分类标签各不相同,没有统一分类标准,使安全类网站无法准确地向用户展示特定类别的安全信息。面对大量的安全类网站的技术类文章信息,用户需要花费大量的时间来识别文本类别。因此,设计一个多文本分类系统对于提高安全类网站的用户体验和使用效率具有重要意义。开发了一套基于CNN和LSTM混合模型的安全类文章多文本分类系统,本系统采用基于Scrapy框架的网络爬虫,该网络爬虫支持定制化配置提取不同布局的页面数据,支持数据持久化存储。并在 CNN和 LSTM混合模型基础上设计实现了多文本自动标注模块,实现了网站安全类信息的自动分类,相对传统的CNN和LSTM模型分类准确率分别提升1.79%和1.54%,F1值分别提升1.02%和0.32%。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。