基于HybridDL模型的文本相似度检测方法
所属分类:技术论文
上传者:aetmagazine
文档大小:440 K
标签: Doc2Vec 潜在狄利克雷分布 文本表示
所需积分:0分积分不够怎么办?
文档介绍:为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似度检测方法,并把该算法得到的模型命名为HybridDL模型。该算法通过Doc2Vec对文档训练得到文档向量,再利用LDA模型得到文档主题与各个主题下特征词出现的概率,对文档中各主题及特征词计算概率加权和,映射到Doc2Vec文档向量中。实验结果表明,新算法模型比传统的Doc2Vec模型对相似文本的判断更加敏感,在文本相似度检测上具有更高的准确度。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。