一种用于大规模数据集的决策树采样策略
所属分类:技术论文
上传者:aet
文档大小:203 K
所需积分:0分积分不够怎么办?
文档介绍:为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法.通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高.
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。