《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 基于深度残差神经网络的博彩网页识别算法设计
基于深度残差神经网络的博彩网页识别算法设计
2022年电子技术应用第2期
张 聪,张 恒,张立坤,赵 彤,邓桂英
中国互联网络信息中心 技术研发部,北京100190
摘要: 互联网对人民群众的生活和工作产生了重要影响,然而网络空间中隐藏着大量有害的博彩网站或赌博网站,很容易给网民造成损失和困扰,甚至可能扰乱社会秩序,因而研究对此类网站进行高效识别的方法具有重要意义。提出利用深度残差神经网络解决博彩类网页识别问题,基于深度残差网络的原理设计了算法GamblingRec。经验证,算法准确率达到了95.16%,正样本召回率为93.21%,表明基于深度残差神经网络的方法能够用于博彩类网页识别,并能达到较高的识别性能。
中图分类号: TN91
文献标识码: A
DOI:10.16157/j.issn.0258-7998.211757
中文引用格式: 张聪,张恒,张立坤,等. 基于深度残差神经网络的博彩网页识别算法设计[J].电子技术应用,2022,48(2):15-18.
英文引用格式: Zhang Cong,Zhang Heng,Zhang Likun,et al. Gambling web page recognition algorithm design based on deep residual neural network[J]. Application of Electronic Technique,2022,48(2):15-18.
Gambling web page recognition algorithm design based on deep residual neural network
Zhang Cong,Zhang Heng,Zhang Likun,Zhao Tong,Deng Guiying
Technological Research and Development Department,China Internet Network Information Center(CNNIC),Beijing 100190,China
Abstract: The Internet has an important impact on people′s life and work. However, there are a large number of harmful gambling websites hidden in cyberspace, which is easy to cause losses and troubles to netizens, it can even disturb society order. Therefore, it is of great significance to study the efficient recognition method of such websites. In this paper, the deep residual neural network is used to solve the problem of gambling web page recognition, and the algorithm GamblingRec is designed based on principle of deep residual network. The results show that the accuracy of GamblingRec reaches 95.16%, and the positive sample recall rate is 93.21%,which indicates that the method based on deep residual neural network can be applied for gambling web page recognition, and can achieve high recognition performance.
Key words : convolutional neural network;residual network;gambling;web page classification;ResNet

0 引言

    随着互联网技术的高速发展,我国网民人数持续增长,根据《第47次中国互联网络发展状况统计报告》的数据,截至2020年12月,我国网民人数已达到9.89亿[1],毫无疑问,互联网已经成为人们日常生活不可或缺的一部分。然而,虚拟的网络空间中隐藏着大量有害的博彩类型网站,极易给参与者造成经济损失,设计有效方法对博彩类网站进行识别具有重要意义。

1 相关工作

    博彩网站识别相当于对网页进行分类,预测其为博彩网页或其他类型网页。付顺顺[2]采用FastText[3]算法和Bootstrap[4]集成算法,利用网站文本数据,提高了识别速度并减轻了正常网站和博彩网站数据不均衡问题。唐喆[5]等人采用SVM[6]算法并提取不同的文本特征,实现对网页的分类。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003959




作者信息:

张  聪,张  恒,张立坤,赵  彤,邓桂英

(中国互联网络信息中心 技术研发部,北京100190)




wd.jpg

此内容为AET网站原创,未经授权禁止转载。