基于SGCN的化合物致癌性预测模型-AET-电子技术应用

基于SGCN的化合物致癌性预测模型

2022年电子技术应用第6期

魏若冰，何家峰，邱晓芳，刘旗

广东工业大学信息工程学院，广东广州 510006

摘要： 癌症患者的激增引起了全世界的关注，许多研究者将目光放在了对化合物致癌性的评估上，但这是一项极其具有挑战性的任务。本实验获取了341种实验数据，利用三维图卷积网络(SGCN)，建立了对化合物致癌性的预测模型。结果表明：对化合物进行致癌性预测的SGCN分类模型准确率高达96.9%，比其余模型效果更好，这表明SGCN模型能够准确地对化学品进行分类，并且在实际应用中具有相当大的潜力。

关键词： 三维图卷积网络分类模型致癌化合物

中图分类号： TP183
文献标识码： A
DOI：10.16157/j.issn.0258-7998.212080
中文引用格式： 魏若冰，何家峰，邱晓芳，等. 基于SGCN的化合物致癌性预测模型[J].电子技术应用，2022，48(6)：33-35，41.
英文引用格式： Wei Ruobing，He Jiafeng，Qiu Xiaofang，et al. Predict the carcinogenicity of compounds with SGCN[J]. Application of Electronic Technique，2022，48(6)：33-35，41.

Predict the carcinogenicity of compounds with SGCN

Wei Ruobing，He Jiafeng，Qiu Xiaofang，Liu Qi

College of Information Engineering，Guangdong University of Technology，Guangzhou 510006，China

Abstract： The rapid increase of the number of cancer patients has attracted worldwide attention. Researchers are very concerned about the assessment of the carcinogenicity of compounds, but this is extremely challenging. In this paper, 341 kinds of experimental data were obtained, and the spatial atom feature combined with the spatial graph convolutional network(SGCN) was used to establish a model that could predict the carcinogenicity of compounds. The results showed that when compared to other models, the classification model of the SGCN was more suited to predicting the carcinogenicity of compounds and had an overall classification accuracy of 96.9%, which showed that the SGCN model could accurately classify chemicals and had considerable potential in practical applications.

Key words : spatial graph convolutional network；classification model；carcinogenicity of compounds

0 引言

由于技术的发展，新化合物的合成速度加快，每年诞生的化合物数以万计^[1-2]，传统的评价方法不可能对所有的化合物进行评估。并且近年来患癌人数不断增多^[3]，目前仍不清楚大多数的癌症是由于暴露于何种致癌化合物而导致的。世界卫生组织国际癌症机构(IARC)致癌清单中只有429种化合物被归为具有致癌性物质,但仍有500余种化合物未进行判定。传统的化合物致癌性评估主要通过实验测试进行，试验周期长且成本昂贵，不确定因素过多，因此迫切需要开发替代方法和工具来评估化合物的致癌性。

利用计算机进行毒性预测^[4]是安全评价的重要手段，能够大幅度节省非临床安全评价试验成本，提高试验设计的科学性和准确性。随着机器学习的不断发展，支持向量机(SVM)、随机森林、神经网络(Random Forest)和K-最近邻(KNN)等机器学习算法已被广泛用于化合物毒性预测中^[5-7]。此外，对致癌性化合物的预测也有一些报道。2004年，张晓昀等人^[8]用人工神经网络中误差反向传播网络(BPNN)和径向基函数网络(RBFNN)对化合物的致癌性强弱进行了分类，模型的分类准确率达到了80%以上；2005年，张振山等人^[9]用PCA对分子描述符降维，利用决策森林的方法预测化合物致癌性；在2007年，谢莹等人^[10]基于gSpan算法，挖掘与已知毒性化合物具有相同字结构的化合物，进行未知化合物的毒性预测；2017年，梁倩倩等人^[11]基于量化构效关系(QSAR)方法预测N-亚硝基化学物(NOCs)的致癌性，同年，阎爱侠等人^[12]构建化合物的多维描述符，分别采用4种机器学习方法(朴素贝叶斯、随机森林、多层感知机和支持向量机)，模型的平均正确率达到74%±3%。

本文详细内容请下载：http://www.chinaaet.com/resource/share/2000004415。

作者信息：

魏若冰，何家峰，邱晓芳，刘旗

(广东工业大学信息工程学院，广东广州 510006)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容