IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于多智能体强化学习的乳腺癌致病基因预测

已有 6306 次阅读 2022-4-29 15:58 |系统分类:博客资讯

用本文


刘健, 顾扬, 程玉虎, 王雪松. 基于多智能体强化学习的乳腺癌致病基因预测. 自动化学报, 2022, 48(5): 1246−1258 doi: 10.16383/j.aas.c210583

Liu Jian, Gu Yang, Cheng Yu-Hu, Wang Xue-Song. Prediction of breast cancer pathogenic genes based on multi-agent reinforcement learning. Acta Automatica Sinica, 2022, 48(5): 1246−1258 doi: 10.16383/j.aas.c210583 

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210583?viewType=HTML


文章简介


关键词


乳腺癌, 致病基因, 基因排序, 多智能体强化学习, 演示学习


摘   要


通过分析基因突变过程, 提出利用强化学习对癌症患者由正常状态至患病状态的过程进行推断, 发现导致患者死亡的关键基因突变. 首先, 将基因视为智能体, 基于乳腺癌突变数据设计多智能体强化学习环境; 其次, 为保证智能体探索到与专家策略相同的策略和满足更多智能体快速学习, 根据演示学习理论, 分别提出两种多智能体深度Q网络(Deep Q networks, DQNs): 基于行为克隆的多智能体DQN和基于预训练记忆的多智能体DQN; 最后, 根据训练得到的多智能体DQN进行基因排序, 实现致病基因预测. 实验结果表明, 提出的多智能体强化学习方法能够挖掘出与乳腺癌发生、发展过程密切相关的致病基因.


引   言


基因突变是由DNA分子中碱基对发生增添、缺失或替换而引起的基因结构变化. 基因突变具有随机性, 是一种可遗传的变异现象. 致病基因突变通过阻止一种或多种蛋白质正常工作扰乱正常的发育过程或导致疾病. 癌症是由控制细胞功能的基因突变引起的一系列相关疾病的统称. 导致癌症的基因突变可能遗传自父母, 也可能是人体自身受致癌环境或致癌物质刺激导致细胞分裂时产生的错误. 一般来说, 癌细胞比正常细胞有更多的基因突变. 乳腺癌是世界上最常见的疾病之一, 2018年新增乳腺癌患者约20亿人. 医学领域的多项研究表明, BRCA1、BRCA2和PALB2基因的突变会导致乳腺癌风险增加, 其他与乳腺癌患病风险相关的基因突变包括ATM、TP53、PTEN等. 因此, 从乳腺癌组学数据中挖掘出与其密切相关的致病基因对乳腺癌的临床诊断、预后和治疗有着深远意义.


在生物信息学中, 癌症致病基因预测通过基因排序方法实现. 基于网络相似度的基因排序算法通过分析多种基因-疾病网络中的局部、全局信息, 计算基因与疾病之间的相似性, 从而对基因进行排序. 例如, Kohler等提出重启随机游走算法利用网络全局拓扑信息对致病基因进行预测; Xu等提出多路径随机游走的网络嵌入模型对异构网络进行致病基因预测. 这些方法过度依赖网络拓扑信息, 不能对网络外的基因进行预测, 且对癌症数据中的噪声比较敏感. 随着机器学习理论的发展, 基于机器学习的基因排序方法利用监督学习或非监督学习方式实现基因预测, 能够挖掘到与癌症相关的致病基因, 被广泛应用于癌症致病基因的预测. 例如, Han等将图卷积网络和矩阵分解结合提出一种疾病基因关联任务框架; Natarajan等将推荐系统中的归纳矩阵补全用于预测基因与疾病的相关性.


在乳腺癌致病基因预测方面, 自然启发式算法应用较广, 例如粒子群优化(Particle swarm optimization, PSO)、遗传算法等. Sahu等提出一种基于PSO的基因选择算法, 首先采用k均值聚类方法对数据集进行聚类, 利用信噪比评分对聚类簇中的基因进行排序, 然后从每个聚类簇中收集得分最高的基因生成新的特征子集, 最后将新特征子集作为PSO的输入, 生成优化后的特征子集. Malar等通过将关联特征选择方法和改进的二进制PSO结合选择致病基因, 同时解决了微阵列数据的高维性问题. 为了消除对乳腺癌无意义的基因, AliazKovic等将遗传算法用于提取乳腺癌数据中的重要信息, 挖掘与乳腺癌生物过程相关的致病基因. Sangaiah等将特征加权和基于熵的遗传算法结合起来, 提出一种乳腺癌致病基因预测的混合方法. Alzubaidi等将遗传算法与互信息结合应用于乳腺癌致病基因选择. 通过遗传算法将基于互信息的基因选择算法转化为全局优化算法, 能够有效选择基因. 避免算法陷入局部最优. Alomari等结合最小冗余、最大关联算法和花授粉算法来确定包含更多癌症信息的基因子集. Hamim等提出一种基于决策树模型的乳腺癌致病基因选择策略, 该策略包括两个阶段: 基于Fisher评分的过滤阶段和基于C5.0算法的基因选择阶段. Liu等为了提高基因选择效率, 将基因评分与深度神经网络产生的基因重要性相结合, 同时考虑癌症亚型间的差异性和亚型内基因间的相关性来选择乳腺癌三阴性亚型的最优致病基因子集. Zhao等基于信息熵的不确定性系数被用来定义基因间是否存在逻辑关系, 进而构建基因逻辑网络, 最终通过比较对照组与实验组网络之间的差异程度, 提取乳腺癌致病基因.


上述预测方法都是基于已有癌症组学数据进行基因预测, 这些组学数据来源于对癌症患者的测序. 换言之, 这些方法仅能根据目前已发病患者的基因突变状态来分析基因与癌症之间的关联, 无法预知患者发病前的基因突变状态, 而发病前的基因突变状态与发病基因突变状态之间的差异才是癌症发生的关键.


强化学习是一类结合了优化控制思想和生命体学习行为的机器学习方法, 其要求待处理的问题环境拥有马尔可夫性质, 即当前状态仅受上一状态的影响, 与其余状态无关. 强化学习希望智能体在指定的状态能够得到让回报最大化的动作, 并通过智能体与环境的交互进行学习, 从而改变特定状态选择某个动作的趋势. 强化学习还是一种拥有自主决策能力的算法, 它使智能体通过在环境中的不断试错得到回报值和下一时刻状态的观测值, 最终学习到一个能够获取较大折扣累积回报的策略. 强化学习已被成功应用于多个研究领域, 例如, 数据驱动控制、多机协同决策、交通控制等.


本文通过分析基因突变, 发现其过程满足马尔可夫过程, 且基因突变与癌症之间的关联性可以通过强化学习中累计回报函数构建的方式进行计算. 因此, 基于乳腺癌突变数据, 本文设计一套强化学习环境与算法对患者从正常基因突变状态至死亡基因突变状态的过程进行评估、决策, 旨在为癌症致病基因预测提供新思路, 并挖掘出导致乳腺癌死亡状态的致病基因. 实验结果表明, 提出的强化学习算法能够挖掘出与乳腺癌密切相关的致病基因.


10.16383-j.aas.c210583-Figure2.jpg

图 2  多智能体强化学习框架(以第k个智能体为例)


10.16383-j.aas.c210583-Figure7.jpg

图 7  当N=188时, BCDQN预测的前10个致病基因的富集分析圈图


10.16383-j.aas.c210583-Figure8.jpg

图 8  当N=420时, PMDQN预测的前10个致病基因的富集分析圈图


作者简介


刘   健

中国矿业大学讲师. 2018年获中国矿业大学博士学位. 主要研究方向为机器学习和生物信息学.

E-mail: liujiansqjxt@126.com


顾   扬

中国矿业大学博士研究生. 2016年获中国矿业大学学士学位. 主要研究方向为深度强化学习.

E-mail: guyang@cumt.edu.cn


程玉虎

中国矿业大学教授. 2005年获中国科学院自动化研究所博士学位. 主要研究方向为机器学习和智能系统.

E-mail: chengyuhu@163.com


王雪松

中国矿业大学教授. 2002年获中国矿业大学博士学位. 主要研究方向为机器学习和模式识别. 本文通信作者.

E-mail: wangxuesongcumt@163.com


相关文章


[1]  张兴龙, 陆阳, 李文璋, 徐昕. 基于滚动时域强化学习的智能车辆侧向控制算法. 自动化学报. doi: 10.16383/j.aas.c210555

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210555?viewType=HTML


[2]  施伟, 冯旸赫, 程光权, 黄红蓝, 黄金才, 刘忠, 贺威. 基于深度强化学习的多机协同空战方法研究. 自动化学报, 2021, 47(7): 1610-1623. doi: 10.16383/j.aas.c201059

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c201059?viewType=HTML


[3]  姚红革, 张玮, 杨浩琪, 喻钧. 深度强化学习联合回归目标定位. 自动化学报. doi: 10.16383/j.aas.c200045

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200045?viewType=HTML


[4]  张红斌, 邱蝶蝶, 邬任重, 蒋子良, 武晋鹏, 姬东鸿. 基于分层基因优选多特征融合的图像材质属性标注. 自动化学报, 2020, 46(10): 2191-2213. doi: 10.16383/j.aas.c190012

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190012?viewType=HTML


[5]  梁星星, 冯旸赫, 马扬, 程光权, 黄金才, 王琦, 周玉珍, 刘忠. 多Agent深度强化学习综述. 自动化学报, 2020, 46(12): 2537-2557. doi: 10.16383/j.aas.c180372

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180372?viewType=HTML


[6]  孙长银, 穆朝絮. 多智能体深度强化学习的若干关键科学问题. 自动化学报, 2020, 46(7): 1301-1312. doi: 10.16383/j.aas.c200159

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200159?viewType=HTML


[7]  冯宝, 陈业航, 刘壮盛, 李智, 宋嵘, 龙晚生. 结合MRF能量和模糊速度的乳腺癌图像分割方法. 自动化学报, 2020, 46(6): 1188-1199. doi: 10.16383/j.aas.c180759

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180759?viewType=HTML


[8]  李金忠, 刘关俊, 闫春钢, 蒋昌俊. 排序学习研究进展与展望. 自动化学报, 2018, 44(8): 1345-1369. doi: 10.16383/j.aas.2018.c170246

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170246?viewType=HTML


[9]  秦蕊, 曾帅, 李娟娟, 袁勇. 基于深度强化学习的平行企业资源计划. 自动化学报, 2017, 43(9): 1588-1596. doi: 10.16383/j.aas.2017.c160664

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c160664?viewType=HTML


[10]  陈兴国, 俞扬. 强化学习及其在电脑围棋中的应用. 自动化学报, 2016, 42(5): 685-695. doi: 10.16383/j.aas.2016.y000003

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.y000003?viewType=HTML


[11]  陈鑫, 魏海军, 吴敏, 曹卫华. 基于高斯回归的连续空间多智能体跟踪学习. 自动化学报, 2013, 39(12): 2021-2031. doi: 10.3724/SP.J.1004.2013.02021

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.02021?viewType=HTML


[12]  王沛, 吕金虎. 基因调控网络的控制:机遇与挑战. 自动化学报, 2013, 39(12): 1969-1979. doi: 10.3724/SP.J.1004.2013.01969

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01969?viewType=HTML


[13]  张峰, 罗立民, 鲍旭东. 基于电阻抗扫描成像的乳腺癌自动诊断及参数提取. 自动化学报, 2012, 38(5): 850-857. doi: 10.3724/SP.J.1004.2012.00850

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.00850?viewType=HTML


[14]  李钧涛, 贾英民. 用于癌症分类与基因选择的一种改进的弹性网络. 自动化学报, 2010, 36(7): 976-981. doi: 10.3724/SP.J.1004.2010.00976

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00976?viewType=HTML


[15]  唐昊, 万海峰, 韩江洪, 周雷. 基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制. 自动化学报, 2010, 36(2): 289-296. doi: 10.3724/SP.J.1004.2010.00289

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00289?viewType=HTML


[16]  岳峰, 孙亮, 王宽全, 王永吉, 左旺孟. 基因表达数据的聚类分析研究进展. 自动化学报, 2008, 34(2): 113-120. doi: 10.3724/SP.J.1004.2008.00113

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2008.00113?viewType=HTML


[17]  郭锐, 吴敏, 彭军, 彭姣, 曹卫华. 一种新的多智能体Q学习算法. 自动化学报, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367

http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0367?viewType=HTML


[18]  高阳, 陈世福, 陆鑫. 强化学习研究综述. 自动化学报, 2004, 30(1): 86-100.

http://www.aas.net.cn/cn/article/id/16352?viewType=HTML


[19]  欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426.

http://www.aas.net.cn/cn/article/id/15536?viewType=HTML


[20]  卢欣, 李衍达. 基因调控过程中的典型控制环节. 自动化学报, 2000, 26(5): 637-644.

http://www.aas.net.cn/cn/article/id/16094?viewType=HTML




https://blog.sciencenet.cn/blog-3291369-1336241.html

上一篇:基于事件触发的离散MIMO系统自适应评判容错控制
下一篇:一种基于深度迁移学习的滚动轴承早期故障在线检测方法
收藏 IP: 103.254.68.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 18:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部