作者信息:杨念祖 (上海交通大学),曾锴鹏 (上海交通大学),吴齐天 (上海交通大学),严骏驰 (上海交通大学)
基于机器学习的预测模型在临床决策中显示出巨大潜力,有效地提高了决策的准确性和安全性。这类模型通过深度学习和分析大量的个人医疗数据,能够为医疗专家提供更为准确的疾病诊断和治疗建议。
现代科技的快速发展使得这类预测模型得以成功地应用在基于网络的疾病诊断系统中,大幅提升了诊断的效率和准确度。例如,通过分析和学习患者的电子健康记录,医疗专家能够根据患者的健康状况和病史,为他们提供更为个性化的诊断和治疗方案。
特别是在药物推荐方面,这种预测模型的应用显得尤为关键。”组合药物推荐”是指根据患者的具体健康状况,为其推荐一个合适的药物组合作为最终的处方。这种方法的应用,无疑为个性化医疗带来了新的可能性和方向。组合药物推荐这一任务的目标在于,根据病患的健康状况,为他们提供适宜的药物组合作为最终的处方。
这个问题在某些方面与序列推荐问题类似,因为本身都属于是推荐任务。然而,存在两个方面的主要差别:1)药物推荐的目标是返回一些药物的集合,而传统推荐任务的给出的推荐结果是单个商品;2)推荐的药物集合需要满足某些安全性要求,即尽可能避免最终推荐药物集合内 drug-drug interaction(**DDI**)的存在。DDIs 通常发生在一种药物与另一种药物同时使用的时候,其效果可能会危及生命。例如,当一起服用 Adenosine 和 Ephedrine 两种药物时,通常会导致心率过高。DDI rate 是一个相关的用以评估推荐结果安全性的指标,指的是药物组合内部冲突药物对的数量占总推荐药物对数量的比例。
本文的动机来自一个被生物信息学、药理学、机器学习等领域的不少相关工作 [1,2,3] 提出的这样一个观察发现: 分子的性质通常与一些特定的子结构有关。因此,我们可以进一步认为药物分子的部分子结构对治疗特定疾病起关键作用。所以从分子子结构的角度出发去设计模型,可能会产生更好的效果和可解释性。此外,已经证明,药物-药物相互作用实质上源于子结构-子结构相互作用,这表明建模子结构之间的相互作用可能可以提高推荐结果的安全性。
在这篇文章里,针对组合药物推荐任务,作者们提出了一种新的药物推荐方法 **MoleRec**。提出的 MoleRec 方法框架如下图所示,主要由以下三部分组成:
1. 患者表征学习模块对患者的纵向诊断和过程信息进行编码;
2. 药物表征学习模块基于患者的病情为药物生成对分子子结构感知的表征;
3. 预测模块基于上一个模块输出的子结构感知的药物表征进行处方预测。
本文的动机来自一个被生物信息学、药理学、机器学习等领域的不少相关工作 [1,2,3] 提出的这样一个观察发现: 分子的性质通常与一些特定的子结构有关。因此,我们可以进一步认为药物分子的部分子结构对治疗特定疾病起关键作用。所以从分子子结构的角度出发去设计模型,可能会产生更好的效果和可解释性。此外,已经证明,药物-药物相互作用实质上源于子结构-子结构相互作用,这表明建模子结构之间的相互作用可能可以提高推荐结果的安全性。
MoleRec 建模了子结构们之间的相互作用以及患者病情与子结构之间的关联性。此外,本文在训练阶段设计了一种调整策略,以动态地重新加权DDI损失,帮助模型在推荐准确性和安全性之间找到更好的平衡。最后,在MIMIC-III上进行的大量实验已经证明了提出的方法在推荐结果的准确性和安全性方面的有效性。
此外,提出的新方法 MoleRec 已经作为一个 baseline model 被整合进 UIUC 的 Jimeng Sun 老师组发布的 PyHealth Package 中。截止目前,该项目已在GitHub上收获 700+ star。
参考文献
1. Klekota, Justin, and Frederick P. Roth. “Chemical substructures that enrich for biological activity.” Bioinformatics 24.21 (2008): 2518-2525.
2. Phanus-Umporn, Chuleeporn, et al. “Privileged substructures for anti-sickling activity via cheminformatic analysis.” RSC advances 8.11 (2018): 5920-5935.
3. Yang, Nianzu, et al. “Learning substructure invariance for out-of-distribution molecular representations.” Advances in Neural Information Processing Systems 35 (2022): 12964-12978.