据世界卫生组织报告,全球癌症患者数量呈逐年上升趋势,这一严峻形势凸显了癌症作为严重危害人类健康的重大挑战,癌症的防治已经成为全球关注的焦点。癌症驱动基因的识别在理解癌症的发生机制中扮演着重要角色,同时为个性化的精准治疗提供策略。然而,现有方法在泛化性和可解释性方面仍存在诸多挑战。
针对这一问题,中国科学院新疆理化技术研究所科研团队与合作者经过不懈努力,提出了一种基于Transformer的图机器学习模型。这一创新性模型融合了人工智能与生物医学的优势,不仅具备可靠的预测性能,还兼具泛化性和可解释性。该模型通过整合基因等生物分子的多组学数据,以及同构/异构生物网络的结构信息,显著提高了癌症驱动基因预测的精确度,能够更准确地识别出与癌症发生发展密切相关的基因,为个性化治疗方案提供了坚实的科学依据。同时,癌症驱动基因识别效率也得到显著提升,有利于癌症的早期诊断和治疗策略的制定。该模型通过解析多组学数据和网络结构中的高阶关联,增强了可解释性,为研究人员进一步探索癌症的致病机制提供了宝贵线索,使得研究人员能够深入理解癌症基因相关的调控机制,进而发现潜在的癌症驱动基因,这对于揭示癌症发病机理、开发新的治疗策略具有深远的意义。通过构建精准的癌症基因调控图谱,该模型为个性化医疗和精准药物研发开辟了新途径。此外,该模型在整合多组学数据和复杂网络分析方面的优势,使其具备了跨疾病和跨领域应用的潜力。该项工作体现了人工智能与生物医学深度融合的前沿性,也为破解癌症难题提供了创新性解决方案,推动生命科学进入更加精准和智能化的新时代。
相关研究成果以全文形式发表在国际顶级期刊《自然·生物医学工程》(Nature Biomedical Engineering)。中国科学院新疆理化技术研究所为唯一通讯单位,博士研究生苏小芮为第一作者,胡伦研究员为通讯作者。该研究工作得到国家自然科学基金、中国科学院、新疆维吾尔自治区项目的资助。
模型框架图
来源:新疆理化所