机器学习在新墨西哥大学领导的新研究中发现了以前未知的基因

在新墨西哥大学研究人员进行的一项开创性研究中， 科学家们利用机器学习的力量来识别一组以前未知的与自噬相关的基因，自噬是参与回收和维持细胞健康的重要细胞过程。

该研究利用最先进的机器学习模型，确定了 193 个基因作为自噬机制的潜在贡献者。新墨西哥大学神经科学家 Elaine Bearer 博士表示，这些以前被忽视的“黑暗基因”代表了解开自噬之谜及其在细胞功能和阿尔茨海默病等复杂疾病中的作用的有希望的途径。

“这是另一种形式的公正、数据驱动的科学，”贝尔说。 “机器学习让我们能够避免猜测，并以非假设驱动的方式进行发现科学。”

这项研究的标题是“自噬暗基因：我们能用机器学习找到它们吗？” 最近发表在杂志上自然科学，旨在通过结合不同的生物特征和数据集并将数据插入人工智能算法来识别自噬相关的基因集。

“我们的想法是，‘我们能否通过人工智能调查找到这些黑暗、隐藏的秘密基因？’”贝尔说。

答案是肯定的，机器学习可以指导基因组学研究以获得复杂过程的更完整的注释。

但贝尔强调，机器学习并不是任务的结束。一旦人工智能识别出某些东西，科学家就需要验证过程和结果。

为了实现这一目标，新墨西哥大学的一个研究团队采用了 MetaPath/XGBoost (MPxgb) 机器学习模型，该模型使用来自 17 个不同来源的数据进行训练。这项人工智能研究调查始于 2019 年，由医学博士 Tudor Oprea 领导，他是新墨西哥大学分子发现和药物发现核心中心筛选信息学的前主任，也是新墨西哥大学综合癌症中心的成员。

Mohsen Ranjbar 博士是新墨西哥大学化学和化学生物学研究生，他采用了 Oprea 的研究并进行了验证搜索，梳理了自噬数据库和 PubMed 等研究出版物数据库，以了解该模型在区分已经存在的疾病方面是否表现出较高的准确性。已知的自噬相关基因。

我们可以比以前更多地使用机器学习。有时我们对某些事物的了解有限，但我们可以使用机器学习来阐明事物并为我们指明前进的方向。

- 莫森·兰吉巴尔, 研究生, 药学博士

通过搜索，Ranjbar 的发现显示，虽然 23% 的最受预测基因已在自噬数据库中注释，但惊人的 77%（193 个基因）是新发现，代表了理解细胞过程中自噬调节的尚未开发的潜力。

“这很有趣，也很令人惊讶，”兰吉巴尔说。 “自从我们开始这项研究以来才过了很短的时间，并且看到其中一些特定的人工智能发现的基因已经在最近的不同出版物中被提及为新发现的自噬基因，这表明我们寻找这些基因的机制得到了验证”。

Bearer表示，通过揭示这些自噬暗基因，研究人员可以更深入地研究自噬失调与疾病发生之间的关系，最终指导疾病新治疗策略的开发。

这项开创性的研究还展示了机器学习和人工智能在基因组研究中的多功能性，将知识从自噬扩展到生物学的其他领域。

“我们不知道与内体运输等相关的所有基因，这对于包括阿尔茨海默氏病在内的许多疾病非常重要，”贝尔说。 “因此，我们可以使用我们的机器学习模型来研究和识别基因组中尚未对其功能作用进行湿台测试的其他基因。”

这项研究得到了多项资助的支持，包括 NIH U24CA224370、U24TR002278、UL1TR001449、P20GM121176、P20AG068077、R01 MD014153 和 Harvey Family Endowment。

新墨西哥州阿尔茨海默病研究中心、新墨西哥州自噬、炎症和代谢中心以及新墨西哥州临床和转化科学中心提供了额外的支持。

贝尔表示，如果不跨越学术和研究部门的界限，跨学科研究就不可能进行。她在病理学系工作，Ranjbar 在化学系工作，该项目的其他贡献者来自内科、计算机科学和分子发现中心。

“这个大项目超越了新墨西哥州内的多个实体，”她说。 “我想影响有关机器学习使用的科学思维，因为它非常强大。”

关岛中心邀请新墨西哥大学精神病学学生参加新的住院医师计划

2023 年 7 月 05 日

机器学习在新墨西哥大学领导的新研究中发现了以前未知的基因

联系媒体成员

资料下载

相关故事