微软 BioEmu-1 推动药物研发:AI 精准预测蛋白质结构变化
创始人
2025-03-01 19:24:31

3 月 1 日消息,微软研究院于 2 月 20 日发布博文,宣布推出 AI 模型 BioEmu-1,能够预测蛋白质随时间推移的运动和形状变化,在生物医学、药物发现和结构生物学领域带来新可能。

借助 AI 探究蛋白质

从形成肌肉纤维到保护我们免受疾病侵害,在几乎所有生物过程中,蛋白质都发挥着至关重要的作用。

科学家近年来利用深度学习,在研究蛋白质结构方面已取得重大进展,能够根据氨基酸序列准确预测蛋白质结构。然而,仅从氨基酸序列预测单一蛋白质结构就像观看电影的单帧画面,只提供了一个高度灵活分子的截图。

微软 BioEmu-1

不同于 DeepMind 的 AlphaFold 专注于确定静态蛋白质结构,BioEmu-1 模拟蛋白质在不同构象之间的动态转换,为理解蛋白质运动、设计有效治疗方案提供了新的工具。

AlphaFold 3 在结构生物学领域取得了重大进展,改进了蛋白质与 DNA、RNA 和小分子的相互作用模型,但它无法预测蛋白质随时间的变化。

BioEmu-1 弥补了这一不足,它可以生成多个可能的构象,而不仅仅是单一的最佳拟合结构,这在药物开发中尤为重要。

BioEmu-1 利用生成式深度学习,从大型数据集中学习模式,然后生成与这些模式一致的新样本,通过结合静态蛋白质结构、分子动力学模拟数据和实验稳定性数据进行训练。

BioEmu-1 的核心机制是一个扩散模型,它迭代地生成蛋白质结构并根据学习到的约束条件提高其准确性。BioEmu-1 的关键输出是平衡系综的预测和自由能预测。

BioEmu-1 使用三种类型的数据集进行训练:(1)AlphaFold 数据库 (AFDB) 结构;(2)广泛的 MD 模拟数据集;(3)实验性蛋白质折叠稳定性数据集。

通过这些数据集的训练,BioEmu-1 可以识别蛋白质序列映射到多个不同结构,预测合理的结构变化,并学习以正确的概率对折叠和未折叠结构进行采样。

BioEmu-1 每小时可生成数千个蛋白质结构样本,相比需要数周时间的传统分子动力学模拟,显著加快了研究速度并降低了计算成本,其预测自由能的误差幅度在 1 kcal / mol 以内,与传统分子动力学模拟相当,但计算成本却显著降低。

【来源:IT之家】

相关内容

热门资讯

连续两天沉浸式打卡!俞敏洪点赞... 3月21日至22日,在省委网信办指导下,福州市委网信办携手国内知名文旅与农产品直播IP“东方甄选”,...
最新或2023(历届)五横中心... 了加强班级的文化建设,提高同学们的思维能力和动手能力,开阔学生视野;为让学生以崭新的面貌、昂扬的姿态...
在乾隆众多的老婆当中 只有几位... 近日《如懿传》热播,剧中讲述乾隆与诸位后妃故事,着中描绘乾隆与其继后乌拉那拉氏。其实历史上乾隆最恨的...
爱新觉罗·永琮2... 根据历史记载,乾隆的后宫中有41位妃子,因此,自然也就会拥有很多的皇子,乾隆总共有17位皇子,在这1...
成都郫都广福村如何接住流量? 登陆央视《山水间的家》后 成都郫都广福村如何接住流量? 俯瞰广福村。郫都区委宣传部供图 “向新向...