预测出地球上几乎所有蛋白质结构,AI工具真能加速新药开发吗?( 二 )


预测出地球上几乎所有蛋白质结构,AI工具真能加速新药开发吗?
文章图片
图片来源:123RF
不过从新药开发的整个时间周期上来说 , AlphaFold对加速药物发现的帮助就比较有限了 。 这是因为了解蛋白质的结构只是临床药物开发过程中的限速步骤之一 。
专家指出 , AlphaFold并不能让临床试验变得更可预测 。 不论AlphaFold能以多快的速度给出这些候选药物的蛋白结构 , 但对蛋白结构的了解并不能减轻临床失败的风险 。 临床上85%的失败是因为选择了错误的靶点 , 或者预期外的事件 , 例如候选药物还存在免疫原性和毒理学方面的问题等等 。
此外 , 就蛋白结构预测方面来说 , AlphaFold也存在着局限性 。 其一是AlphaFold的训练是基于蛋白质数据库中晶体结构的瞬间快照 , 这些晶体结构实际上只是不断运动的蛋白质的某种可能构象 。 因为蛋白质结构在其他小分子配体存在的情况下会发生变化 , 这种变化有时候是微小的 , 有时候是剧烈的 。 但AlphaFold尚未具备预测这些变化的能力 , 这也就限制了其在设计治疗药物方面的用途 。
另一大局限性在于 , AlphaFold如果要完美预测出蛋白质结构用于药物对接筛选 , 还需要更多方面的高质量数据 。 因为人工智能下一个必须要回答的问题就是预测候选药物与蛋白质的结合强度 。 这取决于结合时的盐浓度和pH、药物溶解度以及生物效价等数据 , 而这些数据目前还没有 , 或者说有 , 但机器还没办法识别和利用 。
不过DeepMind的研究科学家表示:“这些数据只是尚未收集 。 现在我们已经清楚地证明了人工智能在其中的价值 , 这可能会鼓励实验人员从一开始就带着机器学习的思维去进行数据集采集 。 ”
助力新药开发 , AlphaFold并非以“速度”取胜
尽管AlphaFold在新药开发“提速”方面的作用有限 , 它在解决蛋白折叠问题上的成就毋庸置疑依然是一项巨大突破 , 并给生物医药公司的研究人员们带来了更多的想象空间 。
由于DeepMind公开了AlphaFold的代码 , 外部的研究人员也能够按自己的想法对AlphaFold进行研究和迭代 , 并且外部研究员对这款AI工具的研究结果和“标签外”用途方面的创造力令创造它的内部人员都咋舌 。
哈佛大学的一项研究表明 , AlphaFold似乎已经“理解“了蛋白质的序列和结构之间关系的一些知识——即使不给它提供一些额外的、从前被认为非常重要的信息(来自相关蛋白质序列的多序列比对协同进化数据) , 它仍然可以预测出高度准确的蛋白质结构 。
为了解决AlphaFold无法显示蛋白质在细胞中活动时构象的局限性 , DeepMind也做出了不少努力 。 2021年 , DeepMind发布了一个名为AlphaFold-Multimer的更新 , 可以对多种蛋白质的复合物进行建模 。 DeepMind的团队用它来识别公开蛋白数据库中的上千种复合体 , 发现它能够预测大约70%的已知蛋白间相互作用 。
这些工具已经在帮助研究人员发现新的结合蛋白 。 斯德哥尔摩大学ArneElofsson博士的团队在2022年NatureCommunications上发表的论文中 , 利用AlphaFold与实验数据相结合 , 他们预测了65000种可能相互作用的蛋白对(proteinpairs)的结构 。
预测出地球上几乎所有蛋白质结构,AI工具真能加速新药开发吗?
文章图片
对于AlphaFold的另一个局限性——还需要更多方面的高质量的数据对其做出进一步的完善 , 一些科学家也作出了一些初步的探索 。 研究人员发现 , 利用AlphaFold预测蛋白质结构和结合位点解剖结构 , 进行高通量对接以进行药物发现时 , 氨基酸和单个肽的位置需要非常精确 , 并使用其他计算方法进行优化(可能需要大量计算) , 以及把溶媒也纳入考量因素 , 可以模拟准确的相关位点结合环境 , 帮助提高药物设计的效率 。