分享一篇发表在JACS上的文章,文章的题目是“Enumerative Discovery of Noncanonical Polypeptide Secondary Structures”,通讯作者为华盛顿大学的David Baker教授以及伦斯勒理工学院的Gaetano Montelione教授。Baker教授是蛋白设计领域的行业泰斗,Montelione教授主要着眼于开发用于分析蛋白质结构和动力学性质的NMR方法。
二级结构的形成是蛋白折叠的重要步骤,有序的二级结构可以通过降低系统自由能,克服折叠的熵成本来推动蛋白质向更稳定的这些状态发展,α螺旋和β折叠就是最典型的例子。而非天然氨基酸的加入也让二级结构具有更丰富的多样性。目前,合成化学家和计算化学家已经发现了数百种由非天然氨基酸形成的重复二级结构,其中一些新的二级结构具有较天然螺旋更高的热力学稳定性,且不易受到天然蛋白降解过程的影响,具有更高的生物学稳定性。然而,由于非天然二级结构复杂的构象空间以及庞大的侧链构象组合数,对非天然二级结构的直接计算造成了阻碍,因此目前极少有对此类系统计算搜索相关的报道。针对上述问题,本文描述了一种系统性的计算方法,用于搜索由130种不同的非天然氨基酸所构成的能够形成低能态重复二级结构的二肽序列。该方法主要包含以下步骤:(1)对130种不同的非天然氨基酸进行势能面扫描;(2)使用势能面来指导非天然氨基酸的构象采样;(3)根据采样结果对非天然残基进行组合生成二肽构象;(4)对每种二肽构象生成由四个重复片段形成的短螺旋结构,并进行能量评估以寻找低能构象。在该方法中,势能面扫描采用了AIMNet(SMD)-D4神经网络结合体积与玻尔兹曼损失自适应采样(VABLAS)手段共同完成。AIMNet(SMD)-D4是一个经过数百万次DFT计算训练并使用SMD溶剂化和DFT-D4矫正的神经网络模型,可用于分子结构与性质的计算,其具有较分子力学方法更高的精度以及较DFT方法更快的计算效率。VABLAS方法是一种基于Delaunay三角剖分的采样方法,能够识别势能面的低能区域并进行迭代细分采样直至收敛。通过上述方法获取130种非天然氨基酸势能面后作者,根据波尔兹曼概率分布对每一个单体进行采样,以保证获取的构象集主要集中在低能构象上,同时也允许一定程度的高能构象。根据势能面指导的采样得到的构象集,作者从130种非天然氨基酸单体中组合得到了20475种二肽构象组合。随后从这些二肽单元出发,形成具有4个相同重复单元的八肽,并舍弃了存在内部冲突的结果。最后使用AIMNet(SMD)-D4对每一类八肽的各个构象进行能量评估,以寻找其中的低能态构象,作为最终的设计结果。最后,作者选择了10种化学和结构不同的设计进行实验合成与表征,这些设计均被预测为全局能量最小值,且易于合成,在以往的文献中尚未被描述。通过NMR表征,最后在10个预测结果中发现有4个形成了和设计模型一致的有序二级结构,这些结构相较于天然二级结构中主要以主链-主链相互作用为主的作用模式,其表现出了更多的侧链-侧链相互作用以及主链-侧链相互作用来实现二级结构的稳定,大大拓展了二级结构的多样性。总而言之,本文提供了一种基于势能面扫描与采样的非天然二级结构设计方法,实现了更加多样,涉及更多相互作用类型的非天然二级结构的计算设计,为蛋白质工程提供了新的构建模块和设计思路。原文链接:https://pubs.acs.org/doi/10.1021/jacs.4c04991文章引用:DOI:10.1021/jacs.4c04991