1. X射线衍射晶体结构分析(模块一) 1912年,Laue设计将一束X射线穿过硫酸铜晶体,成功的观察到了X射线衍射图像。该实验解决了两个争论持久的问题:首先证明X射线是波长很短的波,其次证明晶体是原子有规则排列而成的固体。该实验揭开了通过X射线衍射测量晶体结构的序幕,Laue因此在1914年获得诺贝尔物理学奖。随后Bragg父子在Laue的基础上给出了晶体结构与衍射方向之间的定量关系,奠定了X射线晶体结构分析的基础,这就是著名的Bragg方程:2dSinθ=nλ,式中d是晶体中的晶面间距,θ是入射X射线与晶面的夹角,λ是X射线的波长。上述公式表明当n为正整数时若等号成立,即可观察到有波峰和波峰(或波谷与波谷)叠加而成的衍射光。亦即改变入射光和晶体的夹角,当观察到衍射光时即可根据该夹角和入射光的波长计算出晶面间距,即等于获得了晶胞的大小和形状。 通过衍射光的方向(衍射角)可测得晶胞大小和形状,而衍射强度则决定了各原子在晶胞中的位置。由此,通过测量X射线穿过晶体时产生衍射光的衍射方向和强度,可以推算出晶体的微观结构,这就是X射线衍射晶体结构分析。 2.蛋白质晶体结构分析(模块二) 1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,开创了蛋白质晶体结构分析技术。两位科学家分享了1962年的诺贝尔化学奖。当前蛋白质晶体结构分析的基本流程是首先通过基因克隆技术获得大量高纯度的目的蛋白质用于结晶,然后将蛋白质与预先配好的结晶溶液进行混合,利用悬滴法获得蛋白质晶体。悬滴法结晶的基本原理是通过蒸发降低蛋白质溶液中水含量,使得蛋白结晶析出。结晶溶液中主要包括缓冲溶液、沉淀剂、离子盐。缓冲溶液的作用是保持整个体系pH稳定性;沉淀剂的作用是使得体系的水含量降低,促使蛋白质结晶析出;离子盐主要用于中和蛋白表面的电荷,增加蛋白之间碰撞堆积的概率。蛋白通过悬滴法生长2-30天后达到一定尺寸后,便可捞出放入液氮中保存,送往X射线光源进行衍射实验。值得一提的是,蛋白质虽然是大分子,但晶体尺寸往往十分小。因此蛋白质晶体中结构基元总数较少,衍射光较弱。为获得高精度的结构数据,需要使用强度极高的X射线。同步辐射光源通过令高速运动的电子在磁场中作曲线运动产生高强度X射线,是进行蛋白质晶体衍射实验的理想光源。目前我国已建成最先进的同步辐射光源是上海同步辐射光源。 3.蛋白-配体相互作用(模块二) 蛋白质配体是指各类能和蛋白质结合的小分子,包括金属离子、辅因子、底物、抑制剂或激动剂分子等。配体分子与蛋白质的结合作用主要来自于蛋白质原子与配体原子之间形成的氢键、离子键、静电作用和疏水作用,有时也包括共价键。蛋白-配体相互作用对蛋白质的功能起着至关重要的作用,例如酶蛋白催化反应的本质即是酶蛋白通过与底物分子的相互作用促使底物转化为产物。若用另一小分子代替底物与酶蛋白结合,即可阻断蛋白-底物相互作用,起到抑制酶蛋白活性的作用,这就是抑制剂。抑制剂是当前创新药物研发的热点。例如本实验中的人体HMG-CoA还原酶(3-hydroxy-3-methyl glutaryl coenzyme A reductase,以下简称HMGR)。HMGR在人体中负责催化从3-羟基-3-甲基戊二酰辅酶A(HMG-CoA)到甲羟戊酸(MVA)的合成反应,是肝细胞合成胆固醇过程中的关键步骤。抑制HMGR酶蛋白的活性可起到降低体内胆固醇作用,从而治疗高血脂及相关疾病。著名的他汀类降血脂药物,如明星药美伐他汀(Mevastatin)和洛伐他汀(Lovastatin)等,均属于HMGR抑制剂。 4.蛋白-配体结合构象的计算(模块三) 准确解析生物大分子-配体相互作用的三维空间结构(结合构象)是生物体系分子识别、生理生化性质与功能的分子机理、基于结构的药物设计等研究领域中的一个最基本、同时也是最重要、最复杂的关键科技问题。目前该领域常用的实验方法主要有晶体X-射线衍射法和高分辨液相核磁共振法(NMR),以及近几年逐渐受到关注的冷冻电镜技术。然而受制于生物大分子的复杂性(分子量大、蛋白纯化表达困难、晶体培养条件苛刻、晶体分辨率低等),通过实验手段快速解析蛋白质等生物大分子及其配体复合物结构信息的能力仍然受到限制和挑战。运用现代分子模拟方法对生物大分子-配体的结合构象进行理论预测无疑是对上述实验方法的一个有益、重要且必须的补充,同时也是理论与计算化学复杂体系与方法研究中的重要内容。理论计算研究生物大分子中配体分子的基态和激发态性质与功能的前提就是要获得准确的生物大分子与配体分子的结合构象。因此,在没有蛋白复合物晶体或高分辨NMR等实验结构数据的情况下,发展复杂生物体系的理论计算策略与方法获得准确的生物大分子与配体结合构象成为该研究领域首先需要解决的关键科学问题之一。 4.1传统蛋白-配体结合构象计算方法:分子对接 目前应用最广泛的蛋白-配体结合构象计算工具是分子对接计算程序。分子对接是通过研究配体(如药物小分子)和受体(如蛋白质或其他生物大分子)间相互作用,并预测其结合模式和亲合力的一种理论模拟方法。近年来,分子对接方法已成为计算机辅助药物研究领域的必备技术。分子对接依据配体与受体作用的“锁-钥原理”(lock and key principle),模拟小分子配体与受体生物大分子相互作用。配体与受体相互作用是生物大分子与药物小分子识别与结合能力的来源,主要包括静电作用、氢键作用、疏水作用、范德华作用等。 分子对接首先产生一个填充受体分子表面的口袋或凹槽的球集,然后生成一系列假定的结合位点。依据受体表面的这些结合点与配体分子的距离匹配原则,将配体分子投映到受体分子表面,通过旋转和扭动配体分子得到一组可能的受体-配体结合构象。通过计算这些结合构象的亲和力,并对计算结果进行打分,按得分高低判定最优受体配体结合构象并基于该构象给出对配体与受体的结合能力的计算。分子对接的种类主要包括:(1)刚体对接:在对接过程中,研究体系(受体和配体)的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。(2)半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。(3)柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。目前应用最广泛的是半柔性分子对接计算。 4.2高精度蛋白-配体结合构象预测策略与计算方法:CSAMP Based DOX 目前获广泛应用的传统分子对接计算方法的优点是计算速度快,但同时也有计算精度不高的问题,例如根据文献报道的对七种主流分子对接程序的系统评测,以预测/正确构象差异RMSD<2Å为标准,不同分子对接方法的准确率大致在30%~60%,尽管RMSD<2Å的标准并不算严格。 文献报道还发现分子对接搜索构象的效率较高,在所产生的全部结合构象中往往已包含“正确”结合构象。其预测结果不准的根源在于对构象排序所用的经验打分函数精度有限。若用更高精度的理论取代经验打分函数对构象进行排序,即可提高结合模式预测的准确度。我们课题组与复旦大学徐昕教授合作,基于上述思路发展了高精度蛋白-配体结合模式计算方法DOX。DOX方法主要特点是利用CSAMP(Conformation Search Across Multiple-Level Potential-Energy Surfaces)策略,将分子对接、半经验量子化学理论和第一性原理密度泛函理论进行有机结合。所谓CSAMP策略即是用低精度理论进行全局构象搜索,用中精度理论进行构象筛选,最后用高精度理论进行构象排序(图3)。该策略结合了低精度理论的高效率和高精度理论的准确性,从而允许我们利用较少的计算量逼近计算量无法估计的高精度搜索全势能面的结果,实现第一性原理级别的高精度构象预测。在DOX方法中,PM7半经验方法被用于对Surflex Dock产生的300个构象进行筛选,取前十个用eXtended ONIOM(XO)计算进行最终排序(图4)。XO是徐昕教授课题组发展的复合计算化学理论方法,通过分块计算显著降低高标度理论的计算量,从而实现巨大体系的密度泛函理论计算。在Astex标准测试集上的测试表明DOX方法的结合模式计算准确率(以RMSD<2Å为标准)高达99%,显著优于分子对接的表现。 采用更严苛的标准(RMSD<1Å),DOX方法的准确率仍可达到70%以上,这意味着DOX计算的精度已接近晶体结构。由于引入第一性原理计算,DOX方法的计算量显著大于分子对接,目前不适用于大规模虚拟药物筛选等“粗研”场景,但在酶催化反应机理或药物先导化合物优化等“细研”场景中,DOX方法是具有良好性价比的选择。DOX1.0方法于2016年发表(J. Comput. Chem.2016, 37, 336)。DOX2.0方法于今年发表 (J. Chem. Theory Comput. 2019, 15, 4264)。目前可通过访问DOX网页服务器使用DOX云计算服务(http://202.114.32.71:10280/wandox/DOXserver/home.html)。
CSAMP策略
DOX蛋白-配体结合构象计算流程
|