以VTN与SLPI两个蛋白,进行两蛋白之间的分子对接
首先在https://www.uniprot.org/中搜索相关基因,如VTN,选择对应的种属,点击Entry编号,uniprot中可以直接跳转PDB数据库https://www.rcsb.org/(也可以复制编号,直接去PDB数据库中去检索),同理下载SLPI的最佳蛋白质结构。

选择分辨率最好的结构,点击跳转到PDB页面。

注1
PDB数据库中选择合适的蛋白质结构时,主要需要考虑以下几个因素:
1. 分辨率(Resolution)
分辨率越低,表示蛋白质的三维结构越模糊,信息不够精确。
分辨率较低的结构(如2.80 Å)通常不适用于高精度对接分析,因为它们的原子位置可能较为不准确。
分辨率较高的结构(如1.70 Å)具有更高的精度,原子位置更加明确,对于后续的分子对接操作和分析更为可靠。
2. 数据质量
查看PDB记录中提供的数据质量评分(如R-factor)。R-factor值越低,表明结构解算的质量越高。
如果PDB提供了多个结构文件,选择评分较好的、具有较低R-factor值的结构。
3. 配体和辅因子
如果你的研究对象涉及到某些特定的配体、离子或辅因子,选择那些带有这些信息的结构可能更为有用。
某些结构可能已经包括了与目标蛋白互作的天然配体或药物,这对对接研究有帮助。
4. 结构的完整性
确保你选择的蛋白质结构是完整的,没有缺失大量的片段。如果存在大量缺失的区域,可能影响分子对接的准确性。
检查是否有明确的结构注释,看看蛋白的活性位点是否被识别出来。
5. 同源建模和实验数据
如果你没有找到理想的实验结构,也可以考虑使用同源建模(比如使用AlphaFold、Swiss-Model等工具)来生成目标蛋白的结构。
如何选择:
优先选择分辨率较高的结构,如1.70 Å,特别是如果这个结构的R-factor和其他数据评分较好。
如果多个高分辨率结构中有差异,考虑选择那些更完整、无缺失的结构,并查看它们的配体和辅因子是否与你的研究相关。
如果你选择的PDB结构包含了与其他研究相关的配体或辅因子,可以帮助你推测可能的相互作用。
示例步骤:
在PDB数据库中搜索VTN(或根据具体的基因名,搜索相应的蛋白质)。
筛选出分辨率较高的结构(例如1.70 Å)。
阅读该结构的PDB条目说明,查看是否包含完整的蛋白质链、配体和关键残基。
如果有多个高分辨率结构,选择R-factor较低且较为完整的结构。
下载并准备该结构进行后续的分子对接分析。
总体来说,选择分辨率更高的结构和质量较好的数据是最重要的。如果可能,结合多种来源的信息来选择最适合的结构进行分子对接。
跳转页面后,下载7RJ9的PDB结构

注2
结构1:
PDB ID: 6O5E
Method: X-ray(X射线晶体学)
Resolution: 1.90 Å(分辨率)
Chains: A/B(表示该结构包含了链A和链B的部分)
Positions: 154-474(表示该结构包含第154到474号氨基酸残基)
Links: 提供了相关的PDB链接,包括PDBe、RCSB-PDB、PDBj和PDBsum网站。
结构2:
PDB ID: 7RJ9
Method: X-ray(X射线晶体学)
Resolution: 1.70 Å(分辨率)
Chains: A/B(表示该结构包含了链A和链B的部分)
Positions: 154-474(表示该结构包含第154到474号氨基酸残基)
Links: 提供了相关的PDB链接,包括PDBe、RCSB-PDB、PDBj和PDBsum网站。
分析和建议:
分辨率比较:
1.70 Å(PDB 7RJ9)的分辨率更高,相比1.90 Å(PDB 6O5E),这个结构提供的原子定位精度会更高。对于分子对接分析,分辨率较低的结构可能会引入一些误差,1.70 Å的结构无疑是更优选择。
链选择:
这两个结构都包含链A和链B的部分,且都覆盖了第154到474号氨基酸残基。如果你关注的是完整的蛋白质或特定功能区域的互作,可以选择这两个结构中的任意一个(或两个都使用,具体取决于后续分析的需求)。
结构质量:
由于分辨率较高,PDB 7RJ9的结构(1.70 Å)无疑是首选,它提供了更高的精度,有助于更准确地预测蛋白质间的相互作用,尤其在分子对接分析中非常重要。
总结:
优先选择 PDB 7RJ9(1.70 Å分辨率)的结构,因为它提供了最高的分辨率,适合进行精确的分子对接分析。
如果您需要在不同的亚单元或多个链之间进行研究,可以同时参考这两个结构(6O5E和7RJ9),但总体来说,7RJ9的质量更高。同理下载SLPI蛋白的最佳结构2Z7F

注3
1. PDB 2Z7F
Method: X-ray(X射线晶体学)
Resolution: 1.70 Å(分辨率)
Chain: I(链I)
Positions: 83-132(包含第83到132号氨基酸残基)
Links: 提供了相关的PDB链接,便于查看该结构的详细信息。
2. PDB 4DOQ
Method: X-ray(X射线晶体学)
Resolution: 2.00 Å(分辨率)
Chains: B/D(链B和链D)
Positions: 85-131(包含第85到131号氨基酸残基)
Links: 提供了相关的PDB链接。
3. AlphaFold AF-P03973-F1
Method: Predicted(预测,AlphaFold)
Resolution: N/A(没有分辨率,AlphaFold是预测模型)
Chain: 1-132(包含第1到132号氨基酸残基)
Links: 提供了相关的AlphaFold链接。
选择的依据:
X射线晶体学结构(PDB 2Z7F 和 PDB 4DOQ):
PDB 2Z7F的分辨率为1.70 Å,相较于PDB 4DOQ的2.00 Å分辨率,精度更高,因此对于分子对接分析更为理想。
PDB 2Z7F包含了链I的部分(83-132号氨基酸残基),而PDB 4DOQ包含了链B和链D的部分(85-131号氨基酸残基)。如果您的研究关注的是特定的链或残基,选择合适的结构更为关键。
AlphaFold预测模型:
AlphaFold提供的是通过深度学习方法预测的SLPI结构,虽然这可以作为参考,但它的预测精度和可靠性相较于实验数据(如X射线晶体学)可能较低,尤其在进行分子对接时,预测结构的准确性和稳定性可能会受到影响。
由于AlphaFold没有明确的分辨率和其他结构验证信息,通常情况下,使用实验数据(如X-ray结构)更为稳妥。
推荐选择:
首选:PDB 2Z7F(1.70 Å,分辨率更高,提供了更精确的结构)。对于精确的分子对接,1.70 Å的分辨率可以提供更可靠的原子定位。
其次:PDB 4DOQ(2.00 Å,分辨率较低,但仍为实验数据)可以作为备选,但分辨率较高的PDB 2Z7F更为理想。
AlphaFold模型可以作为补充参考,但不推荐作为首选,特别是在需要高精度结构的情况下。
总结:
优先选择 PDB 2Z7F(1.70 Å分辨率)的X-ray结构,用于分子对接分析。
如果需要考虑其他链或结构,PDB 4DOQ也可以作为备选,但总体而言,2Z7F提供的结构更为精确。
链I:在PDB结构文件2Z7F中,包含的是SLPI蛋白的链I,且覆盖了第83到132位氨基酸。
链B和链D:在PDB结构文件4DOQ中,SLPI蛋白有两个链,分别标记为链B和链D。每个链也包含了SLPI的部分序列,从第85到131位氨基酸。
选择不同链的原因:
如果同一蛋白的多个链没有显著差异,可以选择任一链进行分析。
如果不同链存在相互作用,或构象差异明显,则根据研究需要选择不同链进行更深入的分析。使用HDOCK(http://hdock.phys.hust.edu.cn/)进行分子对接,作业提交后等待,页面会10秒刷新一次,可以收藏页面,作业完成后直接进入相同页面查看结果即可(我这次对接5个小时后给我返回的结果)

作业完成页面,点击TOP 10 prediction即可下载前十的对接结构。

Docking Score:
这是对接得分,用来衡量VTN(来自PDB 7RJ9)和SLPI(来自PDB 2Z7F)之间的结合强度。得分越低(负值越大)表明结合能越低,理论上蛋白质间的亲和力越强。在这里,Rank 1模型的得分最低(-276.00),这意味着它可能是最稳定的对接构象。
Confidence Score:
这是HDOCK给出的置信得分,用于表示对该模型的可信度。值接近1的得分表示模型的预测更可靠。所有的置信得分都接近1,表示这些对接模型的可信度普遍较高,但Rank 1模型(0.9255)和Rank 2模型(0.9221)的置信得分略高,可能是更优的选择。
Ligand RMSD (Root Mean Square Deviation):
这是配体(SLPI)在不同对接模型中的均方根偏差,用于衡量配体位置的偏移程度。数值越大,表示与参考构象的差异越大。
Rank 6的RMSD(62.46 Å)最低,表明它的配体位置更接近参考结构。低RMSD值通常代表模型构象的稳定性更好,尽管RMSD的绝对数值在分子对接中的意义可能还需结合具体对接得分来解释。
Interface Residues:
列出的“model_x”代表每个模型在对接界面上的残基。每个模型可能涉及不同的界面残基分布。可以进一步查看对接界面的具体残基,以判断它们是否包含关键结合位点或活性残基,从而更好地理解蛋白相互作用机制。
选择建议:
Rank 1模型的Docking Score最低,表明它的结合强度最高,同时Confidence Score也较高,表明它是最可信的模型,尽管其RMSD偏高。
Rank 6模型具有相对低的RMSD值(62.46 Å),也有较好的Docking Score(-252.87),但结合强度不如Rank 1模型。问1:可以从Docking Score推算出具体的结合能吗?
分子对接中,Docking Score通常不能直接转换为具体的物理结合能(如ΔG)。Docking Score是一个相对得分,是对蛋白质-配体相互作用的总和估算,通常考虑了静电、疏水性、氢键等多种能量贡献,但它的单位和物理结合能(结合自由能)不同,也不总是与实验得到的结合能值(如kcal/mol)线性相关。
然而,一些对接软件在得分设计上力图让Docking Score与真实结合能具有相关性,但并未提供直接换算公式,原因如下:
Docking Score计算近似性:
Docking Score是基于对接软件的打分函数,打分函数中通常省略了溶剂效应、分子构象变化等因素。因此,这一得分只是对结合趋势的近似估计,而非真实结合能。
打分函数和实验结合能的差异:
大多数打分函数仅用于比较不同构象或不同化合物的亲和力,而并非直接衡量真实的结合自由能。
分子动力学模拟的补充:
如果需要更精确的结合能,可以考虑通过分子动力学模拟结合能计算(如MM-GBSA或MM-PBSA方法)来获得更贴近真实的结合自由能。问2:把model的pdb文件导入pymol中,可以在pymol中显示结合能吗?
在PyMOL中,无法直接显示结合能。PyMOL是一款主要用于三维结构可视化的软件,虽然它有基本的测量和分析功能(如距离、角度、表面面积等),但不支持结合能的计算。问3:Docking Score一般是多少就可以认为两个蛋白亲和力强
在分子对接分析中,Docking Score的数值并没有固定的标准来判断“强”或“弱”亲和力,因为不同的打分函数、软件和实验条件下的Docking Score的绝对值可能会有所不同。不过,一些通用的参考范围和原则可以帮助初步判断对接模型的亲和力强弱。
一般参考值:
强亲和力:通常来说,**Docking Score在-200以下(负值越大)**可以被认为是较强的亲和力,尤其在蛋白-蛋白相互作用中,这是一个较低的得分。
中等亲和力:大约在**-150到-200**之间的Docking Score,可以表示中等的亲和力。
弱亲和力:如果得分在**-150以上**,通常表示亲和力较弱。
影响Docking Score的因素:
蛋白质大小和结合界面的暴露:较大的蛋白质表面积或更多的结合界面会产生更低的Docking Score。
得分函数的不同:不同软件的得分函数对静电相互作用、疏水性和氢键权重的处理不同,导致相同的复合物在不同软件中的得分差异较大。将model1的pdb文件导入PYMOL中进行可视化操作
参考教程:
可视化结果如下图

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。