PyMOL 完全可以打开并处理 PDB(Protein Data Bank)文件,这是 PyMOL 最主要的功能之一。PDB 格式是结构生物学领域的标准文件格式,专门用于存储生物大分子(如蛋白质、核酸)的三维结构数据。
在 PyMOL 中打开 PDB 文件的 3 种方法
1. 图形界面操作(推荐初学者)
- File → Open…
- 选择本地
.pdb
文件 - 文件将作为新对象加载到 PyMOL 中
2. 命令行操作(高效直接)
load /路径/文件名.pdb
# 示例:
#load C:/Users/Desktop/1abc.pdb
load r"D:\Python311\Lib\site-packages\pymol\pymol_path\test\dat\1tii.pdb"
3. 直接从 PDB 数据库在线加载
fetch PDB_ID
# 示例(加载胰岛素结构):
fetch 1trz
PDB 文件在 PyMOL 中的典型显示效果
PyMOL 会自动解析 PDB 文件中的关键信息并可视化:
PDB 内容 | PyMOL 显示方式 | 示例命令 |
---|---|---|
蛋白质主链 | 默认显示为橙色卡通图 | show cartoon |
核酸链 | 显示为青色/黄色线条 | show sticks |
配体/小分子 | 显示为棍棒模型 | show sticks, organic |
水分子 | 显示为红色小球 | show spheres, resn HOH |
金属离子 | 显示为彩色球体 | show spheres, metals |
二级结构 | α螺旋/β折叠自动识别着色 | util.cbc |
处理 PDB 文件的实用技巧
1. 解决加载时的常见问题
# 问题:原子连接缺失
fix_chemistry # 自动修复键连接
# 问题:结构杂乱
remove solvent # 删除水分子
remove resn HOH # 同上
remove inorganic # 删除离子
2. 多模型处理(如 NMR 结构)
load multi_model.pdb
split_states object_name # 将多模型拆分为独立对象
3. 保存修改后的结构
# 保存为PDB格式
save modified.pdb
# 保存为PyMOL会话文件(保留所有设置)
save session.pse
示例工作流:PDB 文件分析
# 1. 加载PDB文件
fetch 1hho # 血红蛋白
# 2. 简化显示
hide lines
show cartoon
color marine
# 3. 突出显示血红素
select heme, resn HEM # 选择血红素基团
show sticks, heme
util.cnc heme # 按原子元素着色
# 4. 显示氧结合位点
select oxygen_binding, resi 58+87
show spheres, oxygen_binding
color red, oxygen_binding
# 5. 测量距离
distance O2_dist, heme/1/O2, resi 58/NE2
为什么 PDB 文件在 PyMOL 中可能显示异常?
- 文件损坏:重新下载或从官方源获取
- 非标准PDB格式:
load_traj file.pdb # 尝试加载为轨迹
- 缺失氢原子:使用 PyMOL 添加
h_add # 添加所有缺失氢原子
- 大文件加载慢:
set defer_builds_mode, 3 # 延迟构建模式
💡 官方 PDB 数据库:https://www.rcsb.org/
包含超过 20 万个生物大分子结构,均可直接用fetch PDBID
在 PyMOL 中加载
总结:PyMOL 是处理 PDB 文件的专业工具,不仅能完美打开和可视化结构,还提供丰富的分析、编辑和渲染功能,是结构生物学研究的必备软件。