一文读懂PDB格式

最近在做分子对接和分子模拟,涉及到了一些盲区,必去pdb文件是按照列位数储存信息的,跟其他文件的空格或者制表符分割很不同,所以也可能出现一些错误,比如信息错位,因此有必要了深入解下结构相关的格式pdb、cif、sdf等等

pdb的分子对接前处理包括去除非氨基酸残基、去水、加氢、末端修复等等,在上次的分子对接文章中用了get_pdb.py脚本利用pdbfixer api和文本过滤,来处理蛋白结构。
三行代码搞定AutoDock Vina批量分子对接
坐标部分通过6种记录类型描述分子结构,彼此分工明确又相互关联。

image.png

1. MODEL 和 ENDMDL:多模型的起始标签和终止标签

作用:当文件包含多个相同结构的模型(如NMR测定的构象集合)时,用MODEL标记每个模型的开始。

  1. MODEL与ENDMDL必须成对,包裹一个模型的所有ATOM/TER记录;
  2. TER需紧跟链的最后一个ATOM,且关联信息(残基名、链ID、残基号)完全一致;
  3. ATOM的坐标和参数是描述原子位置与运动性的核心数据。
  4. 模型编号需连续(如MODEL 1对应ENDMDL,下一个模型为MODEL 2),且所有模型的化学组成、序列需完全一致。
记录类型1-6列(记录名)核心编号列(7-11)关键关联信息(残基/链/模型)坐标/参数列作用说明示例内容片段
MODELMODEL模型编号(如1、2)--标记模型起始,编号连续递增MODEL        1(第1个模型开始)
ATOMATOM原子序号(如32、107)残基名(如ARG、GLU)、链ID(如A)、残基号(如-3、18)X/Y/Z坐标(31-54列)、占据率(55-60)、温度因子(61-66)记录标准残基的原子坐标及参数ATOM    589 2HG  GLU A  18    -12.634  -3.023  -3.475  1.00  0.00           H
TERTER序号(原子号+1,如590)与前一ATOM一致的残基名(如GLU)、链ID(如A)、残基号(如18)-标记一条链的结束TER     590      GLU A  18
ENDMDLENDMDL---标记对应MODEL的结束,成对出现ENDMDL(对应MODEL 1的结束)

2. ATOM:标准残基

作用:记录氨基酸、核苷酸等标准残基的原子坐标及相关参数。

实例(标注关键列含义):

注意:原子号可能太大导致超过11位,所以会导致后边的信息错位

列范围1-67-1113-161718-202223-2631-3839-4647-5455-6061-6677-78
示例内容ATOM32NAARGA-311.28186.69994.3830.5035.88N
对应含义记录名原子号原子名构象残基名链ID残基号X坐标Y坐标Z坐标占据率温度因子元素
核心细节
  • 原子名:单字母(如N)从14列开始,双字母(如FE)从13列开始
  • 交替构象:同一原子的不同位置用17列标记(如A、B),同一构象的原子标记相同
  • 排序规则:蛋白质按氨基→羧基端,核酸按5’→3’端排列

3. ANISOU:原子运动的“精细描述”

作用:记录各向异性温度因子,比普通温度因子更细致地反映原子运动。

  • ANISOU记录中,29-70列替换了ATOM记录中31-66列的坐标、占据率和温度因子,用于存储6个经10⁴倍缩放的各向异性温度因子参数,其余列(1-27、77-80)与对应的ATOM记录保持一致。
  • 仅当提供数据时出现,否则温度因子默认0.0
  • 与对应的ATOM共享原子序号、残基信息等
列范围1-67-1113-161718-202223-2631-3839-4647-5455-6061-6629-3536-4243-4950-5657-6364-7077-78
ATOM示例内容ATOM107NGLYA1312.68137.302-25.2111.00015.56------N
ANISOU示例内容ANISOU107NGLYA13-----240618921614198519-328N
对应含义记录名原子号原子名构象残基名链ID残基号X坐标Y坐标Z坐标占据率温度因子温度因子参数1温度因子参数2温度因子参数3温度因子参数4温度因子参数5温度因子参数6元素

4. TER:链的“终止符”

作用:标记一条原子链的结束,常紧跟在链的最后一个原子后。

  • TER记录的残基名(LEU)、链ID(A)、残基号(75)与上一行ATOM记录完全一致,用于标记该链的结束;
  • TER无原子相关信息(原子名、坐标等),故对应位置为“-”。
  • 蛋白质对应羧基端,核酸对应3’端
  • 序号为前一个原子的序号+1
列范围1-67-1113-161718-202223-2631-3839-4647-5455-6061-6677-78
ATOM示例内容ATOM605CBLEUA75-16.776-16.2834.8441.0055.51C
TER示例内容TER606-LEUA75------
对应含义记录名序号原子名构象残基名链ID残基号X坐标Y坐标Z坐标占据率温度因子元素

5. HETATM:非标准分子记录

作用:记录配体、金属离子等非标准化学物质的坐标。

  • 如果你从RCSB下载x-ray的结构一般会有共结晶的小分子,一般会被记录为HETATM
  • HETATM用于记录非标准残基(如示例中的镁离子MG、硫酸根SO4),格式与ATOM基本一致,核心区别是残基为非标准化学物质,需配合其他记录说明其化学信息。
列范围1-67-1113-161718-202223-2631-3839-4647-5455-6061-6677-78
HETATM示例1内容HETATM8237MGMGA100113.872-2.555-29.0451.0027.36MG
HETATM示例2内容HETATM8238SSO4A200110.885-15.746-14.4041.0047.84S
对应含义记录名原子号原子名构象残基名(非标准)链ID残基号X坐标Y坐标Z坐标占据率温度因子元素

参考

https://www.wwpdb.org/documentation/file-format-content/format33/sect9.html#ATOM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/95515.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/95515.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

进阶:PGCE中级专家认证精要

PGCE中级认证的核心价值技术深度:掌控未来生态PostgreSQL不仅是传统关系型数据库的标杆,更是云原生、AI大模型训练、物联网平台等前沿场景的核心支撑。通过PGCE认证,你将掌握:万亿级数据性能调优:从查询优化器原理到执…

AI增强SEO关键词表现

内容概要 随着人工智能技术的不断演进,其在搜索引擎优化领域展现出显著潜力,尤其在关键词表现优化方面发挥着核心作用。本文将从基础概念入手,系统探讨AI如何智能提升关键词的搜索可见性、流量吸引力和转化效率,从而驱动整体SEO策…

PG靶机 - PayDay

一、 初步侦察与服务探测 1.1 端口扫描与服务识别 首先,对目标主机 192.168.163.39 进行一次全面的端口扫描,以识别其上运行的各项服务。 sudo nmap 192.168.163.39 -p- --min-rate5000 -A图 1: Nmap 扫描结果,显示开放 80、445 和 995 等端口…

MySQLl中OFFSET 的使用方法

MySQLl中OFFSET 的使用方法基本语法SELECT column1, column2, ... FROM table_name LIMIT number_of_rows OFFSET offset_value;number_of_rows:指定返回的记录数量。offset_value:从第几条记录开始返回(偏移量从 0 开始计数)。示…

监管科技(RegTech)应用:技术驱动的合规革命

目录 监管科技(RegTech)应用:技术驱动的合规革命 1. 监管科技革命:数字化合规新范式 2. 技术架构全景 2.1 现代RegTech架构 2.2 合规效率公式 3. 核心技术实现 3.1 智能合约自动化合规 3.2 AI驱动的风险监测引擎 4. 核心应用场景 4.1 KYC/AML全流程自动化 4.2 实时交易监控系…

解决SQL Server连接失败:Connection refused: connect

今天创建数据库,本地连接SQL Server报错:“通过端口 1433 连接到主机 127.0.0.1 的 TCP/IP 连接失败。错误:Connection refused: connect”报错图如下:查了一圈,问题出在:TCP/IP 没启用。如果问题和我一样&…

Windows bypassUAC 提权技法详解(一)

引言 用户账户控制(User Account Control, 简称 UAC)是微软自 Windows Vista 起引入的一项安全功能,旨在通过要求用户在执行需要管理员权限的操作时进行确认,从而防止未经授权的系统更改。UAC 的设计初衷是提高系统安全性&#xf…

OpenCV ------图像基础处理(一)

在 OpenCV 的图像处理世界中,除了图像边框处理,还有一些基础且重要的函数和运算,它们在图像编辑、融合等场景中发挥着关键作用。下面我们就来详细介绍cv2.copyMakeBorder()函数的具体参数与作用,以及图像加法运算和加权运算的相关…

Unity宝箱随机事件实现指南

目录 前言 一、简单的使用 新增ChestInteractableEvents,定义宝箱交互事件 新增Box 箱子挂载脚本,配置事件 运行效果 二、完善各种事件 1. 完善生成金币事件 效果,金币飞出 2. 完善生成敌人事件敌人 效果 3. 完善生成药水事件 效…

从单机到分布式:用飞算JavaAI构建可扩展的TCP多人聊天系统

1. 引言:飞算JavaAI与实时通信技术的融合 1.1 为什么需要TCP多人聊天室? 在即时通讯领域,基于TCP协议的聊天室是理解网络编程核心概念的经典案例,其技术价值体现在: 底层协议控制:直接操作Socket实现可靠数…

用 mock 把 ES 单元测试@elastic/elasticsearch-mock 上手

一、为什么“单元测 ES”这么别扭? 测试 ES 代码时,最直觉的做法是连真集群做集成测试(Docker 起个 ES),但: 启动 & 数据装填慢,不利于并行;网络/磁盘抖动影响稳定性&#xff1b…

《嵌入式Linux应用编程(三):Linux文件IO系统调用深度解析》

今日学习内容1. 文件IO与标准IO核心对比特性标准IO文件IO实现层C标准库Linux内核系统调用缓冲机制全缓冲/行缓冲无缓冲(实时读写)操作对象FILE*流指针整型文件描述符(fd)移植性跨平台兼容Linux特有典型应用场景普通文件操作硬件设…

数据结构之顺序表相关算法题

目录一、移除元素二、删除有序数组中的重复项三、合并两个有序数组总结一、移除元素 移除元素 - 力扣 思路一:就是创建一个临时数组,对原数组进行遍历,找出与val不同的数据放到新数组里,然后再将tmp中的数据导回原数组 这个思…

百胜软件×华为云联合赋能,“超级国民品牌”海澜之家新零售加速前行

报道显示,早在2012年海澜之家就开始布局数字化征程,并于近年对公司全流程信息化进行综合重构升级优化,在采销协同、业财一体等方面突破原有架构,通过信息化架构的增强为业务发展提供支撑。作为新零售重要组成部分的海澜电商信息化…

“Zen 5”: The AMD High-Performance 4nm x86-64 Microprocessor Core

Codenamed “Zen 5,” AMD’s next-generation, energy-efficient high-performance x86 core targets a wide array of client, server, and embedded markets. Fabricated in TSMC’s 4nm FinFET process, the 55mm2 core complex (CCX), shown in Fig. 2.1.1., contains 8.6…

Linux数据库:【表的约束】【表的基本查询】

目录 一.表的约束 1.1空属性 not null 1.2默认值 default ​空属性和默认值一起使用? 1.3列描述 comment 1.4 zerofill 1.5 主键 1.6 自增长 1.7 唯一键 1.8 外键 二. 表的基本查询 2.1 Create 2.1.1单行数据 全列插入 2.1.2多行数据 指定列插入 2…

AJAX RSS Reader

AJAX RSS Reader 引言 随着互联网的快速发展,信息量的爆炸式增长,用户对信息获取的便捷性和实时性提出了更高的要求。RSS(Really Simple Syndication)作为一种信息聚合技术,已经广泛应用于新闻、博客、论坛等网络平台。AJAX(Asynchronous JavaScript and XML)技术则提…

从实验室到落地:飞算JavaAI水位监测系统的工程化实践

一、飞算JavaAI平台简介飞算JavaAI是国内领先的软件开发智能平台,通过AI技术赋能软件开发全流程,帮助开发者实现"一人一项目,十人抵百人"的高效开发模式。平台核心优势包括: 智能代码生成:基于自然语言描述自…

前端Vite介绍(现代化前端构建工具,由尤雨溪开发,旨在显著提升开发体验和构建效率)ES模块(ESM)、与传统Webpack对比、Rollup打包

文章目录**1. 核心特性**- **极速启动**:- **按需编译与热模块替换(HMR)**:- **开箱即用**:- **生产环境优化**:- **插件系统**:**2. 工作原理****开发模式**- **基于 ESM 的按需加载**&#xf…

python sqlite3模块

十分想念顺店杂可。。。Python 的sqlite3模块是标准库中用于操作SQLite 数据库的工具。SQLite 是一款轻量级嵌入式数据库(无需独立服务器,数据存储在单一文件中),适合小型应用、本地数据存储或原型开发。sqlite3模块提供了完整的 …