大家好,今天来为大家分享深入解析:PDBx/mmCIF 文件格式基础教程的一些知识点,和的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!
#
_cell.entry_id 4HHB
_cell.length_a 63.150
_cell.length_b 83.590
_cell.length_c 53.800
_cell.angle_alpha 90.00
_cell.angle_beta 99.34
_cell.angle_gamma 90.00
_cell.Z_PDB 4mmCIF 数据项名称由前面的下划线字符标识。下划线后面是一个文本字符串,在mmCIF 中将其解释为包含类别名称和关键字名称,并以句点分隔。名称的关键字部分是该类别中数据项的唯一标识符。在上面的例子中,所有数据项都属于CELL类别。上面的例子也说明了项目名称和项目值之间需要一一对应。数据类别和数据项的名称不区分大小写。
下一个示例说明了如何在mmCIF 中表示文本字符串。短文字字符串可以用单引号或双引号引起来。跨越多行的文本字符串用分号括起来,放置在该行的第一个字符位置。有两个特殊字符用作mmCIF 项值的占位符,由于某种原因无法显式分配。问号(?) 用于将项目值标记为缺失。句点(.) 可用于标识该项目没有合适的值,或者有意省略某个值。
_entity_src_gen.entity_id 1
_entity_src_gen.pdbx_gene_src_gene "MT3707,MTCY07H7B.20,panC,Rv3602c"
_entity_src_gen.pdbx_gene_src_scientific_name "结核分枝杆菌"
_entity_src_gen.pdbx_gene_src_ncbi_taxonomy_id 1773
_entity_src_gen.pdbx_host_org_scientific_name "大肠杆菌"
_entity_src_gen.pdbx_host_org_ncbi_taxonomy_id 562
_entity_src_gen.pdbx_host_org_vector_type 质粒
_entity_src_gen.pdbx_host_org_tissue?
_entity_src_gen.pdbx_host_org_vector?
_entity_src_gen.plasmid_name pET30a
_struct_ref.id 1
_struct_ref.db_name UNP
_struct_ref.db_code PANC_MYCTU
_struct_ref.pdbx_db_accession P0A5R0
_struct_ref.entity_id 1
_struct_ref.biol_id 。
_struct_ref.pdbx_seq_one_letter_code
;MTIPAFHPGELNVYSAPGDVADVSRALRLTGRRVMLVPTMGALHEGHLALVRAAKRVPGS
VVVVSIFVNPMQFGAGEDLDAYPRTPDDDLAQLRAEGVEIAFTPTTAAMYPDGLRTTVQP
GPLAAELEGGPRPTHFAGVLTVVLKLLQIVRPDRVFFGEKDYQQLVLIRQLVADFNLDVA
VVGVPTVREADGLAMSSRNRYLDPAQRAAAVALSAALTAAAHAATAGAQAALDAARAVLD
AAPGVAVDYLELRDIGLGPMPLNGSGRLLVAARLGTTRLLDNIAIEIGTFAGTDRPDGYR
;可以使用loop_指令在mmCIF中对矢量和表格数据进行编码。要创建表,与表列对应的数据项的名称必须前面加上loop_指令,后面加上相应的数据行。以下示例创建一个作者姓名表。
#
环形_
_引用_作者.引用_id
_引用_作者.name
_引用_作者.序数
主要“费米,G” 1
主要“佩鲁茨,M.F.” 2
主要“Shaanan,B” 3
主要“Fourme,R” 4
1 “佩鲁茨,M.F.” 5
1 “哈斯奈,S.S.” 6
1 “P.J. 杜克” 7
1 “塞斯勒,J.L.” 8
1 “哈恩,J.E.” 9
2 “费米,G.” 10
2 “佩鲁茨,M.F.” 11
3“佩鲁茨,M.F.” 12
4 "特内克,L.F." 13
4 “阿诺内,A.” 14
5 “费米,G.” 15
6、“缪尔黑德,H.” 16
6 “格里尔,J.” 17 号
#在mmCIF中使用loop_指令有几个限制。首先,循环内的所有数据项都必须属于同一mmCIF 类别。其次,循环后的数据值的数量必须是数据项名称数量的精确倍数。最后,mmCIF 禁止嵌套loop_指令。
mmCIF 使用数据块来组织相关信息和数据。数据块是数据文件或字典的逻辑分区,使用data_ 指令创建。数据块可以通过在data_ 指令后附加文本字符串来命名,并且数据块可以由另一个data_ 指令或文件末尾终止。下面的示例显示了一对缩写数据块的非常简单的示例。
#
# --- 以# 开头的行被视为注释
#
数据_X987A
_entry.id X987A
_exptl_crystal.id "水晶A"
_exptl_crystal.colour "淡黄色"
_exptl_crystal.密度_diffrn 1.113
_exptl_crystal.密度_马修斯1.01
_cell.entry_id X987A
_cell.length_a 95.39
_cell.length_a_esd 0.05
_cell.length_b 48.80
_cell.length_b_esd 0.12
_cell.length_c 56.27
_cell.length_c_esd 0.06
# 第二个数据块
数据_T100A
_entry.id T100A
_exptl_crystal.id "水晶B"
_exptl_crystal.color "橙色"
_exptl_crystal.密度_diffrn 1.156
_exptl_crystal.密度_马修斯1.06
_cell.entry_id T100A
_cell.length_a 68.39
_cell.length_a_esd 0.05
_cell.length_b 88.70
_cell.length_b_esd 0.12
_cell.length_c 76.27
_cell.length_c_esd 0.06 上面的例子说明了如何使用数据块来分离与不同结构相关的相似信息。这种分离是必要的,因为mmCIF 的语法禁止在同一数据块内的多个位置重复同一类别。因此,简单地将上述两个数据块的内容连接成一个数据块在语法上是不正确的。
合并上述示例中的数据块会引发一些与mmCIF 数据模型和这些特定类的结构相关的其他问题。在上面的示例中,通过使用loop_指令重新组织EXPTL_CRYSTAL类别,可以将该类别的信息组合到单个数据块中。然而,某些mmCIF 类别(例如CELL 和ENTRY)可能在数据块中仅包含一个值,因此无法循环。这些类别中数据项的单值属性是这两个类别中关键项定义的结果。 CELL 类别的关键项_cell.entry_id 被定义为_entry.id 的子定义。此项被定义为数据块标识符,因此只能采用一个值。
mmCIF 字典中的定义封装在命名的保存框中。保存帧以save_ 指令开始,并以另一个save_ 指令结束。保存框通过将文本字符串附加到save_ 标记来命名。在mmCIF 词典中,保存框用于封装项目和类别定义。 mmCIF 字典由一个包含数千个保存框的数据块组成,每个保存框包含不同的定义。保存框只能出现在mmCIF 字典中,不能嵌套。以下示例显示了包含数据项_exptl.details 定义的保存框。
保存__exptl.details
_item_description.描述
;有关实验工作之前的任何特殊信息
强度测量。另请参见_exptl_crystal.preparation。
;
_item.name "_exptl.details"
_item.category_id exptl
_item.mandatory_code 否
_item_aliases.alias_name "_exptl_special_details"
_item_aliases.dictionary cif_core.dic
_item_aliases.版本2.0.1
文章到此结束,如果本次分享的深入解析:PDBx/mmCIF 文件格式基础教程和的问题解决了您的问题,那么我们由衷的感到高兴!
【深入解析:PDBx/mmCIF 文件格式基础教程】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
这篇文章很有用,我一直想了解一下PDBx/mmCIF是什么,终于有了机会了!
有19位网友表示赞同!
我最近在做晶体结构分析,感觉这个文件格式看起来很专业,期待详细介绍。
有17位网友表示赞同!
以前只知道PDB格式,现在才知道还有mmCIF这种格式呢?真挺新奇的。
有13位网友表示赞同!
文件格式这块我一直没太懂,希望这篇文章能给我一些启发!
有19位网友表示赞同!
学起来有点难度,不过了解数据储存模式很重要啊,为了更好地分析相关成果。
有13位网友表示赞同!
学习分子模型总是离不开这些基础知识吧,看来mmCIF很有用处。
有15位网友表示赞同!
对于科研工作者来说掌握不同文件格式还是蛮重要的。
有14位网友表示赞同!
这个文件格式在生物信息学和药物设计中应该很普遍吧?
有8位网友表示赞同!
文章内容是否会包含一些实用技巧,比如如何使用PDBx/mmCIF文件呢?
有12位网友表示赞同!
我很好奇mmCIF跟PDB相比有什么区别,这篇文章能解答吗?
有6位网友表示赞同!
学习新知识真是太兴奋了!这次希望能深入了解这个文件格式。
有12位网友表示赞同!
感觉掌握这种格式可以提升我的科研能力!
有15位网友表示赞同!
准备学习新领域的知识,希望这篇介绍能让我理解mmCIF。
有5位网友表示赞同!
对于从事生物科学研究的同学来说,要多了解一些数据储存方式,这样才能提高效率。
有15位网友表示赞同!
期待作者能用通俗易懂的方式解释这种文件格式!
有8位网友表示赞同!
这篇文章看起来很有深度,相信能让我们对PDBx/mmCIF 有更清晰的认识。
有12位网友表示赞同!
学到新东西的感觉真好!我很期待继续学习更多相关知识。
有16位网友表示赞同!
如果以后遇到需要处理这种格式的数据,就能更有信心了!
有20位网友表示赞同!
这篇文章能帮助我更好地理解分子建模和结构分析的过程。
有6位网友表示赞同!