您的当前位置：首页正文

NCBI中各符号代表的意思

来源：东饰资讯网

GenBank 中字符的意思

Nucleotide 数据库分为三个子数据库： ·EST :表达序列标记数据库 ·GSS :基因组测序序列数据库

·CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列

● MeSH: 查询缩写基因的全称

3、RefSeq（Reference Sequence）序列接受号: （1）mRNA 记录（NM_*）: e.g.:NM_000492

（2）基因组的DNA重叠群（NT_*）: e.g.:NT_000347

（3）完整的基因组或染色体（NC_*）: e.g.:NC_000907

（4）基因组的局部区域（NG_*）: e.g.:NG_000019

（5）从人类基因组注释、加工得到的序列模型（XM，XP，or XR_*）： e.g.:XM_000483

●

GenBank记录中特性表中的主要关键词:

解释

关键词 promoter CAAT_signal

解释转录起始区

真核启动子上游的CAAT盒,与RNA结合相关

真核启动子的TATA盒

关键词 misc_feature

生物学特性无法用特性表关键词描述的序列

misc_difference 序列特性无法用特性表

关键词描述的序列 conflict

同一序列在不同的研究中在位点或区域上有差异

序列不能确定的区域该序列对以前的版本做过修订

包含稳定突变的序列修饰过的核苷酸已识别为基因或已命名的序列区域

无法用信号特性关键词描述的信号序列

TATA_signal

unsure old_sequence variation modified_base gene misc_signal

-35_signal -10_signal GC_signal RBS

原核启动子中的-35框原核启动子的Pribow盒

真核启动子的GC盒核糖体结合位点

polyA_signal RNA转录本的剪切识别

位点

enhancer 增强子

关键词 attenuator terminator rep_origin misc_RNA

解释

与转录终止有关的序列转录终止序列双链DNA复制起始区

关键词 CDS

sig_peptide mat_peptide intron polyA_site rRNA tRNA scRNA snRNA snoRNA

解释蛋白质编码序列编码信号肽的序列编码成熟肽的序列内含子

RNA转录本的多聚腺苷酸化位点核糖体RNA 转运RNA 小细胞质RNA 小核RNA

加工和修饰rRNA的小核RNA

transit_peptide 转运蛋白编码序列

无法用RNA关键词描述的转录物或RNA产物

prim_transcript 初始转录本 precursor_RNA mRNA 5’clip 3’ clip 5’UTR 3’UTR exon 关键词

解释

前体RNA 信使RNA

前体转录本中被剪切掉的5’端序列

前体转录本中被剪切掉的3’端序列 5’非翻译区 3’非翻译区外显子

关键词 repeat_unit LTR Satellite

解释单个的重复元件长末端重复序列卫星重复序列

immunoglobulin_related C_region D_segment

免疫相关蛋白上的不变区

免疫球蛋白重链的可变区，

T细胞受体β链免疫球蛋白重链、轻链以及T细胞α、β、γ的结合链

插入重排免疫球蛋白片段间的核苷酸

免疫球蛋白重链的开关区

编码免疫球蛋白的可变区N末端的序列

编码免疫球蛋白的可变区的序列

基因组中所包含的重复序列

无法用结构关键词描述的核酸序列高级结构或

J_ segment

misc_binding 无法描述的核酸序

列结合位点 primer_bind

复制、转录的引物结合位点

protein_bind 蛋白质结合区 STS

misc_recomb

测序标签位点无法用重组特性关键词描述的重组事件

通过重组所消除的DNA

发夹结构

N_ region S_ region V_ region V_ segment

repeat_region misc_structure

iDNA stem_loop

构型

D_loop

线粒体中DNA中的取代环

◆ GenBank记录中特性表中的限定词: 限定词 /allele=

含义

给定基因的等位基因

限定词 /codon_start=

含义

相对于序列第一个碱基，编码序列密码子的偏移量

DNA样本的来源国其他数据库信息的交叉索引号 DNA复制方向

/bound_moiety= 嵌合范围 /cell_type= /citation= /clone_lib=

获得序列的细胞类型

已被引用的参考文献数

获得序列的克隆文库

/country= /db_xref= /direction=

/environmental_sample= 序列直接从环境材料

中获得而没有指明来源物种

限定词

含义

限定词 /exception=

含义

指明DNA序列未按通常的生物学规律翻译，如RNA编辑

/frequency= 在种群中发生变异的频

率

/germline 如果序列是DNA并来源

于免疫球蛋白家族，则表示该序列来源于未重排DNA

/insertion_seq= 序列来源于某种插入元

件 /isolate= /lab_host= /macronuclear /note= /organelle= /sub_strain= /tissue_type=

序列来源的生物个体为扩增序列来源物种所用的实验室宿主

指明DNA来源于染色体分化的大核期评论及附加信息获得序列的细胞器获得序列的来源微生物亚种

获得序列组织类型

/PCR_conditi-ons= 描述PCR的反应条件

/pop_variant= /product= 获得序列的群体变异种名称

序列编码产物的名称

/anticodon=

/cell_line= /chromosome= /clone= /codon= /EC_number= /transl_table= /usedin=

tRNA反义密码子的位置及它所编码的氨基酸

获得序列的细胞系获得序列的染色体获得序列的克隆子指出与参考密码子不同的密码子

序列产物的酶学编号描述在翻译中与通用密码表不同的密码表表明该特性在其他检

索中也被使用

/translation=

按通用或指定的密码子表翻译的氨基酸序列

/virion

病毒颗粒

限定词 /cons_splice=

含义

区分内含子剪切位点和“5‘-GT.AG-3'”剪切位点

所获序列植物的栽培变种

序列来源于某种生物的特定发育阶段

序列特性来源于实验还是推理

指出在记录中的来源特性在其他物种中还有不同的来源特性序列所代表的功能

限定词 /map=

含义