本文最早发表在“百威研究奶酪”微信微信官方账号。请注明:百威研究奶酪,Focus研究人员的需求。
SNP(单核苷酸多态性)是基因组中单核苷酸变异形成的遗传标记,一般指变异频率大于1%的单核苷酸变异。
英文描述方法是“如果超过1%的群体在DNA序列的特定位置没有携带相同的核酸,那么这种变异可以被归类为SNP。”,一个值得注意的词是“群体”,它与英文文章中表达的“阵列”相同,这意味着在基因组DNA中特定位点的碱基与参考基因组相比发生变化的一大群个体中,超过1%的个体被认为是SNP。人类基因组每1000个碱基约有一个SNP,人类基因组SNP总数约为3× 10 6。因此,SNP已成为第三代遗传标记,人体内许多表型差异和对药物或疾病的易感性可能与SNP有关。
SNP发生的类型SNP的发生包括转化、颠换、插入和缺失。理论上每个基因座可以有四种变异形式,但实际上只有转化和颠换两种。据说转换和颠换的频率是2:1。如果你注意,你会发现在发生的转化中,A总是突变成G,C突变成T,而且即使是转化,c >: T的概率也大于a >: G,这就是为什么研究的SNP往往是C >:T或者a >: G .补充:at结合中的结合键与CG结合中的不同:CG是三键,at是双键, 所以CG的结合力比AT强,也就是说需要更高的温度才能使CG熔化,与这个温度对应的关键参数是Tm值,也就是熔化时间一半时的温度。
变化
【一种能量形式变为另一种】,即嘌呤变为嘌呤或嘧啶变为嘧啶,主要发生在CG序列中。由于CG (CpG岛,DNA甲基化研究中经常谈到的)中的C碱基经常被甲基化(mC),所以可以自发脱氨形成胸腺嘧啶(T),即频繁的转化是C到T。
其实不同的组织有不同的名称,坚持自己的命名方式。事实上,snp位点的命名并不统一,人们通常在文献中使用习惯或惯用的名称。它体现在以下几个方面:
1、RS命名法RS命名法,又称GenBank对refSNP ID单核苷酸多态性的官方命名法,是一个比较完整的命名体系,其命名方式为rs+6/7阿拉伯数字,包括前后序列、位置信息、分布频率等。如果一个SNP的refSNP ID已知,可以在GenBank的SNP数据库中搜索相关信息及其在基因组中的位置。
网站:http://www.ncbi.nlm.nih.gov/snp/
比如我搜索RS776746,你会发现CYP3A5、ZSCAN25、rs776746是一回事。
2、突变信息之间加上位置信息:主要有三种方式:
+突变信息之间的cDNA位置,如C188T;
在突变信息之间加上DNA的位置,如A2546G;
在突变氨基酸信息之间添加氨基酸位置,如Glu145Lys。
3、按发现顺序或频率顺序拟定的惯用名称:用*表示,如CYP2D6*10,CYP2C9*3等。
在前面加一个m表示突变,如cyp2c19m2,
其他的也可以在文献中看到,比如C1 >: C2突变等等。其实这是一种非常非正式的用HGVS名称标注SNP位置的方法。显然,读者在GenBank中找不到相应的信息,因为缺少引用核酸序列的接受号。
4、HGVS命名法:人类基因组变异学会是一个民间非政府学术组织,其官方网站位于http://www.hgvs.org/.
HGVS命名SNP的规则是标记参考序列和SNP在核酸序列中的位置,例如:ng _ 000004.3:g . 247167g >;A,其中红色部分为核酸序列接受号,绿色部分为核酸序列中单核苷酸多态性位点的位置,g >: A表示原碱基为g,突变碱基为A,这种命名方法有利于找出基因序列中的位置。
好了,今天就和大家分享一下,下一期我们会继续分享这两个数据库的使用。
1.《snp 手把手学习TCGA数据库:SNP突变分析第一期》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《snp 手把手学习TCGA数据库:SNP突变分析第一期》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/tiyu/1168164.html