转载,请注明:拧开,临床医生研究和成长平台
至于基因,它早期的名字可以说是杂乱无章的,要看研究者个人的喜好和想象,比如吸血鬼基因(德古拉,怕光),蓝精灵基因(Smurf,调节SMAD),冰盒基因(冰盒,突变后对异性没有好感),都铎基因(都铎,没有来世)
显然,这种凌乱的命名方式总是让研究人员在面对基因时感到困惑和不知所措,尤其不利于研究人员解读基因突变。所以,为了更好的将基因突变的结果转化为实际的临床应用,统一的、通用的突变命名规则就显得尤为重要。
幸运的是,人类基因组变异协会(HGVS)给基因突变起了一个统一规范的名字,以确保定义清晰,实现基因组信息的有效共享和下游利用。所以,只要你很好的了解基因的各种符号,你就不怕不知道自己是谁的情况。
首先,HGVS将基因突变的基本类型分为七类(见下表)。这样更新基因突变的定义后,可以避免概念或定义混乱。
替换(>: ):一个核苷酸被另一个核苷酸替换,用“>”表示;
例如g . 1318g >:T;
Del:去掉一个或多个核苷酸,用“del”来描述;
例如g.3661 _ 3706del;
倒位(inv):与原序列反向互补的新核苷酸序列(1个以上核苷酸)取代原序列;
比如从CTCGA到TCGAG,用“inv”来表示;
Dup:一个或多个核苷酸拷贝直接插入原始序列的下游,用“dup”表示;
插入(ins):在序列中插入一个或多个核苷酸,插入的序列不是上游序列的拷贝;
delis/indel:一个或多个核苷酸被其他核苷酸取代,但未被取代、倒置或转置;
转化(con):一种特殊类型的缺失-插入,其中取代原始序列的核苷酸序列是基因组中另一个位点序列的拷贝。
此外,在描述基因突变时,应定义参考序列和原始序列的核苷酸范围。因为从不同的维度来看,同一个基因突变可以有很多不同的表现。例如,不同的参考序列和不同的表达水平(DNA、RNA或蛋白质水平)会导致突变表达的差异。
目前,通用参考序列主要包括基因组参考序列(用前缀“g”表示)、cDNA参考序列(用前缀“c”表示)、非编码DNA参考序列(用前缀“n”表示)、RNA参考序列(用前缀“r”表示)和蛋白质参考序列(用前缀“p”表示)
参考序列的选择非常重要。在DNA水平描述突变时,通常选择cDNA作为参考序列,因为用cDNA作为参考序列可以更好地描述内含子中突变碱基与相邻外显子之间的关系。此外,基因突变往往被描述为蛋白质水平的变化。
然后,结合临床上常用的描述基因突变的参考序列,从cDNA水平说明不同突变的类型。
通常,在cDNA中,编码序列区中翻译起始密码子ATG的a数为c.1,然后按顺序排列,直到翻译终止密码子的最后一个核苷酸;而非编码区域被编号为c-1、c-2......;来自ATG的上游。终止密码子的下游编号为c.*1,c.*2.....直到参考序列结束。
相反,内含子是根据相邻外显子的核苷酸编码的。如上图所示,编码区187-188为内含子,其5’端编号为c.187+1、c.187+2,3’端编号为c.188-1、c.188-2。如果内含子包含奇数个核苷酸,“n”用于表示中心核苷酸并连接上游序列,如c.187+n。
其基因突变的表达模式为:1)c123a >;T:T:123位的A替换为T;2)C . 2052 DELA:2052位发生缺失;C. 5756 _ 5757 ins agg:在5756和5757位点之间插入三个碱基agg;4)c . 6775 delisga:在6775位删除一个碱基,删除的碱基用GA代替;5)c.6_8dupT:从第6位到第8位重复T。
当基因发生多重突变时,突变可以用“]”和“;”标记链接。C .[56a >:C;78G & gtC]表示同一条染色体上76位和83位有两个变异(cis)。C .[56a >:C];[78G & gt;C]表示两个突变发生在不同的染色体上(反式);C .[56a >:C](;)[78G >等;C]表示同一染色体或不同染色体上可能出现两种变异。
至于重复序列的变异,当要定义重复序列的核苷酸范围,即重复单位的数量时,可以用[]表示。比如g.23_24[4]:基因组序列23-24之间的核苷酸重复出现4次。对于短而简单的重复,可以显示重复序列,例如g.23TG[4]: TG核苷酸从基因组序列第23位开始重复4次。当重复序列长度不确定时,用括号指定,如g-128 ggc[(600-800)]:GGC重复插入基因组编码区上游第128个核苷酸,重复次数在600-800之间。
此外,由于研究人员主要处理细菌基因,这些基本常识必须是已知的。通常,其基因组中的每个基因都会以3个小写字母命名,而这些名称往往是主要信号通路或突变/插入相关表型的缩写。详见下表:
表1 .常见基因缩写
如果细菌中不同的基因影响相同的信号通路或表型,就会在缩写后用大写字母表示。例如,影响嘧啶生物合成的基因统称为pyr,其中pyrC基因编码氨甲酰天冬氨酸脱水酶,pyrD基因编码二氢乳清酸脱氢酶。
另外,细菌基因组中最让人困惑的一个方面就是符号。为了帮助人们理解各种符号所代表的含义,本文整理了以下两个表格。其中,表2包含了细菌基因组中最常用的基因符号,表3包含了细菌基因位点携带的耐药的名称及相关术语。
表2 .基因中常见的符号
表3 .抗生素耐药性的常用名称及相关术语
参考文献:
1 . https://bitesizebio . com/36247/genetic-notation-crack-the-code/
2.人类基因命名指南(Doi:https://Doi . org/10.1006/geno . 2002.6748)
1.《nomenclature 扫盲贴:基因上的这些符号究竟是什么鬼?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《nomenclature 扫盲贴:基因上的这些符号究竟是什么鬼?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/caijing/1171449.html