腫瘤的發(fā)生往往伴隨著多種基因發(fā)生突變,一個典型的腫瘤細胞通常攜帶2-8種基因突變。不同類型的基因突變腫瘤患者往往對不同的藥物敏感性有所差異,因此在腫瘤治療過程中,對基因突變類型的檢測對于個體化精準醫(yī)療尤為重要。 在學習各種基因突變檢測之前,有必要對基因突變的命名規(guī)則進行系統(tǒng)的學習。目前,對于基因突變的命名規(guī)則主要依據(jù)HGVS(HumanGenome Variation Society)上的規(guī)定。遺傳信息的流動遵循中心法則,即從DNA傳遞給轉錄后的RNA,后者進一步修飾后再翻譯成蛋白質(圖一)。因此,基因突變包括DNA、RNA和蛋白質水平,此外還有線粒體DNA等。我們在描述基因突變時,要注意標明是哪個水平上發(fā)生了突變。 圖一 真核生物的基因結構示意圖 參考序列 在描述基因突變前,我們首先要了解基因的參考序列。這些參考序列可以是DNA、RNA或者蛋白質參考序列,也可以是cDNA、非編碼DNA或者線粒體參考序列。其中g表示的是基因組參考序列,c表示的是編碼DNA參考序列(即cDNA序列),m表示線粒體DNA參考序列,n表示非編碼DNA參考序列,r表示RNA參考序列,p表示蛋白參考序列。所有的參考序列均為已發(fā)表或者描述清楚的序列,如:NC_000023.10, LRG_199, NG_012232.1, NM_004006.2, LRG-199t1,NR_002196.1, NP_003997.1等。 對于參考序列的編號規(guī)則具體見表一。 表一 參考序列的編號規(guī)則 突變描述中常見的表示符號和縮寫 在描述基因突變的過程中,需要對不同類型突變的表示符號和縮寫進一步了解,以下對一些常見的突變表示符號和縮寫進行匯總。 “>”表示替換(substitution) “del”表示缺失(deletion) “dup”表示重復(duplication) “ins”表示插入(insertion) “inv”表示倒置(inversion) “con”表示轉換(conversion) “fs”表示移碼突變(frame shift) “ext”表示延伸(extension) “add”表示額外的染色體(an additionalchromosome (marker chromosome)) “cen”表示染色體的著絲點(the centromereof a chromosome) “chr”表示染色體(a chromosome) “pter”表示染色體的第一個核苷酸(the first nucleotideof a chromosome) “qter”表示染色體的最后一個核苷酸(the last nucleotideof a chromosome) “gom”表示甲基化的獲得(a gain of methylation) “l(fā)om”表示甲基化的丟失(a loss of methylation) 常見的突變類型 替換(substitution):一條序列中某一個核苷被另外一個核苷替代,分為轉換(transition:嘌呤與嘌呤之間的替換,或者嘧啶與嘧啶之間的替換)和顛換(transversions:嘌呤與嘧啶之間的替換),也叫作點突變。命名:“參考序列前綴.核苷位置原來的核苷>替換后的核苷”,如NC_000023.10:g.123A>G表示基因組序列NC_000023.10的第123位核苷由A突變成G。 缺失(deletion):一條序列中某一個或者多個核苷缺失。命名:“參考序列前綴.核苷位置del”,如NG_012232.1:g.19del表示基因組序列NG_012232.1的第19位核苷缺失;NG_012232.1:g.19_21del表示基因組序列NG_012232.1的第19至21位核苷缺失。 重復(duplication):一條序列中某一個或者多個核苷重復。命名:“參考序列前綴.核苷位置dup”,如NM_004006.2:c.20dup表示cDNA序列NM_004006.2的第20位核苷重復一次;NM_004006.2:c.20_23dup表示cDNA序列NM_004006.2的第20至23位核苷重復一次。 插入(insertion):一條序列中某一個或者多個核苷插入。命名:“參考序列前綴.核苷位置ins”,如LRG_199t1:c.240_241insAGG表示cDNA序列LRG_199t1的第240和241位核苷之間插入三個核苷AGG;NC_000023.10:g.32867907_32867908insL37425.1:23_361表示基因組序列NC_000023.10的第32867907和32867908位核苷之間插入序列L37425.1的23-361位核苷;LRG_199t1:c.419_420ins[T;450_470;AGGG]表示序列LRG_199t1的第419和420位核苷之間插入核苷T和450-470的序列以及AGGG;NM_004006.2:c.849_850ins850_900inv表示cDNA序列NM_004006.2的第849和850位核苷之間插入850-900的倒置序列。 倒置(inversion):替換后的序列是原始序列的反向互補序列。命名:“參考序列前綴.核苷位置inv”。如g.1077_1080inv表示基因組序列的第1077-1080位核苷序列發(fā)生反向互補,即由..AGGCTGATT.. 轉變?yōu)?.AGGTCAGTT..;g.122_123ins213_234invinsAins123_211inv表示基因組序列的第122-123位插入了123-213的反向互補序列(其中212位G突變成A);g.122_123ins212_234inv123_199inv表示基因組序列的122-123位插入了123-234序列的反向互補序列(其中的200-211缺失)。 轉換(conversion):原有序列的一段核苷被基因組其它位置的核苷替代。命名:“參考序列前綴.核苷位置con替換的序列”。如NC_000022.10:g.42522624_42522669con42536337_42536382表示基因組的第42522624_42522669位被該序列上的42536337_42536382替換;NC_000012.11:g.6128892_6128954conNC_000022.10:17179029_17179091表示基因組NC_000012.11的第6128892_6128954位被序列NC_000022.10的第17179029_17179091位替換。 缺失-插入(deletion-insertion):序列原有的一個或多個核苷被新的一個或多個核苷取代,且不是替換(substitution)、倒置(inversion)和轉換(conversion)。命名:“參考序列前綴.核苷位置delins新的核苷”。如:c.142_144delinsTGG(p.Arg48Trp)表示cDNA上的142-144位缺失,并插入TGG。 等位基因(alleles):一條序列上一個基因的多個突變位點。命名:一個基因在其中一個等位基因(染色體)上:“參考序列前綴.[突變1;突變2;...]”;一個基因在兩個等位基因(染色體)上:“參考序列前綴.[突變1];[突變2];...”。如果一個基因發(fā)現(xiàn)有兩種突變,但是不確定實在同一條染色體還是兩條不同的染色體上,則命名方式為“參考序列前綴.突變1(;)突變2(;)...”。如:LRG_199t1:c.[2376G>C;3103del]表示cDNA序列LRG_199t1上一個等位基因發(fā)生了兩種突變即2376位G替換成C、3103位缺失;LRG_199t1:c.[2376G>C];[2376G>C]表示cDNA序列LRG_199t1上兩個等位基因分別發(fā)生2376位G替換成C和2376G替換成C的突變;LRG_199t1:c.2376G>C(;)3103del表示cDNA序列LRG_199t1上發(fā)生兩種突變即2376位G替換成C、3103位缺失,但是不知道兩種突變是否在同一條染色體上;LRG_199t1:c.[2376G>C];[(2376G>C)]表示cDNA序列LRG_199t1上檢測到第2376位替換成C,但是可能是其中一條或者兩條染色體都出現(xiàn)該位點突變;LRG_199t1:c.[2376G>C];[2376=]表示cDNA序列上一條染色體的2376位G變成C,另一條染色體正常;LRG_199t1:c.[2376G>C];[?]表示cDNA序列上第2376位G變成C,但是另外一種預期的突變未檢測到;NM_004006.2:c.[296T>G;476T>C];[476T>C](;)1083A>C表示cDNA序列的兩條染色體上均出現(xiàn)476T>C的突變,其中一條染色體出現(xiàn)296T>G和1083A>C的突變,但是不知道是在哪一條染色體上。 重復序列(Repeat sequences):原有序列出現(xiàn)了一個或多個核苷,且重復出現(xiàn)。命名:單一的重復序列:“參考序列前綴.核苷位置(重復序列的第一個核苷位置)重復的序列[重復的次數(shù)]”;混合的重復序列:“參考序列前綴.核苷位置(重復序列的第一個核苷位置)重復的序列1[重復的次數(shù)]重復的序列2[重復的次數(shù)]...”。如:NC_000014.8:g.101179660TG[14]表示在基因組序列的第10117966位開始出現(xiàn)14次的TG重復;NC_000014.8:g.101179660TG[14];[18]表示在基因組序列中一條染色體的第101179660位開始出現(xiàn)14次的TG重復,在另一條染色體的同一個位置出現(xiàn)18次的TG重復。特殊的FMR1repeat(實際上是CGG重復,但一般寫成GGC重復)和HDrepeat(實際上是CAG重復,但一般寫成GCA重復),例如FMR1 repeat中的NM_002024.5:c.-128(GGC)[(600_800)]表示cDNA序列-128位開始出現(xiàn)GGC重復,具體重復次數(shù)未知,大約是600-800次重復。 復雜突變(complex variant):原始序列發(fā)生了一系列不同類型的突變,不能用一般的突變命名方法表示。包括鑲嵌現(xiàn)象(mosaicism)、嵌合現(xiàn)象(chimerism)和易位(translocation)。這些命名規(guī)則通常比較復雜,需要在進一步地學習。 |
|
來自: 新用戶8686qa3p > 《待分類》