基因組重測(cè)序的應(yīng)用
一、背景
基因組重測(cè)序是對(duì)已知基因組序列的物種進(jìn)行不同個(gè)體的基因組測(cè)序,并在此基礎(chǔ)上對(duì)個(gè)體或群體進(jìn)行差異性分析。
全基因組重測(cè)序的個(gè)體,通過(guò)序列比對(duì),可以找到大量的單核苷酸多態(tài)性位點(diǎn)(SNP),插入缺失位點(diǎn)(InDel,Insertion/Deletion)、結(jié)構(gòu)變異位點(diǎn)(SV,Structure Variation)位點(diǎn)和拷貝數(shù)變異位點(diǎn)(CNV,copy number variation)。SBC可以協(xié)助客戶(hù),通過(guò)生物信息手段,分析不同個(gè)體基因組間的結(jié)構(gòu)差異,同時(shí)完成注釋。
技術(shù)路線:提取基因組DNA,利用Covaris進(jìn)行隨機(jī)打斷,電泳回收所需長(zhǎng)度的DNA片段(0.2~5Kb),加上接頭,進(jìn)行cluster制備(Solexa)或E-PCR(SOLiD),最后利用Paired-End(Solexa)或者M(jìn)ate-Pair(SOLiD)的方法對(duì)插入片段進(jìn)行重測(cè)序。
二、生物信息分析流程
1、數(shù)據(jù)量產(chǎn)出
總堿基數(shù)量、Totally mapped reads、Uniquely mapped reads統(tǒng)計(jì),測(cè)序深度分析。
2、一致性序列組裝
與參考基因組序列(Reference genome sequence)的比對(duì)分析,利用貝葉斯統(tǒng)計(jì)模型檢測(cè)出每個(gè)堿基位點(diǎn)的最大可能性基因型,并組裝出該個(gè)體基因組的一致序列。
3、SNP檢測(cè)及在基因組中的分布
提取全基因組中所有多態(tài)性位點(diǎn),結(jié)合質(zhì)量值、測(cè)序深度、重復(fù)性等因素作進(jìn)一步的過(guò)濾篩選,最終得到可信度高的SNP數(shù)據(jù)集。并根據(jù)參考基因組序列對(duì)檢測(cè)到的變異進(jìn)行注釋。
4、InDel檢測(cè)及在基因組的分布
在進(jìn)行mapping的過(guò)程中,進(jìn)行容Gap的比對(duì)并檢測(cè)可信的Short InDel。在檢測(cè)過(guò)程中,Gap的長(zhǎng)度為1~5個(gè)堿基。
5、Structure Variation檢測(cè)及在基因組中的分布
目前SBC能夠檢測(cè)到的結(jié)構(gòu)變異類(lèi)型主要有:插入、缺失、復(fù)制、倒位、易位等。根據(jù)測(cè)序個(gè)體序列與參考基因組序列比對(duì)分析結(jié)果,檢測(cè)全基因組水平的結(jié)構(gòu)變異并對(duì)檢測(cè)到的變異進(jìn)進(jìn)行注釋。
三、應(yīng)用
用于應(yīng)用全基因組重測(cè)序技術(shù)篩查原發(fā)性肌張力障礙的致病基因研究:
應(yīng)用全基因組重測(cè)序技術(shù)對(duì)原發(fā)性肌張力障礙病患者進(jìn)行全基因組重測(cè)序,結(jié)合生物信息學(xué)技術(shù),篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn),從而發(fā)現(xiàn)新的基因或突變,有助于我們對(duì)該疾病進(jìn)行正確的分子診斷以及提供更好的遺傳咨詢(xún)信息。
目的:(1)通過(guò)全基因組重測(cè)序技術(shù)篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn),為了該病家系患者的遺傳咨詢(xún)和臨床診斷提供依據(jù)。
(2)探討全基因組重測(cè)序技術(shù)在罕見(jiàn)疾病致病基因篩查應(yīng)用中的可行性,為該技術(shù)的臨床應(yīng)用提供新的信息。
方法:收集原發(fā)性肌張力患者及健康對(duì)照者外周血標(biāo)本及臨床資料,提取受試者基因組DNA,選取1例具有典型原發(fā)性肌張力表型患者的DNA和100例健康對(duì)照者DNA分別構(gòu)建患者全基因組測(cè)序文庫(kù)和健康對(duì)照者全基因組測(cè)序文庫(kù),并進(jìn)行高通量測(cè)序。下機(jī)獲得原始數(shù)據(jù),經(jīng)過(guò)初步數(shù)據(jù)過(guò)濾后與標(biāo)準(zhǔn)基因組序列比對(duì),獲得原發(fā)性肌張力表型患者及對(duì)照組基因變異信息;通過(guò)比較原發(fā)性肌張力表型患者及對(duì)照組基因變異信息,并結(jié)合生物信息學(xué)技術(shù),篩查可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn)。
結(jié)果:(1)通過(guò)全基因組重測(cè)序一共得到240G bp的數(shù)據(jù),其中患者的數(shù)據(jù)產(chǎn)出為127.90G bp,原始數(shù)據(jù)測(cè)序深度為45X,有效測(cè)序深度為40.30X,基因組覆蓋比例為98.90%,SNP數(shù)量為3,602,141,Indel數(shù)量為58,127,CNV數(shù)量為831,SV數(shù)量為8,431;健康對(duì)照者的數(shù)據(jù)產(chǎn)出為112.91G bp,原始數(shù)據(jù)測(cè)序深度為40X,有效測(cè)序深度為35.70X,基因組覆蓋比例為99.50%,SNP數(shù)量為3,550,305,Indel數(shù)量為558,038,CNV數(shù)量為824,SV數(shù)量為8222。
(2)SNP公共數(shù)據(jù)庫(kù)過(guò)濾并將病人與健康對(duì)照對(duì)比后,得到96個(gè)突變位點(diǎn),突變基因包括錯(cuò)義突變,蛋白質(zhì)提前終止,移碼突變,內(nèi)含子剪切異常等多種類(lèi)型。
結(jié)論:(1)在臨床應(yīng)用全基因組重測(cè)序工作中,患者結(jié)合健康人群的對(duì)照分析,有利于濾過(guò)未明確臨床意義的基因組變異位點(diǎn)。
(2)發(fā)現(xiàn)ANO3(N294H)突變與疾病的表型密切相關(guān),可能是中國(guó)原發(fā)性肌張力障礙病患者的致病突變之一。
北京天優(yōu)??瞪锟萍加邢薰?/span>
官網(wǎng):http://www.jyzjsd.com/
服務(wù)熱線:400-860-6160
聯(lián)系電話/微信:13718308763
QQ:2136615612 3317607072
E-mail:Tianyoubzwz@163.com