现有物种的参考基因组都是可靠的吗?
生活随笔
收集整理的這篇文章主要介紹了
现有物种的参考基因组都是可靠的吗?
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
不一定全部可靠。隨著測(cè)序技術(shù)的迅速發(fā)展和測(cè)序成本的極速降低,越來越多基因組數(shù)據(jù)的出現(xiàn),不可避免的有“魚目混珠”現(xiàn)象發(fā)生。近期,就有科研人員發(fā)現(xiàn),現(xiàn)在生物界普遍使用的一個(gè)數(shù)據(jù)庫genebank中存儲(chǔ)的基因組草圖并不是完全可靠的,不少動(dòng)植物基因組中存在細(xì)菌,病毒或其他微生物污染,具體有在綿羊和奶牛的基因組草圖中發(fā)現(xiàn)了淋球菌基因的存在,推測(cè)源自微生物污染。這項(xiàng)研究值得科研人員們反思,大部分情況下,genebank上的基因組都被認(rèn)為是完整可信的,但最近的研究不僅發(fā)現(xiàn)動(dòng)植物基因組中可能存在微生物基因污染,甚至有些微生物本以為是完成圖的基因組圖譜也可能是引入了DNA插入錯(cuò)誤的草圖而已。這些錯(cuò)誤的發(fā)生可能源于測(cè)序過程中的外部污染,也可能是研究者們對(duì)數(shù)據(jù)組裝工具的誤用,甚至可能是基于不完整的草圖進(jìn)行分析時(shí)產(chǎn)生的錯(cuò)誤。比如微生物基因組,大部分能得到的數(shù)據(jù)都是草圖,其中還有多個(gè)gap,而后續(xù)分析往往基于此結(jié)果進(jìn)行,這時(shí)候如果不深入分析,很可能會(huì)將誤認(rèn)為這些是基因水平轉(zhuǎn)移導(dǎo)致的。至于測(cè)序過程中的污染問題,可能發(fā)生于多個(gè)環(huán)節(jié),從DNA提取到最終加接頭測(cè)序,都有污染的可能。特別是針對(duì)一些昆蟲等小型生物,進(jìn)行基因組測(cè)序時(shí)需要的DNA量常常需要對(duì)這些生物的整個(gè)個(gè)體進(jìn)行DNA抽提,這樣發(fā)生污染的幾率就會(huì)更高。
細(xì)思極恐呀。。。。。隨著基因組測(cè)序技術(shù)的飛速發(fā)展以及測(cè)序成本的快速降低,全基因組數(shù)據(jù)也在急速增加。盡管參考基因組數(shù)據(jù)是非常有價(jià)值的資源,但是由于測(cè)序過程中的外源污染或者研究者對(duì)數(shù)據(jù)組裝方法的誤用,使得基因組數(shù)據(jù)面臨很多問題。近日,約翰霍普金斯大學(xué)的研究者在《Peer J》上發(fā)表一項(xiàng)研究,發(fā)現(xiàn)Genbank上存儲(chǔ)的動(dòng)植物基因組草圖中存在細(xì)菌及病毒污染。這些物種間交叉污染會(huì)給微生物分析的發(fā)展造成很多問題,例如,即便在動(dòng)物測(cè)序數(shù)據(jù)中出現(xiàn)部分基因序列可以證明生命起源,但實(shí)際上這部分序列可能是來自是微生物污染。該研究的另一個(gè)驚人的發(fā)現(xiàn)是,在奶牛和綿羊的基因組草圖中發(fā)現(xiàn)了淋球菌!盡管Genbank上存儲(chǔ)的基因組被認(rèn)為是完整的,但一些細(xì)菌的基因組其實(shí)是含有多處DNA插入錯(cuò)誤的草圖。從1995年,測(cè)序獲得了第一個(gè)細(xì)菌全基因組——流感嗜血桿菌基因組,到現(xiàn)在,Genbank數(shù)據(jù)庫上存儲(chǔ)了大約2萬7千個(gè)原核生物基因組以及1千6百個(gè)真核生物基因組。但絕大部分?jǐn)?shù)據(jù)是基因組草圖,序列中存在多處gap(漏洞),而后續(xù)分析都是基于這些不完整的基因組草圖。如果不深入分析判斷,很可能認(rèn)為只是基因水平轉(zhuǎn)移引起這些錯(cuò)誤,因此需要更科學(xué)的、正確的分析基因組中出現(xiàn)的錯(cuò)誤。基因組測(cè)序的第一步是提取DNA,根據(jù)物種的不同,獲取DNA的方式也是各式各樣。對(duì)于動(dòng)物,通常從血液中提取DNA,但是像昆蟲這樣的微小動(dòng)物,需要從整個(gè)個(gè)體中提取測(cè)序所需的DNA。從DNA提取到測(cè)序,都存在污染的可能性。計(jì)算機(jī)對(duì)測(cè)序原始數(shù)據(jù)的過濾只能去除例如大腸桿菌一類實(shí)驗(yàn)室常見污染,對(duì)于其它種類的污染是很難去除的。需要強(qiáng)調(diào)的是,不僅要對(duì)即將發(fā)表的基因組進(jìn)行仔細(xì)篩查,還包括那些已經(jīng)發(fā)表的數(shù)據(jù)。轉(zhuǎn)自:http://weibo.com/biodiscover%3 ... %23_0
正常情況下應(yīng)該基本可靠的吧,這些數(shù)據(jù)庫都來自實(shí)驗(yàn)數(shù)據(jù),一般情況下不會(huì)出什么差錯(cuò)。但偏差難免會(huì)有,比如如果測(cè)序的取材不當(dāng),或者一些工作者在測(cè)序中的失誤造成的比必要的偏差現(xiàn)在可能也難以避免,我覺得這些數(shù)據(jù)庫應(yīng)該建立相應(yīng)的驗(yàn)證機(jī)制。
細(xì)思極恐呀。。。。。隨著基因組測(cè)序技術(shù)的飛速發(fā)展以及測(cè)序成本的快速降低,全基因組數(shù)據(jù)也在急速增加。盡管參考基因組數(shù)據(jù)是非常有價(jià)值的資源,但是由于測(cè)序過程中的外源污染或者研究者對(duì)數(shù)據(jù)組裝方法的誤用,使得基因組數(shù)據(jù)面臨很多問題。近日,約翰霍普金斯大學(xué)的研究者在《Peer J》上發(fā)表一項(xiàng)研究,發(fā)現(xiàn)Genbank上存儲(chǔ)的動(dòng)植物基因組草圖中存在細(xì)菌及病毒污染。這些物種間交叉污染會(huì)給微生物分析的發(fā)展造成很多問題,例如,即便在動(dòng)物測(cè)序數(shù)據(jù)中出現(xiàn)部分基因序列可以證明生命起源,但實(shí)際上這部分序列可能是來自是微生物污染。該研究的另一個(gè)驚人的發(fā)現(xiàn)是,在奶牛和綿羊的基因組草圖中發(fā)現(xiàn)了淋球菌!盡管Genbank上存儲(chǔ)的基因組被認(rèn)為是完整的,但一些細(xì)菌的基因組其實(shí)是含有多處DNA插入錯(cuò)誤的草圖。從1995年,測(cè)序獲得了第一個(gè)細(xì)菌全基因組——流感嗜血桿菌基因組,到現(xiàn)在,Genbank數(shù)據(jù)庫上存儲(chǔ)了大約2萬7千個(gè)原核生物基因組以及1千6百個(gè)真核生物基因組。但絕大部分?jǐn)?shù)據(jù)是基因組草圖,序列中存在多處gap(漏洞),而后續(xù)分析都是基于這些不完整的基因組草圖。如果不深入分析判斷,很可能認(rèn)為只是基因水平轉(zhuǎn)移引起這些錯(cuò)誤,因此需要更科學(xué)的、正確的分析基因組中出現(xiàn)的錯(cuò)誤。基因組測(cè)序的第一步是提取DNA,根據(jù)物種的不同,獲取DNA的方式也是各式各樣。對(duì)于動(dòng)物,通常從血液中提取DNA,但是像昆蟲這樣的微小動(dòng)物,需要從整個(gè)個(gè)體中提取測(cè)序所需的DNA。從DNA提取到測(cè)序,都存在污染的可能性。計(jì)算機(jī)對(duì)測(cè)序原始數(shù)據(jù)的過濾只能去除例如大腸桿菌一類實(shí)驗(yàn)室常見污染,對(duì)于其它種類的污染是很難去除的。需要強(qiáng)調(diào)的是,不僅要對(duì)即將發(fā)表的基因組進(jìn)行仔細(xì)篩查,還包括那些已經(jīng)發(fā)表的數(shù)據(jù)。轉(zhuǎn)自:http://weibo.com/biodiscover%3 ... %23_0
正常情況下應(yīng)該基本可靠的吧,這些數(shù)據(jù)庫都來自實(shí)驗(yàn)數(shù)據(jù),一般情況下不會(huì)出什么差錯(cuò)。但偏差難免會(huì)有,比如如果測(cè)序的取材不當(dāng),或者一些工作者在測(cè)序中的失誤造成的比必要的偏差現(xiàn)在可能也難以避免,我覺得這些數(shù)據(jù)庫應(yīng)該建立相應(yīng)的驗(yàn)證機(jī)制。
總結(jié)
以上是生活随笔為你收集整理的现有物种的参考基因组都是可靠的吗?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三星Note20 Ultra相机、充电细
- 下一篇: 求一个唯美的诗句个性签名