日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

芯片无忧的使用教程_HTA芯片(学徒探索任务)

發(fā)布時(shí)間:2024/1/1 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 芯片无忧的使用教程_HTA芯片(学徒探索任务) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

年前我們布置過(guò)一個(gè) agilent芯片的探索任務(wù),很可惜,沒(méi)有人接單,也許是得等我某一天遇到了,或者時(shí)間充裕了會(huì)去解決它吧!現(xiàn)在再來(lái)一個(gè)疑難雜癥吧,就是生不逢時(shí)的Affymetrix Human Transcriptome Array 2.0芯片的數(shù)據(jù)處理。

前面我提到過(guò)[HTA-2_0] Affymetrix Human Transcriptome Array 2.0芯片的分析其實(shí)挺麻煩的,首先需要搞清楚下面3個(gè)平臺(tái)的差異:

  • GPL17586 ? ?[HTA-2_0] Affymetrix Human Transcriptome Array 2.0 [transcript (gene) version]

  • GPL19251 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [probe set (exon) version]

  • GPL16686 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [transcript (gene) version]

HTA芯片設(shè)計(jì)的時(shí)候覆蓋了 ~560?k exons and ~340?k exon-exon junctions , 而且比mRNA-Seq 便宜,穩(wěn)定性好。

看看TP53這個(gè)基因上面的探針設(shè)計(jì)

我們?cè)?https://www.easana.com/ 網(wǎng)頁(yè)搜索,可以看到主要的探針都集中在TP53中間的外顯子上面:

TP53基因上面的HTA芯片探針

如果具體看探針的坐標(biāo),如下:

一個(gè)基因的全部探針的坐標(biāo)

可以看到是29個(gè)探針,序列也清清楚楚,還可以csv下載,探針主要是集中是e5-e15, 跟TP53基因結(jié)構(gòu)示意圖吻合。

如果以外顯子為單位看表達(dá)差異

反正都是表達(dá)矩陣,以外顯子為單位和基因?yàn)閱挝?#xff0c;理論是差不多啦,沒(méi)有根據(jù)注釋文件映射到基因名字之前,都是一個(gè)ID而已。在 https://www.easana.com/ 網(wǎng)頁(yè)可視化如下:

以外顯子為單位看表達(dá)差異

但是這樣的示意圖肯定沒(méi)辦法發(fā)表咯,你可以嘗試新的可視化花樣。

關(guān)于EASANA

其實(shí)EASANA是商業(yè)軟件genosplice的一個(gè)可視化功能而已,上面的示意圖比較好的介紹了HTA芯片的基因的多個(gè)探針的表達(dá)量差異情況。

我簡(jiǎn)單摸索了一下,沒(méi)有看到人家下載,看樣子是需要發(fā)郵件給這個(gè)商業(yè)軟件的銷售人員一對(duì)一的講解和獲取。一般來(lái)說(shuō),這樣的軟件在中國(guó)大陸是沒(méi)有市場(chǎng)的, 所以干脆略過(guò)了。

實(shí)際上affymetrix公司自己有TAC軟件

比如有一些文章里面就會(huì)明確寫出來(lái),采用的是affymetrix公司出品的軟件 TAC進(jìn)行處理。一般來(lái)說(shuō),購(gòu)買的如果是商業(yè)公司提供的芯片服務(wù),肯定是會(huì)有配套的數(shù)據(jù)分析。可惜的是,大多數(shù)情況下,真心想用好HTA芯片數(shù)據(jù)的小伙伴并不是購(gòu)買服務(wù)的人,而是想挖掘它背后價(jià)值的。

TAC軟件

可以看到這個(gè)軟件有一個(gè)探索可變剪切的模塊,而且這個(gè)也的確是大量使用了HTA芯片的文章寫作落腳點(diǎn)。如果你發(fā)現(xiàn)你的領(lǐng)域有一個(gè)公共數(shù)據(jù)庫(kù)就是HTA芯片,但是創(chuàng)造數(shù)據(jù)集的研究者們并沒(méi)有落腳到可變剪切。那么你就應(yīng)該是意識(shí)到,這可能是你可以努力的方向。

另外一個(gè)商業(yè)軟件partek也很流行

partek這個(gè)軟件應(yīng)該是在海外非常流行,我看到不少文獻(xiàn)提到了partek,甚至跟affymetrix公司出品的軟件 TAC差不多的使用頻率。

image-20200205121009699

當(dāng)然了,具體我也沒(méi)有用過(guò)啦。

學(xué)徒作業(yè)

跟agilent芯片一樣,agilent芯片需要摸索使用 Agi4x44PreProcess包完成E-MTAB-3017數(shù)據(jù)集的表達(dá)矩陣獲取。當(dāng)然了,也可以根據(jù)分組,走一下差異分析標(biāo)準(zhǔn)代碼。

而我們的HTA芯片,也是需要摸索一個(gè)包,好像還在GitHub上面,就是EventPointer,Romero et al. BMC Genomics (2016) 17:467 DOI 10.1186/s12864-016-2816-x 有時(shí)間,又想做一些挑戰(zhàn)性的數(shù)據(jù)分析的朋友可以考慮入坑!

標(biāo)準(zhǔn)分析流程,火山圖,熱圖,GO/KEGG數(shù)據(jù)庫(kù)注釋等等。這些流程的視頻教程都在B站和GitHub了,目錄如下:

  • 第一講:GEO,表達(dá)芯片與R

  • 第二講:從GEO下載數(shù)據(jù)得到表達(dá)量矩陣

  • 第三講:對(duì)表達(dá)量矩陣用GSEA軟件做分析

  • 第四講:根據(jù)分組信息做差異分析

  • 第五講:對(duì)差異基因結(jié)果做GO/KEGG超幾何分布檢驗(yàn)富集分析

  • 第六講:指定基因分組boxplot指定基因list畫(huà)熱圖

感興趣可以細(xì)讀表達(dá)芯片的公共數(shù)據(jù)庫(kù)挖掘系列推文 ;

  • 解讀GEO數(shù)據(jù)存放規(guī)律及下載,一文就夠

  • 解讀SRA數(shù)據(jù)庫(kù)規(guī)律一文就夠

  • 從GEO數(shù)據(jù)庫(kù)下載得到表達(dá)矩陣 一文就夠

  • GSEA分析一文就夠(單機(jī)版+R語(yǔ)言版)

  • 根據(jù)分組信息做差異分析- 這個(gè)一文不夠的

  • 差異分析得到的結(jié)果注釋一文就夠

文末友情宣傳
  • 生信技能樹(shù)的2019年終總結(jié)??這里面記錄著我博士期間抽空做的一點(diǎn)教程分享事業(yè)

  • 2020學(xué)習(xí)主旋律,B站74小時(shí)免費(fèi)教學(xué)視頻為你領(lǐng)路?這里面記錄著我為生物信息學(xué)教學(xué)行業(yè)做的一點(diǎn)貢獻(xiàn)

總結(jié)

以上是生活随笔為你收集整理的芯片无忧的使用教程_HTA芯片(学徒探索任务)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。