日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

TCGA 亚型突变负荷代码

發(fā)布時間:2023/12/8 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 TCGA 亚型突变负荷代码 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

#1、準備文件/數(shù)據(jù)并加載相應的包

#1.1下載并加載相應的包,有就直接加載,沒有就下載后再加載。

install.packages("pacman")
library(pacman)
p_load(TCGAbiolinks,DT,tidyverse)
BiocManager::install("TCGAbiolinks")
library(tidyverse)
BiocManager::install("maftools")
library(maftools)

library(dplyr)

#1.2需要準備亞型文件

#用之前用來構(gòu)建風險模型的時候生成的具有高低風險組分組的文件

#行是樣本名

#直接加載

load("F:/mypro/cancer-cuprosis/TCGA-STAD-cuprosis-lncrna/STAD-cuprosis-lncrna/mk-model/train_test_all_risk.RData")
View(all_surv_expr)

#就是上面截圖這個樣子。其實只需要有risk那一列就行了。

#1.3準備maf格式文件,并根據(jù)高低風險組將maf分為高低風險樣本的亞型

raw<-GDCquery(
? project= "TCGA-STAD",
? data.category = "Simple Nucleotide Variation",
? access = ?"open",
? legacy = FALSE,
? data.type= "Masked Somatic Mutation",
? workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking"
)

#下載數(shù)據(jù)
GDCdownload(raw)
#獲取數(shù)據(jù)
maf<- GDCprepare(raw)
#讀取數(shù)據(jù)
maf<-maf %>% maftools::read.maf()

?#一開始我以為把突變數(shù)據(jù)提取成表格就行了,后面發(fā)現(xiàn)不行。做瀑布圖的時候,那個代碼不能識別這樣的表達矩陣,需要時maf格式的。

#找到樣本所在的位置

maf@data$Tumor_Sample_Barcode?

#改樣本名

#樣本名需要和亞型文件的樣本名一致,好后面做提取處理。

mut$Tumor_Sample_Barcode<-substring(mut$Tumor_Sample_Barcode,1,12)

mut$Tumor_Sample_Barcode[1]

?mut$Tumor_Sample_Barcode<-substring(mut$Tumor_Sample_Barcode,1,12)
mut.High <- mut[(mut$Tumor_Sample_Barcode %in% rownames(all_surv_expr)[all_surv_expr$risk=="high"]),]
### ? %in% ? 判斷前面一個向量是否在后面一個向量中存在,返回布爾值
mut.Low <- mut[(mut$Tumor_Sample_Barcode %in% rownames(all_surv_expr)[all_surv_expr$risk=="low"]),]
maf.High <-read.maf(maf = mut.High,isTCGA = T)## 讀取高風險亞型的突變數(shù)據(jù)
maf.Low <- read.maf(maf = mut.Low,isTCGA = T)## 讀取低風險亞型的突變數(shù)據(jù)
maf.all <- read.maf(maf = mut,isTCGA = T)## 讀取總的樣本突變數(shù)據(jù)
?

# 下面設(shè)置顏色,人種等信息,這里的代碼不需要修改:

col = RColorBrewer::brewer.pal(n = 10, name = 'Paired')
names(col) = c('Frame_Shift_Del','Missense_Mutation', 'Nonsense_Mutation', 'Frame_Shift_Ins','In_Frame_Ins', 'Splice_Site', 'In_Frame_Del','Nonstop_Mutation','Translation_Start_Site','Multi_Hit')

#人種
racecolors = RColorBrewer::brewer.pal(n = 4,name = 'Spectral')
names(racecolors) = c("ASIAN", "WHITE", "BLACK_OR_AFRICAN_AMERICAN", ?"AMERICAN_INDIAN_OR_ALASKA_NATIVE")

# 下面開始繪制總的瀑布圖,代碼及圖片如下
oncoplot(maf = maf.all,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)
# 繪制高風險亞型瀑布圖,代碼及圖片如下:
oncoplot(maf = maf.High,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)
# 繪制低風險瀑布圖,代碼及圖片如下:
oncoplot(maf = maf.Low,
? ? ? ? ?colors = col,#給突變配色
? ? ? ? ?top = 20)

總結(jié)

以上是生活随笔為你收集整理的TCGA 亚型突变负荷代码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。