学习生信的系列教程
歡迎關注生信寶典,數萬小伙伴一起學生信!http://mp.weixin.qq.com/s/VguRtaGpEcaNzmZEi48gLg
生信的作用越來越大,想學的人越來越多,不管是為了以后發展,還是為了解決眼下的問題。但生信學習不是一朝一夕就可以完成的事情,也許你可以很短時間學會一個交互式軟件的操作,卻不能看完程序教學視頻后就直接寫程序。也許你可以跟著一個測序分析流程完成操作,但不懂得背后的原理,不知道什么參數需要修改,結果可以出來,卻把我不住對還是錯。
學習生信從來就不是一個簡單的事,需要做好持久戰的心理準備。
在學習時,我們都希望由淺入深的逐步深入,不斷地練習和實踐,這就是為什么我們需要一本書,因為書很系統。但生信發展的歷史短于計算機編程的歷史,如果想要一門程序設計的入門數據,每種語言都可以找到幾本。但想要一個囊括生信的書,就有些難了。本身生信跨領域,需要多學科的知識,而其內部又有不少分子,都囊括了太大,包括的少又有些隔靴搔癢的感覺。
我們當時都是零基礎下自學Linux, 自學Python,自學R,自學高通量測序;這些學習經歷,之前都零星地記錄在博客里。現在回頭去看幾年前自己記錄的東西,覺得好簡單,而當時卻費了很大的力氣。這些零星的隨手記,當時也只是為了自己看,到現在確實只有自己能看得懂,不便惠及更多的人。
因此我們創建了生信寶典,希望從不同的角度傳播知識。這個不同有三點含義,一是形式上的不同,摒棄之前主編們單人作戰想寫啥就寫啥,而是有組織有計劃的內容聚合,提供一系列的教程,由入門到提高。二是內容的不同,不去用網上現有教程的通用數據做例子,而是拿實際生物數據,講述如何解釋生信中普遍碰到的問題,講述如何處理自己的數據。三是立足點不同。在寫作時,我們回到了當年,在回憶中用整個階段的學習去指導當初的那個小白,從那些會了的人覺得微不足道而不會的人又邁不過的坎入手,直擊痛點。知識點的收錄依據不是是否炫酷,是否難,而是是否必要。如果必要,再簡單,也要提及;如果不必要,再炫酷,也暫不納入。
通過大量的生信例子、關鍵的注釋和濃縮的語句形成下面的一系列學習教程。每一篇內容都不多,可以當做小說閱讀,也可以跟著去練,反復幾遍,每讀一次都會有不同的收獲和體會。
程序學習心得
- 生物信息之程序學習
- 如何優雅的提問
- 生信寶典視頻教程
- 好色之旅-畫圖三字經
Linux 學習
- 文件和目錄
- 文件操作
- 文件內容操作
- 環境變量和可執行屬性
- 管道、標準輸入輸出
- 命令運行監測和軟件安裝
- 常見錯誤和快捷操作
- 文件列太多,很難識別想要的信息在哪列?
- 文件排序和FASTA文件操作
- 用了Docker,媽媽再也不擔心我的軟件安裝了 - 基礎篇
- Linux服務器數據定期同步和備份方式
- 不用Linux也可以的強大文本處理方法
- 又雙叒叕一個軟件安裝方法
- 查看服務器配置信息
R統計和作圖
- 入門環境Rstudio
- 熱圖繪制 (heatmap)
- 基礎概念和矩陣操作
- 熱圖簡化
- 熱圖美化
- 線圖繪制
- 線圖一步法
- 箱線圖(小提琴圖、抖動圖、區域散點圖)
- 箱線圖一步法
- 火山圖
- 富集分析泡泡圖 (文末有彩蛋)
- 散點圖繪制
- 一文看懂PCA主成分分析
- 富集分析DotPlot,可以服
- 韋恩圖
- 柱狀圖
- 圖形設置中英字體
- 教師節獻禮 - 文章用圖的修改和排版
- 非參數法生存分析
- 文章用圖的修改和排版(2)
NGS基礎
- NGS基礎 - FASTQ格式解釋和質量評估
- NGS基礎 - 高通量測序原理
- NGS基礎 - 參考基因組和基因注釋文件
- NGS基礎 - GTF/GFF文件格式解讀和轉換
- 本地安裝UCSC基因組瀏覽器
- 測序數據可視化 (一)
- 測序文章數據上傳找哪里
NGS分析工具評估
- 39個轉錄組分析工具,120種組合評估(轉錄組分析工具哪家強-導讀版)
- 39個轉錄組分析工具,120種組合評估(轉錄組分析工具大比拼 (完整翻譯版))
- 無參轉錄組分析工具評估和流程展示
癌癥數據庫
- UCSC XENA - 集大成者(TCGA, ICGC)
- ICGC數據庫使用
- TCGA數據庫在線使用
Python學習
- Python學習極簡教程 (一)
- Python學習教程(二)
- Python學習教程(三)
- Python學習教程 (四)
- Python學習教程(五)
- Python學習教程 (六)
- Pandas,讓Python像R一樣處理數據,但快
- Python解析psiBlast輸出的JSON文件結果
NGS軟件
- Rfam 12.0+本地使用 (最新版教程)
- 輕松繪制各種Venn圖
- ETE構建、繪制進化樹
- psRobot:植物小RNA分析系統
- 生信軟件系列 - NCBI使用
- 去東方,最好用的在線GO富集分析工具
Cytoscape網絡圖
- Cytoscape教程1
- Cytoscape之操作界面介紹
- 新出爐的Cytoscape視頻教程
分子對接
- 來一場蛋白和小分子的風花雪月
- 不是原配也可以-對接非原生配體
- 簡單可視化-送你一雙發現美的眼睛
- 你需要知道的那些前奏
生信寶典之傻瓜式
- 生信寶典之傻瓜式 (一) 如何提取指定位置的基因組序列
- 生信寶典之傻瓜式 (二) 如何快速查找指定基因的調控網絡
- 生信寶典之傻瓜式 (三) 我的基因在哪里發光 - 如何查找基因在發表研究中的表達
生信人寫程序
- 生信人寫程序1. Perl語言模板及配置
- 生信人寫程序2. Editplus添加Perl, Shell, R, markdown模板和語法高亮
小技巧系列
- 參考文獻中雜志名字格式混亂問題一次解決
友情鏈接流程
宏基因組 - 擴增子分析流程
- 質控,實驗設計,雙端序列合并 查看原始數據的質量,編寫合格的實驗設計用于分析,雙端序列合并為單端的擴增子序列;
- 提取barcode,質控及樣品拆分,切除擴增引物 將Barcode序列從序列中拆除,篩選高質量的測序結果并標記文庫中每條序列中的樣品來源,最后切除擴增時使用的引物;
- 格式轉換,去冗余,聚類 轉換QIIME生成fasta格式為Usearch要求格式;使用Usearch對序列去冗余并篩選高豐度,極大降低下游計算量和去除噪音;最后使用用Usearch聚類生成OTU,默認會組內自動去除大量嵌合體;
- 去嵌合體,非細菌序列,生成代表性序列和OTU表 本講詳細講了嵌合體的概念,并使用參考數據庫去除嵌合體;學習基于參數數據庫篩選細菌序列,這些都是可選的操作,根據實際情況決定是否需要,最終生成高質量的OTU序列作為參考序列;
- 物種注釋,OTU表操作 這部分采于不同數據庫進行細菌或真菌注釋;同時根據實際情況,對OTU表進一步按樣品、豐度、物種等條件篩選;
- 進化樹,Alpha,Beta多樣性 將OTU多序列比對生成進化樹,為依賴進化關系的計算方法提供輸入文件;再進行多種Alpha和Beta多樣性的計算;
- 物種分類統計,篩選進化樹和其它 對物種進行分類統計,篩選高豐度結果用于進化樹展示,和其它用于R統計分析的結果生成。
生信媛 - Biostar handbook
- 手把手教你入門生信——The Biostar Handbook
- 課程1、2-Linux中生信分析常用命令入門
- 課程3、4-NCBI的Entrez Direct和SRA toolkit的安裝及使用
- 課程5、6-編寫可重復使用的腳本
- 課程7、8-二代測序質控:fastqc、prinseq、trimmomatic、seqtk
- 課程9、10-測序文件的質控&在線序列比對
- 課程11、12-下載序列,建blast數據庫以及本地blast
- 課程13、14-常用的mapping軟件bwa & sam格式簡介
- 課程15、16-samtools簡介&利用readseq對GenBank文件格式轉換
- 課程17、18-awk進行簡單的編程&序列比對軟件bwa和bowtie2
- 課程19、20-利用samtools mpileup和bcftools進行SNP calling
- 課程21、22-使用samtools和FreeBayes進行變異的calling并用snpEff注釋
- 課程23、24-SNP calling
- 課程25、26-bedtools的安裝和使用
- 課程27、28-RNAseq分析
- 課程29、30(大結局)-差異表達分析以及用ErmineJ做GO
Biobabble - ChIP-seq
- CS0: ChIPseq從入門到放棄
- CS1: ChIPseq簡介
- CS2: BED文件
- CS3: peak注釋
- CS4:關于ChIPseq注釋的幾個問題
- CS5: 吃著火鍋,唱著歌,還把分析給做了
招聘
- 易漢博歡迎您加入
聯系我們
學習生物學
總結
- 上一篇: RapidMiner Studio fo
- 下一篇: macos 下 vmware fusio