日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

如何下载一个物种的全部EST序列 | NCBI | 表达序列标签

發(fā)布時(shí)間:2024/4/14 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何下载一个物种的全部EST序列 | NCBI | 表达序列标签 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

EST:表達(dá)序列標(biāo)簽,expressed sequence tags 。

顧名思義,很好理解,就是表達(dá)出來(lái)的序列,即從基因組DNA上表達(dá)出來(lái)的RNA,但是我們沒(méi)法測(cè)序RNA,所以我們最終測(cè)的是表達(dá)序列的cDNA片段。

“標(biāo)簽”:就是指這些序列可能比較短,但是可以用來(lái)標(biāo)定一個(gè)物種。

常見(jiàn)下載方式有兩種:

1. NCBI Web下載

https://www.ncbi.nlm.nih.gov/dbEST/

打開(kāi),搜索你要的物種,比如?Camellia ,可以看到結(jié)果EST (50287)。

Web下載幾個(gè)還行,想要批量下載就有點(diǎn)費(fèi)力了,ncbi反爬蟲,也不好爬。

2. NCBI ftp下載

ftp://ftp.ncbi.nih.gov/repository/dbEST/

直接wget就可以批量下載了。

for one in `seq 1 81` do echo $one wget ftp://ftp.ncbi.nih.gov/repository/dbEST/dbEST.reports.000000.${one}.gz done  

下載后的文件格式是:

IDENTIFIERSdbEST Id: 5 EST name: EST00006 GenBank Acc: M61958 GDB Dsegment: D0S2525ECLONE INFO Clone Id: HHCSB86 Source: ATCC Id in host: 77063 DNA type: cDNAPRIMERS Sequencing: M13 Forward PolyA Tail: UnknownSEQUENCETGCACAACCAAGTTTTGTGACTACGGGAAGGCTCCCGGGGCAGAGGAGTACGCTCAACAAGATGTGTTAAAGAAATCTTACTCCAAGGCCTTCACGCTGACCATCTCTGCCCTCTTTGTGACACCCAAGACGACTGGGGCCCNGGTGGAGTTAAGCGAGCAGCAACTNCAGTTGTNGCCGAGTGATGTGGACAAGCTGTCACCCACTGACAEntry Created: May 26 1992 Last Updated: Dec 18 2012PUTATIVE ID Assigned by submitter2',3'-cyclic nucleotide phoshodiesteraseLIBRARY Id: LIBEST_000004 Lib Name: LIBEST_000004 Hippocampus, Stratagene (cat. #936205) Organism: Homo sapiens Vector: lambdaZAP-II Description: Female, 2 years; oligo-dT + random primed cDNA synthesis;

信息是挺全面的,自己想要哪個(gè)物種就只能自己提取了。

提取成FASTA的腳本我就不貼了(效率很重要,因?yàn)槲募艽?#xff09;。

?最后我還是自己寫了個(gè)腳本,biopython實(shí)在是太慢了。

import gzip inf = gzip.open("dbEST.reports.000000.49.gz","rb") raw_id = "" seq = ""for line in inf:if line.stratswith("GenBank Acc"):id = line.split(":")[1].strip() if line.stratswith("SEQUENCE"):seq = ""while True:rline = inf.readline()seq+=rline.strip()if not line.stratswith(" "):breakif line.stratswith("Organism"):organism = line.split(":")[1].strip()if organism.startswith("Camellia"):print(">"+id+" "+organism, seq, sep="\n")

  

我的腳本可以用,但是不一定很快。

我用awk試了很久,沒(méi)有成功。

?

2018年3月16日  

總結(jié)

以上是生活随笔為你收集整理的如何下载一个物种的全部EST序列 | NCBI | 表达序列标签的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日日夜夜人人 | 午夜成人影片 | 69xxxx国产| 国产无码精品合集 | xxxx国产精品 | 超碰97人人爱| 999久久久精品视频 亚洲视频精品在线 | 黄色在线小视频 | 97久久精品视频 | 国产精品久久久久免费 | 成人免费观看网站 | 人人草人人爽 | 91精品国产视频 | 欧美三级电影在线观看 | 懂色aⅴ一区二区三区免费 国产精品99在线观看 | 中文字幕23 | 嫩草影院在线观看视频 | 国产精品视频入口 | 人妖ts福利视频一二三区 | 国产美女在线播放 | 日韩免费在线 | 日韩精品自拍偷拍 | 污污网站在线 | 亚洲美女性生活 | 日韩一区二区不卡视频 | 午夜精品久久久久久久久久久久久 | 玖草视频在线观看 | 99视频在线精品免费观看2 | 久久久久久久久久网站 | 亚洲第一视频在线播放 | 波多野结衣 一区 | 欧美成人午夜精品久久久 | 69视频网址 | 久草视频在线看 | 久久国产热 | 毛片直接看 | 韩国伦理在线 | 精品国产理论 | 韩国成人在线 | 午夜不卡av免费 | 国产美女永久免费 | 99久久久久无码国产精品 | 嫩草伊人久久精品少妇av | 午夜影院毛片 | 欧美日韩色片 | 色一情一乱一伦一区二区三区 | 亚洲欧美中文日韩在线v日本 | 国产一区啪啪 | 国产一级片麻豆 | 国内国产精品天干天干 | 国产精品扒开做爽爽爽的视频 | 制服丝袜av电影 | 一本色道久久综合亚洲精品图片 | 午夜影院在线看 | 大学生一级一片全黄 | 亚洲色图欧美日韩 | 国产人妻人伦精品1国产丝袜 | 日日碰狠狠添天天爽无码 | 成人国产精品蜜柚视频 | 精品电影一区二区 | 亚洲天堂一区二区在线观看 | 天堂中文在线看 | 欧美性色黄大片手机版 | 国产精选第一页 | 天天综合天天做天天综合 | 99热这里只有精品在线 | 日韩六区| a天堂v| 国产男女视频 | 精品国产1区2区 | 欧美日韩精品在线 | 高清乱码毛片入口 | 久久无吗视频 | 波多野结衣电影在线播放 | 777久久久 | 国产成人免费电影 | 欧美人体做爰大胆视频 | 亚洲成人一区在线观看 | 黄色小视频在线看 | 国产一级二级三级在线观看 | 日韩精品电影一区 | 超碰人操| 日韩一区二区三区三四区视频在线观看 | 亚洲二区一区 | 色综合天天干 | 91视频麻豆 | 国产乱码77777777 | 欧美区一区二区 | 日本人做受免费视频 | 91免费在线看 | 91福利视频在线观看 | 永久黄网站 | 国产成人aⅴ | 精品在线第一页 | 3d动漫精品啪啪一区二区三区免费 | 国产一级大片在线观看 | av中文网 | 欧美成人中文字幕 | 欧美午夜视频在线观看 |