跳至內容

GenBank

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
基因銀行
GenBank
內容
說明(描述)超過300,000種生物體的核苷酸序列,並附有支持性書目和生物學註釋。
獲取的數據類型
  • 核苷酸序列
  • 蛋白質序列
有機體(生物)全部
相關資訊
研究中心美國國家生物技術資訊中心(NCBI)
主要參考文獻(引用)PMID 21071399
發布日期1982年,​44年前​(1982
訪問
數據格式
網站NCBI
下載網址ncbi ftp
網絡服務網址
工具
網絡BLAST
獨立BLAST
其它資訊
許可不清楚[1]

基因銀行(英語:GenBank,另譯基因庫基因數據庫)是一個開放獲取序列數據庫英語sequence database,對所有公開可利用的核苷酸序列與其轉譯的蛋白質進行收集並註釋。

此數據庫是國際核酸序列數據庫協作組織英語International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美國國家生物技術資訊中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的數據。

成立三十年來,GenBank數據庫成為了最重要的也是最有影響力的生物全領域數據庫,其數據正被全球數以百萬計的研究人員獲取與引用。GenBank中的數據量正以每18個月翻一番的速度持續指數增長[2][3],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[4]

歷史

[編輯]

1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組頁面存檔備份,存於互聯網檔案館)的Walter Goad英語Walter Goad等人建立了洛斯阿拉莫斯序列數據庫,最終成為了公共的 GenBank數據庫的前身[5]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。

在20世紀80年代中期,史丹福大學的Intelligenetics bioinformatics公司與LANL合作經營着GenBank項目[6]。作為最早的互聯網生物資訊學社區項目,GenBank計劃為生物學家打造一個開放獲取BIOSCI英語BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術資訊中心[7]

Genbank和歐洲分子生物學實驗室(EMBL)在1986/1987年出版的《核苷酸序列》第一至第七卷
Genbank v100版本的CDRom

發展

[編輯]
GenBank中鹼基對數目的增長,1982年到2018年,半對數圖

在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[8]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[4]。 GenBank數據庫還包括一些額外的數據集,不包括在這個統計內。

GenBank中鹼基數前二十的物種(版本 191)[9]
物種 鹼基對
智人 Homo sapiens 1.6310774187×10^10
小家鼠 Mus musculus 9.974977889×10^9
褐鼠 Rattus norvegicus 6.521253272×10^9
家牛 Bos taurus 5.386258455×10^9
玉米 Zea mays 5.062731057×10^9
野豬 Sus scrofa 4.88786186×10^9
斑馬魚 Danio rerio 3.120857462×10^9
紫色球海膽英語Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1.435236534×10^9
普通獼猴 Macaca mulatta 1.256203101×10^9
水稻 Oryza sativa Japonica Group 1.255686573×10^9
煙草 Nicotiana tabacum 1.197357811×10^9
非洲爪蟾 Xenopus (Silurana) tropicalis 1.249938611×10^9
黑腹果蠅 Drosophila melanogaster 1.11996522×10^9
黑猩猩 Pan troglodytes 1.008323292×10^9
阿拉伯芥 Arabidopsis thaliana 1.144226616×10^9
家犬 Canis lupus familiaris 951,238,343
釀酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麥 Triticum aestivum 898,689,329

參閱

[編輯]

參考文獻

[編輯]
  1. ^ UCSC下載頁面顯示「NCBI對GenBank數據的使用或分發不做任何限制。但是,一些提交者可能對其提交的全部或部分數據主張專利英語Biological patent、版權或其他知識產權。NCBI無法評估此類主張的有效性,因此無法對GenBank中包含的資訊的使用、複製或分發提供評論或無限制許可。」The at says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim Biological patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank."
  2. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942可免費查閱. PMID 18073190. doi:10.1093/nar/gkm929. 
  3. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462可免費查閱. PMID 18940867. doi:10.1093/nar/gkn723. 
  4. ^ 4.0 4.1 GenBank release notes. NCBI. [2013-12-02]. (原始內容存檔於2016-12-22). 
  5. ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始內容存檔於2008-11-07). 
  6. ^ LANL GenBank History. [2013-12-02]. (原始內容存檔於2016-03-03). 
  7. ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520可免費查閱. PMID 2326192. doi:10.1093/nar/18.6.1517. 
  8. ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190可免費查閱. PMID 23193287. doi:10.1093/nar/gks1195. (原始內容存檔於2020-05-14). 
  9. ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681可免費查閱. PMID 21071399. doi:10.1093/nar/gkq1079. 


外部連結

[編輯]