GenBank
| 內容 | |
|---|---|
| 說明(描述) | 超過300,000種生物體的核苷酸序列,並附有支持性書目和生物學註釋。 |
| 獲取的數據類型 |
|
| 有機體(生物) | 全部 |
| 相關資訊 | |
| 研究中心 | 美國國家生物技術資訊中心(NCBI) |
| 主要參考文獻(引用) | PMID 21071399 |
| 發布日期 | 1982年 |
| 訪問 | |
| 數據格式 | |
| 網站 | NCBI |
| 下載網址 | ncbi ftp |
| 網絡服務網址 | |
| 工具 | |
| 網絡 | BLAST |
| 獨立 | BLAST |
| 其它資訊 | |
| 許可 | 不清楚[1] |
基因銀行(英語:GenBank,另譯基因庫、基因數據庫)是一個開放獲取的序列數據庫,對所有公開可利用的核苷酸序列與其轉譯的蛋白質進行收集並註釋。
此數據庫是國際核酸序列數據庫協作組織(INSDC)的一部分,由美國國家生物技術資訊中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的數據。
成立三十年來,GenBank數據庫成為了最重要的也是最有影響力的生物全領域數據庫,其數據正被全球數以百萬計的研究人員獲取與引用。GenBank中的數據量正以每18個月翻一番的速度持續指數增長[2][3],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[4]
歷史
[編輯]1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組 (頁面存檔備份,存於互聯網檔案館)的Walter Goad等人建立了洛斯阿拉莫斯序列數據庫,最終成為了公共的 GenBank數據庫的前身[5]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。
在20世紀80年代中期,史丹福大學的Intelligenetics bioinformatics公司與LANL合作經營着GenBank項目[6]。作為最早的互聯網生物資訊學社區項目,GenBank計劃為生物學家打造一個開放獲取的BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術資訊中心[7]。


發展
[編輯]
在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[8]
截至2013年7月8日[update],GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[4]。 GenBank數據庫還包括一些額外的數據集,不包括在這個統計內。
| 物種 | 鹼基對 |
|---|---|
| 智人 Homo sapiens | 1.6310774187×1010 |
| 小家鼠 Mus musculus | 9.974977889×109 |
| 褐鼠 Rattus norvegicus | 6.521253272×109 |
| 家牛 Bos taurus | 5.386258455×109 |
| 玉米 Zea mays | 5.062731057×109 |
| 野豬 Sus scrofa | 4.88786186×109 |
| 斑馬魚 Danio rerio | 3.120857462×109 |
| 紫色球海膽 Strongylocentrotus purpuratus | 1.435236534×109 |
| 普通獼猴 Macaca mulatta | 1.256203101×109 |
| 水稻 Oryza sativa Japonica Group | 1.255686573×109 |
| 煙草 Nicotiana tabacum | 1.197357811×109 |
| 非洲爪蟾 Xenopus (Silurana) tropicalis | 1.249938611×109 |
| 黑腹果蠅 Drosophila melanogaster | 1.11996522×109 |
| 黑猩猩 Pan troglodytes | 1.008323292×109 |
| 阿拉伯芥 Arabidopsis thaliana | 1.144226616×109 |
| 家犬 Canis lupus familiaris | 951,238,343 |
| 釀酒葡萄 Vitis vinifera | 999,010,073 |
| 原雞 Gallus gallus | 899,631,338 |
| 大豆 Glycine max | 906,638,854 |
| 普通小麥 Triticum aestivum | 898,689,329 |
參閱
[編輯]- Ensembl
- 人類蛋白質參考數據庫(HPRD)
- 序列分析
- 通用蛋白質資源庫(UniProt)
- 已測序真核生物基因組列表
- 已測序古菌基因組列表
- 參考序列 — 參考序列數據庫
- Geneious — 包括GenBank提交工具
- 開放科學數據
- 開放標準
參考文獻
[編輯]- ^ UCSC的下載頁面顯示「NCBI對GenBank數據的使用或分發不做任何限制。但是,一些提交者可能對其提交的全部或部分數據主張專利、版權或其他知識產權。NCBI無法評估此類主張的有效性,因此無法對GenBank中包含的資訊的使用、複製或分發提供評論或無限制許可。」The at says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim Biological patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank."
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942
. PMID 18073190. doi:10.1093/nar/gkm929.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462
. PMID 18940867. doi:10.1093/nar/gkn723.
- ^ 4.0 4.1 GenBank release notes. NCBI. [2013-12-02]. (原始內容存檔於2016-12-22).
- ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始內容存檔於2008-11-07).
- ^ LANL GenBank History. [2013-12-02]. (原始內容存檔於2016-03-03).
- ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520
. PMID 2326192. doi:10.1093/nar/18.6.1517.
- ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190
. PMID 23193287. doi:10.1093/nar/gks1195. (原始內容存檔於2020-05-14).
- ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681
. PMID 21071399. doi:10.1093/nar/gkq1079.
本條目引用的公有領域材料來自美國國家生物技術資訊中心的文檔《NCBI Handbook》。
外部連結
[編輯]- GenBank
- 血紅蛋白β序列記錄示例
- BankIt
- Sequin — 由NCBI開發的獨立軟件工具,用於向GenBank序列數據庫提交和更新條目。
- EMBOSS — 免費的開源分子生物學軟件
- GenBank、RefSeq、TPA和UniProt:名稱代表什麼?