GenBank
| 內容 | |
|---|---|
| 說明(描述) | 超過300,000種生物體的核苷酸序列,並附有支持性書目和生物學注釋。 |
| 獲取的資料類型 |
|
| 有機體(生物) | 全部 |
| 相關資訊 | |
| 研究中心 | 美國國家生物技術資訊中心(NCBI) |
| 主要參考文獻(引用) | PMID 21071399 |
| 發布日期 | 1982年 |
| 訪問 | |
| 資料格式 | |
| 網站 | NCBI |
| 下載網址 | ncbi ftp |
| 網絡服務網址 | |
| 工具 | |
| 網絡 | BLAST |
| 獨立 | BLAST |
| 其它資訊 | |
| 許可 | 不清楚[1] |
基因銀行(英語:GenBank,另譯基因庫、基因資料庫)是一個開放獲取的序列資料庫,對所有公開可利用的核苷酸序列與其轉譯的蛋白質進行收集並注釋。
此資料庫是國際核酸序列資料庫協作組織(INSDC)的一部分,由美國國家生物技術資訊中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的資料。
成立三十年來,GenBank資料庫成為了最重要的也是最有影響力的生物全領域資料庫,其資料正被全球數以百萬計的研究人員獲取與引用。GenBank中的資料量正以每18個月翻一番的速度持續指數增長[2][3],在2013年2月的版本194中,資料庫包含有1.62億個序列,含有1500億個核苷酸堿基。[4]
歷史
[編輯]1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組 (頁面存檔備份,存於網際網路檔案館)的Walter Goad等人建立了洛斯阿拉莫斯序列資料庫,最終成為了公共的 GenBank資料庫的前身[5]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。
在20世紀80年代中期,史丹佛大學的Intelligenetics bioinformatics公司與LANL合作經營著GenBank項目[6]。作為最早的網際網路生物資訊學社區項目,GenBank計劃為生物學家打造一個開放獲取的BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術資訊中心[7]。


發展
[編輯]
在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[8]
截至2013年7月8日[update],GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[4]。 GenBank資料庫還包括一些額外的資料集,不包括在這個統計內。
| 物種 | 鹼基對 |
|---|---|
| 智人 Homo sapiens | 1.6310774187×1010 |
| 小家鼠 Mus musculus | 9.974977889×109 |
| 褐鼠 Rattus norvegicus | 6.521253272×109 |
| 家牛 Bos taurus | 5.386258455×109 |
| 玉米 Zea mays | 5.062731057×109 |
| 野豬 Sus scrofa | 4.88786186×109 |
| 斑馬魚 Danio rerio | 3.120857462×109 |
| 紫色球海膽 Strongylocentrotus purpuratus | 1.435236534×109 |
| 普通獼猴 Macaca mulatta | 1.256203101×109 |
| 水稻 Oryza sativa Japonica Group | 1.255686573×109 |
| 菸草 Nicotiana tabacum | 1.197357811×109 |
| 非洲爪蟾 Xenopus (Silurana) tropicalis | 1.249938611×109 |
| 黑腹果蠅 Drosophila melanogaster | 1.11996522×109 |
| 黑猩猩 Pan troglodytes | 1.008323292×109 |
| 阿拉伯芥 Arabidopsis thaliana | 1.144226616×109 |
| 家犬 Canis lupus familiaris | 951,238,343 |
| 釀酒葡萄 Vitis vinifera | 999,010,073 |
| 原雞 Gallus gallus | 899,631,338 |
| 大豆 Glycine max | 906,638,854 |
| 普通小麥 Triticum aestivum | 898,689,329 |
參閱
[編輯]- Ensembl
- 人類蛋白質參考資料庫(HPRD)
- 序列分析
- 通用蛋白質資源庫(UniProt)
- 已定序真核生物基因組列表
- 已定序古菌基因組列表
- 參考序列 — 參考序列資料庫
- Geneious — 包括GenBank提交工具
- 開放科學資料
- 開放標準
參考文獻
[編輯]- ^ UCSC的下載頁面顯示「NCBI對GenBank資料的使用或分發不做任何限制。但是,一些提交者可能對其提交的全部或部分資料主張專利、版權或其他智慧財產權。NCBI無法評估此類主張的有效性,因此無法對GenBank中包含的資訊的使用、複製或分發提供評論或無限制許可。」The at says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim Biological patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank."
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942
. PMID 18073190. doi:10.1093/nar/gkm929.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462
. PMID 18940867. doi:10.1093/nar/gkn723.
- ^ 4.0 4.1 GenBank release notes. NCBI. [2013-12-02]. (原始內容存檔於2016-12-22).
- ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始內容存檔於2008-11-07).
- ^ LANL GenBank History. [2013-12-02]. (原始內容存檔於2016-03-03).
- ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520
. PMID 2326192. doi:10.1093/nar/18.6.1517.
- ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190
. PMID 23193287. doi:10.1093/nar/gks1195. (原始內容存檔於2020-05-14).
- ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681
. PMID 21071399. doi:10.1093/nar/gkq1079.
本條目引用的公有領域材料來自美國國家生物技術資訊中心的文檔《NCBI Handbook》。
外部連結
[編輯]- GenBank
- 血紅素β序列記錄示例
- BankIt
- Sequin — 由NCBI開發的獨立軟體工具,用於向GenBank序列資料庫提交和更新條目。
- EMBOSS — 免費的開源分子生物學軟體
- GenBank、RefSeq、TPA和UniProt:名稱代表什麼?