Важную роль в реализации биоинформационных исследований на сегодня играет National Center for Biotechnological Information, NCBI (www.ncbi.nlm.nih.gov), разрабатывающий новые информационные технологии для исследования молекулярно-генетических процессов. Это создание систем хранения и анализа биологической информации, передовые технологии обработки информации, облегчение доступа к БД и программному обеспечению, координация проектов по сбору биотехнологической информации в мировом масштабе.
NCBI обслуживает БД последовательностей DNA GenBank: создаются записи о структуре расшифрованных последовательностей (данные научных публикаций, информация от исследователей) и осуществляется обмен ими с EMBL - European Molecular Biology Laboratory (http://www.embl.org/) и DDBJ DNA - Data Bank of Japan (http://www.ddbj.nig.ac.jp/index-e.html).
Информационно-поисковая система NCBI интегрирует информацию, содержащуюся во всех БД, - DNA, RNA, белковых последовательностей и структур, геномов, таксономии, библиографии и других, а также содержит различные стандартные программы биоинформатики (например, BLAST).
Ключевые элементы NCBI
1. PubMed (http://www.ncbi.nlm.nih.gov/pubmed)
Раздел научной литературы, содержит поисковый сервис Национальной медицинской библиотеки (National Library of Medicine, USA). Поддерживает online-связь с журналами, на сайте располагается руководство PubMed; каждой статье присваивается уникальный номер PMID.
2. GenBank (http://www.ncbi.nlm.nih.gov/genbank/)
БД генетических последовательностей, аннотированная коллекция всех общедоступных последовательностей DNA.
3. RefSeq (http://www.ncbi.nlm.nih.gov/refseq/)
БД референсных последовательностей (Reference Sequences) - важнейший элемент NCBI. Содержит неповторяющиеся последова-