Debido a la gran cantidad de información que actualmente manejamos, se ha hecho necesaria la utilización de tecnologías de la información aplicadas a la gestión y análisis de datos biológicos para hacerlo de una forma cada vez más eficaz. Para ello se emplea diversas herramientas informáticas, entre ellas, los bancos de datos y los buscadores.
El Centro Nacional de Biotecnología (NCBI), es el líder de los suministradores de información americanos. Se eligió el NLM (Nacional Library of Medicine) para albergarlo debido a su experiencia en el mantenimiento de bases de datos biomédicas y porque, como parte del NIH (National Institutes of Health), podría iniciar un programa de investigación en biología computacional. Éste ha desarrollado diversos bancos de datos.
El primero a destacar es Pubmed, un banco de datos bibliográfico. El sistema de búsqueda es fácil y está sistematizado, de manera que se puede introducir cualquier búsqueda desde las diferentes pantallas que van apareciendo, sin necesidad de recurrir a la página principal, así se pueden ir introduciendo datos o términos, devolviendo los resultados en forma de listado bibliográfico.
Nucleotide contiene una colección de secuencias de DNA. Cuenta con grupos de anotadores que crean registros de datos de secuencias a partir de la literatura científica y junto con la información obtenida directamente a partir de los autores e intercambian los datos obtenidos con las bases de datos de nucleótidos internacionales. Actualmente ha sido dividido en tres subsecciones para facilitar la búsqueda, según la secuencia que se desee encontrar. Para acceder a las distintas informaciones que alberga cuenta con un buscador que devuelve los resultados en un listado de fichas, que al pulsar sobre ellas te enlazan directamente con las secuencias buscadas.
El banco de datos
Protein contiene información acerca de las proteínas existentes en numerosos organismos. Este utiliza un buscador (Entrez) para que el usuario pueda acceder fácilmente a la información, la cual ha sido compilada de diversas fuentes (SwissProt, PIR, PRF, PDB, GenBank, RefSeq), devolviendo la información al igual que en Nucleotide mediante un listado de fichas.
Debajo de la caja de búsqueda de Entrez existe una barra con la diferentes opciones posibles, pudiendo realizar búsquedas en un solo banco de datos o simultáneamente en todos los bancos que se mencionan en este informe (exceptuando Kegg), siempre y cuando se escriba el término en inglés. Une la información de Protein con la del banco de datos Taxonomy, permitiendo sí encontrar información taxonómica de una secuencia de proteínas ya buscada. La información aparece reflejada en un cuadro que indica el banco de datos de procedencia así como el número de veces que aparece dicho dato.
Taxonomy contiene los nombres de todos los organismos que están representados en los bancos de datos genéticos con al menos una secuencia de nucleótidos o proteínas. Se puede acceder a la información mediante un listado de enlaces directos de algunos de los organismos más utilizados, colocados por orden alfabético o, si no aparece en este, mediante Entrez. Este banco te proporciona datos como un listado de sinónimos y el nombre científico completo del organismo.
OMIM (Online Mendelian Inheritance in Man) es un catálogo de genes humanos y enfermedades genéticas. Es un banco de datos abierto al publico, permite consultar diagnósticos a nivel personal gracias a el buscador, el cual devuelve la información, ya sea textualmente o por referencias, mediante un listado de fichas.
Otro banco de datos de especial interés, pero que no ha sido desarrollado por el NCBI es KEGG (Kyoto Encyclopedia of Genes and Genomes). Fue desarrollado con el objetivo de obtener una representación computerizada completa y lo más exacta posible tanto de los procesos celulares como del comportamiento del organismo. Está dividido a su vez en tres bancos de datos: Genes, Ligand, Brite y Pathway . Este último contiene información de distintas rutas metabólicas y moléculas complejas, acompañadas de gráficos muy completos que contienen enlaces que te explican con más precisión las sustancias que intervienen en cada ruta. Desde la página principal se puede acceder a la información mediante un buscador o yendo directamente a los bancos en los que se divide. La información encontrada aparece en forma de listado.