Bancos de dados, GenBank, homólogos e ortólogos.
Este final de semana montei uma nova página do synbiobrasil, na qual reuni os principais bancos de dados (http://synbiobrasil.org/databases/) de informações biológicas úteis para pesquisas.
Vou dar um exemplo de como utilizar o GenBank, que é um banco de dados de sequências de DNA e de aminoácidos do Centro Nacional de Informação Biotecnológica dos EUA. Além de concentrar informações sobre o sequências genéticas de milhares de seres vivos, o NCBI fornece uma série de ferramentas para trabalhar com essas informações. Uma delas é o Blast (basic local aligment search tool) que permite encontrar similaridades entre sequências de DNA.
Vamos a um exercício:
1. Entre no site: http://blast.ncbi.nlm.nih.gov/Blast.cgi
2. Escolha a opção Nucleotide Blast: para realizarmos uma comparação entre uma sequência de nucleotídeos com o banco de dados do GenBank
3. Recorte e cole esta sequência de DNA (sequência de DNA humano):
1 ggcacgtgac ggtcgggccg cctccgcctc tctctttact gcggcgcggg gcaagatcat
61 ggaagggaag tggttgctgt gtatgttact ggtgcttgga actgctattg ttgaggctca
121 tgatggacat gatgatgatg tgattgatat tgaggatgac cttgacgatg tcattgaaga
181 ggtagaagac tcaaaaccag ataccactgc tcctccttca tctcccaagg ttacttacaa
241 agctccagtt ccaacagggg aagtatattt tgctgattct tttgacagag gaactctgtc
301 agggtggatt ttatccaaag ccaagaaaga cgataccgat gatgaaattg ccaaatatga
361 tggaaagtgg gaggtagagg aaatgaagga gtcaaagctt ccaggtgata aaggacttgt
421 gttgatgtct cgggccaagc atcatgccat ctctgctaaa ctgaacaagc ccttcctgtt
481 tgacaccaag cctctcattg ttcagtatga ggttaatttc caaaatggaa tagaatgtgg
541 tggtgcctat gtgaaactgc tttctaaaac accagaactc aacctggatc agttccatga
601 caagacccct tatacgatta tgtttggtcc agataaatgt ggagaggact ataaactgca
661 cttcatcttc cgacacaaaa accccaaaac gggtatctat gaagaaaaac atgctaagag
721 gccagatgca gatctgaaga cctattttac tgataagaaa acacatcttt acacactaat
781 cttgaatcca gataatagtt ttgaaatact ggttgaccaa tctgtggtga atagtggaaa
841 tctgctcaat gacatgactc ctcctgtaaa tccttcacgt gaaattgagg acccagaaga
901 ccggaagccc gaggattggg atgaaagacc aaaaatccca gatccagaag ctgtcaagcc
961 agatgactgg gatgaagatg cccctgctaa gattccagat gaagaggcca caaaacccga
4. Em database, escolha a opção “Nucleotide collection”
5. Clique em Blast no final da página e aguarde a atualização da página.
Pronto, você acaba de comparar uma sequência de DNA humano com o banco de dados do GenBank. Isto permite que você compare o gene humano com todos os genes do banco de dados. Você pode ver que existem versões do mesmo gene para ratos, camundongos, galinhas,…
Com esses resultados podemos discutir alguns conceitos interessantes:
O que é um gene homólogo?
O gene homólogo a outro quer dizer que eles possuem um ancestral em comum, refletido na sua sequência de DNA comum. Se comparar as sequências de DNA, você vai ver que existem regiões entre o humano e o rato que possuem regiões idênticas, que provavelmente se mantiveram conservadas do ancestral comum (ou convergiram para a mesma sequência ao longo do tempo).
O que é um gene ortólogo?
Um gene ortólogo de um outro significa que eles são de espécies diferentes, (1) que possuem um ancestral comum e (2) a proteína codificada por este código genético manteve suas propriedades e funções. Você pode verificar isto, ao pegar um gene homólogo humano e colocá-lo em uma levedura com o gene homólogo inativado. Se por acaso, o gene humano restabelcer o comportamento normal da levedura, você saberá que aquele gene manteve sua função e pode ser considerado um ortólogo àquele gene homólogo de levedura.
O que é uma enzima?
Uma enzima é proteína que atua como um catalisador químico, que aumenta a velocidade ou facilita uma reação química. Uma enzima chamada glicosidase, por exemplo, quebra ligações químicas encontradas em açúcares, uma protease quebra proteínas, uma quinase adiciona fosfatos (PO4) a uma proteína, …. Proteínas estão envolvidas no metabolismo, na sinalização celular, etc…
Bacana né? Existe um monte de informação disponível nesses sites que podem ser acessadas gratuitamente para qualquer tipo de pesquisa! Bom proveito.