Brincando de Comparar Códons

Sou daquelas pessoas que simplesmente n√£o conseguem dormir direito com um mist√©rio. Essa √© uma obsess√£o que provavelmente muitos cientisas (e “wannabe scientists”, como eu) t√™m. √Äs vezes ficamos obcecados com uma coisa muito importante, √†s vezes com uma coisa banal e muitas vezes com algo que voc√™ nunca parou para pensar direito. O mais emocionante √© que qualquer resposta de uma d√ļvida tem aquela probabilidade m√°gica de revelar algo impressionante ou bem √ļtil. Hoje (dia dessa postagem), fiquei obcecado por tentar entender “na pr√°tica” qual √© a grande ideia da otimiza√ß√£o de c√≥dons e o quanto os organismos podem ter prefer√™ncias de c√≥dons diferentes.¬† Aqui est√° o registro da investiga√ß√£o do pequeno mist√©rio de hoje!

C√≥dons, Otimiza√ß√Ķes e Prefer√™ncias

Antes de discorrer sobre o que andei brincando. Uma pequena contextualiza√ß√£o ao intr√©pido viajante sobre o que s√£o c√≥dons, porque eles precisam ser otimizados e o que diabos √© essa “prefer√™ncia de c√≥dons”.

C√≥dons s√£o os trios de combina√ß√Ķes de letrinhas A,T,C e G do DNA (os nucleot√≠deos) que, depois de transcritos a RNA (em que a grande diferen√ßa √© que os “T’s” s√£o substitu√≠dos por “U’s”), s√£o literalmente traduzidos em amino√°cidos; ou seja: tr√™s nucleot√≠deos codificam um¬† amino√°cido. A grande coisa dos c√≥dons √© que eles s√£o redundantes: existe mais de uma maneira de um amino√°cido espec√≠fico ser traduzido √† partir dos trios de nucleot√≠deos. Os cientistas fizeram uma tabela espertinha que “decodifica” nucleot√≠deos em amino√°cidos:

codons_aminoacids_table

Comece lendo do centro até às bordas do círculo combinando as letras que você for olhando pelo caminho. Por exemplo: U+A+C = Tyr, abreviação de Tirosina.

¬†Mas a√≠ voc√™ se pergunta: “Querida Natureza, qual √© o prop√≥sito disso!?”. A redund√Ęncia da leitura de amino√°cidos tem uma implica√ß√£o muito importante na conserva√ß√£o do c√≥digo gen√©tico; ela √© a √ļltima barreira espertinha da contra muta√ß√Ķes no DNA. Imagine que o “C” do c√≥don UAC que traduz uma Tirosina fosse mutado e virasse um “U” (dando UAU): gra√ßas √† redund√Ęncia de tradu√ß√£o, o amino√°cido Tirosina ainda continua sendo traduzido! Pra¬† se ter uma ideia de como isso √© importante, uma √ļnica substitui√ß√£o de amino√°cidos (o que pode acontecer com uma √ļnica muta√ß√£o de nucleot√≠deos) j√° pode gerar doen√ßas (pesquise sobre Anemia Falciforme).

Enfim, concluindo: existem muitos c√≥dons que podem ser traduzidos em diferentes tipos de amino√°cidos. Como existem muitas op√ß√Ķes, diferentes organismos costumam a ter prefer√™ncias por diferentes c√≥dons para traduzir amino√°cidos espec√≠ficos – por exemplo: n√≥s Humanos adoramos traduzir Arginina como AGA e AGG, j√° uma das bact√©rias do nosso coc√ī, a E.coli, acha muito mais interessante traduzir Arginina como CGU e CGC. Vai entender esses procariotos viu!

Mas porque isso acontece? Porque evolutivamente cada espécie foi selecionada em um ambiente particular, o que implica em diferentes necessidades de estabilidade do DNA em diferentes contextos, e portanto diferentes porcentagens de C e G, e A e T no genoma. Essas porcentagens direcionam quais códons os organismos preferem.

Por causa de tudo isso, quando algum cientista vai fazer o design de um peda√ßo de DNA, √© preciso colocar a sequ√™ncia no contexto do organismo a ser utilizado, deixando os c√≥dons “otimizados” para cada ser vivo – caso contr√°rio, os genes inseridos no organismo ser√£o pouco ou nada expressos.

Investigando leveduras

Mais profundamente, resolvi brincar dessas coisas querendo responder uma pergunta: “O qu√£o compat√≠vel os c√≥digos gen√©ticos de duas esp√©cies de leveduras podem ser?”. No caso, Pichia pastoris e Saccharomyces cerevisiae.

Primeiramente eu entrei no “Codon Usage Database“. Procurando por Pichia e Saccharomyces, o site d√° uma tabela com a frequ√™ncia de se encontrar determinado c√≥don a cada mil pares de base. Eu peguei os resultados e coloquei num site chamado “Text Diff”¬†– ele compara dois textos e mostra as diferen√ßas e igualdades entre os dois. Com a compara√ß√£o, dei print screen e destaquei as frequ√™ncias mais discrepantes entre as duas esp√©cies de levedura, obtendo o seguinte diagrama:

Comparação Pichia e Saccharomyces - códons

Texto em vermelho: Pichia. Texto em Verde: Saccharomyces. Laranja Рdiferença de 4 a 5; Rosa Рdiferença de 6 a 9; Amarelo Рdiferença acima de 10; Códons circulados Рfrequências iguais.

Fui atrás de cada códon, procurando o que codifica. Cheguei na seguinte tabela:

 Pichia Versus Saccharomyces Table

Eu chamei de “efici√™ncia de c√≥dons” o qu√£o os c√≥dons de Pichia funcionam em Saccharomyces, tomando como “c√≥dons incompat√≠veis” aqueles com diferen√ßa de no m√≠nimo 4 entre as frequ√™ncias de c√≥don em cada esp√©cie (a marca√ß√£o em amarelo na imagem de compara√ß√£o das frequ√™ncias) – tamb√©m estou tomando como hip√≥tese que h√° uma rela√ß√£o direta entre frequ√™ncia de c√≥don e a prefer√™ncia do mesmo por determinada esp√©cie. Cheguei nesses valores atrav√©s da porcentagem do n√ļmero de c√≥dons “compat√≠veis” (totais –¬† incompat√≠veis). De 20 amino√°cidos poss√≠veis, apenas 7 seriam seus c√≥dons prontamente compat√≠veis.

Ambas as espécies são leveduras, e por isso eu esperava uma maior compatibilidade natural. O problema é que eu não tenho um controle para saber se a usagem de códons de cada levedura é realmente discrepante. Por isso, fiz a mesma comparação entre Pichia e E.coli. Como esses organismos são bem mais diferentes (um é eucarioto e outro procarioto), esperei uma diferença bem maior. (veja imagem abaixo)

Comparação Pichia e Ecoli - códons

Texto em vermelho: Pichia. Texto em Verde: E.coli. Laranja Рdiferença de 4 a 5; Rosa Рdiferença de 6 a 9; Amarelo Рdiferença acima de 10; Códons circulados Рfrequências iguais.

Legenda: Laranja Рdiferença de 4 a 5; Rosa Рdiferença de 6 a 9; Amarelo Рdiferença acima de 10; Códons circulados Рfrequências iguais.

Como esperado, d√° pra ver claramente o quanto E.coli e Pichia s√£o diferentes em compara√ß√£o com Pichia e Sccharomyces. Nesse panorama, eu diria em Pichia e Saccharomyces s√£o bem parecidas. Quanto mais compara√ß√Ķes forem feitas mais certeza se ter√° do qu√£o um organismo se parece com outro.

Otimização de Códons

Apesar de eu n√£o ter certeza da rela√ß√£o direta entre frequ√™ncia e prefer√™ncia de c√≥don, consegui observar coisas muito interessantes: a √ļnica inviabilidade de tradu√ß√£o correta entre Pichia e Saccharomyces de amino√°cido √© o Glutamato, em que as frequ√™ncias de todas as possibilidades de c√≥dons n√£o entram na minha classifica√ß√£o de “c√≥dons compat√≠veis” (diferen√ßa de frequ√™ncia menor que 3). O resto dos c√≥dons podem ser compatibilizados entre esp√©cies usando-se vers√Ķes alternativas de c√≥don para um mesmo amino√°cio! ūüôā

Quando se otimizam c√≥dons para deixar um plasm√≠deo compat√≠vel em diferentes plataformas, faz-se exatamente isso. O problema √© que mesmo assim a express√£o ainda n√£o √© √≥tima, ent√£o em geral prefere-se “sacrificar” a compatibilidade do plasm√≠deo em diferentes esp√©cies para se ter um plasm√≠deo com os melhores c√≥dons em cada bichinho.

Existem vários programas que fazer essa otimização de códons rapidamente, mas em geral as empresas que sintetizam DNA já incluem isso (de graça ou não) no planejamento do plasmídeo a ser sintetizado.

Conclus√£o

Por fim, a conclusão que tirei disso tudo é: eu ACHO que um gene de Pichia funcionaria suficientemente bem em Saccharomyes e vice-versa. No caso de não conseguirmos sintetizar os genes que precisamos já códon-atimizados, talvez valha a pena fazer uma mistureba de DNA interespécies Рmas só para as leveduras!