Brincando de Comparar Códons

Sou daquelas pessoas que simplesmente não conseguem dormir direito com um mistério. Essa é uma obsessão que provavelmente muitos cientisas (e “wannabe scientists”, como eu) têm. Às vezes ficamos obcecados com uma coisa muito importante, às vezes com uma coisa banal e muitas vezes com algo que você nunca parou para pensar direito. O mais emocionante é que qualquer resposta de uma dúvida tem aquela probabilidade mágica de revelar algo impressionante ou bem útil. Hoje (dia dessa postagem), fiquei obcecado por tentar entender “na prática” qual é a grande ideia da otimização de códons e o quanto os organismos podem ter preferências de códons diferentes.  Aqui está o registro da investigação do pequeno mistério de hoje!

Códons, Otimizações e Preferências

Antes de discorrer sobre o que andei brincando. Uma pequena contextualização ao intrépido viajante sobre o que são códons, porque eles precisam ser otimizados e o que diabos é essa “preferência de códons”.

Códons são os trios de combinações de letrinhas A,T,C e G do DNA (os nucleotídeos) que, depois de transcritos a RNA (em que a grande diferença é que os “T’s” são substituídos por “U’s”), são literalmente traduzidos em aminoácidos; ou seja: três nucleotídeos codificam um  aminoácido. A grande coisa dos códons é que eles são redundantes: existe mais de uma maneira de um aminoácido específico ser traduzido à partir dos trios de nucleotídeos. Os cientistas fizeram uma tabela espertinha que “decodifica” nucleotídeos em aminoácidos:

codons_aminoacids_table

Comece lendo do centro até às bordas do círculo combinando as letras que você for olhando pelo caminho. Por exemplo: U+A+C = Tyr, abreviação de Tirosina.

 Mas aí você se pergunta: “Querida Natureza, qual é o propósito disso!?”. A redundância da leitura de aminoácidos tem uma implicação muito importante na conservação do código genético; ela é a última barreira espertinha da contra mutações no DNA. Imagine que o “C” do códon UAC que traduz uma Tirosina fosse mutado e virasse um “U” (dando UAU): graças à redundância de tradução, o aminoácido Tirosina ainda continua sendo traduzido! Pra  se ter uma ideia de como isso é importante, uma única substituição de aminoácidos (o que pode acontecer com uma única mutação de nucleotídeos) já pode gerar doenças (pesquise sobre Anemia Falciforme).

Enfim, concluindo: existem muitos códons que podem ser traduzidos em diferentes tipos de aminoácidos. Como existem muitas opções, diferentes organismos costumam a ter preferências por diferentes códons para traduzir aminoácidos específicos – por exemplo: nós Humanos adoramos traduzir Arginina como AGA e AGG, já uma das bactérias do nosso cocô, a E.coli, acha muito mais interessante traduzir Arginina como CGU e CGC. Vai entender esses procariotos viu!

Mas porque isso acontece? Porque evolutivamente cada espécie foi selecionada em um ambiente particular, o que implica em diferentes necessidades de estabilidade do DNA em diferentes contextos, e portanto diferentes porcentagens de C e G, e A e T no genoma. Essas porcentagens direcionam quais códons os organismos preferem.

Por causa de tudo isso, quando algum cientista vai fazer o design de um pedaço de DNA, é preciso colocar a sequência no contexto do organismo a ser utilizado, deixando os códons “otimizados” para cada ser vivo – caso contrário, os genes inseridos no organismo serão pouco ou nada expressos.

Investigando leveduras

Mais profundamente, resolvi brincar dessas coisas querendo responder uma pergunta: “O quão compatível os códigos genéticos de duas espécies de leveduras podem ser?”. No caso, Pichia pastoris e Saccharomyces cerevisiae.

Primeiramente eu entrei no “Codon Usage Database“. Procurando por Pichia e Saccharomyces, o site dá uma tabela com a frequência de se encontrar determinado códon a cada mil pares de base. Eu peguei os resultados e coloquei num site chamado “Text Diff” – ele compara dois textos e mostra as diferenças e igualdades entre os dois. Com a comparação, dei print screen e destaquei as frequências mais discrepantes entre as duas espécies de levedura, obtendo o seguinte diagrama:

Comparação Pichia e Saccharomyces - códons

Texto em vermelho: Pichia. Texto em Verde: Saccharomyces. Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Fui atrás de cada códon, procurando o que codifica. Cheguei na seguinte tabela:

 Pichia Versus Saccharomyces Table

Eu chamei de “eficiência de códons” o quão os códons de Pichia funcionam em Saccharomyces, tomando como “códons incompatíveis” aqueles com diferença de no mínimo 4 entre as frequências de códon em cada espécie (a marcação em amarelo na imagem de comparação das frequências) – também estou tomando como hipótese que há uma relação direta entre frequência de códon e a preferência do mesmo por determinada espécie. Cheguei nesses valores através da porcentagem do número de códons “compatíveis” (totais –  incompatíveis). De 20 aminoácidos possíveis, apenas 7 seriam seus códons prontamente compatíveis.

Ambas as espécies são leveduras, e por isso eu esperava uma maior compatibilidade natural. O problema é que eu não tenho um controle para saber se a usagem de códons de cada levedura é realmente discrepante. Por isso, fiz a mesma comparação entre Pichia e E.coli. Como esses organismos são bem mais diferentes (um é eucarioto e outro procarioto), esperei uma diferença bem maior. (veja imagem abaixo)

Comparação Pichia e Ecoli - códons

Texto em vermelho: Pichia. Texto em Verde: E.coli. Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Legenda: Laranja – diferença de 4 a 5; Rosa – diferença de 6 a 9; Amarelo – diferença acima de 10; Códons circulados – frequências iguais.

Como esperado, dá pra ver claramente o quanto E.coli e Pichia são diferentes em comparação com Pichia e Sccharomyces. Nesse panorama, eu diria em Pichia e Saccharomyces são bem parecidas. Quanto mais comparações forem feitas mais certeza se terá do quão um organismo se parece com outro.

Otimização de Códons

Apesar de eu não ter certeza da relação direta entre frequência e preferência de códon, consegui observar coisas muito interessantes: a única inviabilidade de tradução correta entre Pichia e Saccharomyces de aminoácido é o Glutamato, em que as frequências de todas as possibilidades de códons não entram na minha classificação de “códons compatíveis” (diferença de frequência menor que 3). O resto dos códons podem ser compatibilizados entre espécies usando-se versões alternativas de códon para um mesmo aminoácio! 🙂

Quando se otimizam códons para deixar um plasmídeo compatível em diferentes plataformas, faz-se exatamente isso. O problema é que mesmo assim a expressão ainda não é ótima, então em geral prefere-se “sacrificar” a compatibilidade do plasmídeo em diferentes espécies para se ter um plasmídeo com os melhores códons em cada bichinho.

Existem vários programas que fazer essa otimização de códons rapidamente, mas em geral as empresas que sintetizam DNA já incluem isso (de graça ou não) no planejamento do plasmídeo a ser sintetizado.

Conclusão

Por fim, a conclusão que tirei disso tudo é: eu ACHO que um gene de Pichia funcionaria suficientemente bem em Saccharomyes e vice-versa. No caso de não conseguirmos sintetizar os genes que precisamos já códon-atimizados, talvez valha a pena fazer uma mistureba de DNA interespécies – mas só para as leveduras!