Calculadora para sítios de ligação com ribossomos (RBS)

RBSUm objetivo central da biologia sintética é programar células para desenvolver funções valiosas. À medida que se constroem sistemas genéticas maiores e mais complexos (como os de escala genômica), serão necessários modelos e técnicas para combinar as partes genéticas de maneira eficiente para se atingir um comportamento específico. Para isso, serão necessários modelos biofísicos que descrevam a relação de uma sequência de DNA que a sua função. Um passo muito importante nesse sentido foi dado pelo Grupo do Prof. Howard Salis, pesquisador que eu tenho o prazer de trabalhar dentro do Synberc, com o desenvolvimento da calculadora de RBS (ribossomal binding site ou sítio de ligação com o ribossomo). Engenharia genética de microrganismos é um processo tempo intensivo (por ex. o desenvolvimento de uma nova rota metabólica para a produção de um produto químico pode levar de 5 a 10 anos de P&D para chegar a etapa industrial) que normalmente requer múltiplas rodadas de tentativas e erro utilizando mutações aleatórias. À medida que se torna possível construir sistemas gênicos cada vez mais complexo (incluindo genomas completos), métodos automatizados para montagem desses sistemas e para otimização de vias metabólicas se tornam necessários para diminuir custos e tempo de desenvolvimento. Além disso, com o aumento da complexidade do sistema, a aplicação de métodos de tentativa e erro para sua otimização se torna cada mais difícil e ineficaz. Uma maneira de otimizar um sistema gênico é através da variação da sequencia de seus elementos regulatórios para controlar os níveis de expressão de suas proteínas codificadoras. Cada passo limitante na expressão de um gene oferece a oportunidade para modular racionalmente os níveis de expressão proteica. Em bactérias, sítios de ligação do ribossomo e outras sequencias regulatórias de RNA são elementos de controle eficientes para o início da tradução. Como consequência, essas sequências são comumente modificadas para a otimização de circuitos genéticos. Vias metabólicas e expressão de proteínas recombinantes. Assita um video bem interessante no Youtube sobre tradução. Não é mostrado no video (e não consegui encontrar um melhor) o RBS é uma sequencia do RNA que direciona o ribossomo para o start codon, ele complementar a região do rRNA 16S que é parte da subunidade pequena 30S do ribossomo. Basicamente, quando mais complementar o RBS é ao 16S rRNA, maior é a afinidade e maior é a taxa de tradução. Como foi descrito no video, a tradução em bactérias (procariotos) consiste em quatro fases: iniciação, elongamento, terminação e o turnover do ribossomo (na verdade, esta última fase não foi mostrada no video). Na maioria dos casos, o início da transcrição é o gargalo do processo inteiro. O taxa de iniciação de transcrição se dá pela combinação de diferentes efeitos moleculares: incluindo a hibridação do rRNA 16S com a sequencia do RBS, a ligação do tRNA formilmetionina ao start codon, a distância entre o síto de ligação do rRNA 16S e o start códon, e a presença de estruturas secundárias de RNA que podem obstruir o RBS ou o start codon. Para o otimização de expressão de genes, é muito comum o desenvolvimento de bibliotecas de sequencias de RBS com o objetivo de otimização de funções de sistemas gênicos. Porém, a construção e seleção de bibliotecas de sequências se torna impraticável com o aumento de proteínas no sistema. Por exemplo, para realizar mutações randômicas em 4 nucleotídeos para um RBS resulta em uma biblioteca de 256 sequencias. O tamanho da biblioteca aumenta combinatoriamente com o número de proteínas do sistema, ou seja, 16,7 milhões de sequências para um sistema com 3 proteínas e 2,8 x 1014 sequencias para um sistemas com 6 proteínas). Dessa maneira, se torna necessários processos mais racionais para avaliar sequencias de RBS. A calculadora de RBS utiliza um modelo estatístico termodinâmico para predizer a taxa de iniciação de tradução de uma proteína. Dado um RBS e a região codificadora da proteína, o modelo é capaz de calcular a mudança de energia livre durante a montagem do complexo ribossomal 30S no RNAm (ΔGTOT). Depois, o modelo estatístico é capaz de correlacionar a taxa de início de transcrição com o ΔGTOT. Dessa maneira, o modelo biofísico preenche uma lacuna de desenho racional de RBS, criando uma relação quantitativa entre um sequencia de letras (As, Gs, Cs e Us) e um número (taxa de iniciação de tradução). A calculadora de RBS, portanto, combina um modelo biofísico com otimização estocástica para identificar uma sequência sintética (não natural) de RBS que irá proporcionar a taxa de início de tradução desejada. É importante destacar que esta relação também depende dos 35 nucleotídeos iniciais da região codificadora da proteína e que o RBS sintético precisa ser desenhada com esta sequencia incluída. A calculadora de RBS está disponível do site do laboratório do Salis . E é muito simples de utilizar, basta criar uma conta de usuário, recortar e colar as sequências, e definir uma ou mais taxas de iniciação de transcrição. RBS calculator

Outras ferramentas para controle de transcrição também estão disponíveis como a Small RNA Calculator.

Bons experimentos!

Salis, H., Mirsky, E., & Voigt, C. (2009). Automated design of synthetic ribosome binding sites to control protein expression Nature Biotechnology, 27 (10), 946-950 DOI: 10.1038/nbt.1568

Entenda a Engenharia Metabólica

ResearchBlogging.orgUma das grandes maravilhas da humanidade – objeto de grande satisfação entre os químicos – é uma tabela que nos diz tudo o que existe no universo, os cerca de 120 elementos que formam tudo aquilo que o ser humano conseguiu perceber. Usando essa mesma ideia, cientistas conseguiram determinar 12 substâncias principais que podem produzir tudo… o que existe dentro de uma célula! Esse é um dos princípios fundamentais da Engenharia Metabólica, entenda o porquê:

Os 12 Precursores Principais

Tudo o que uma célula consome sempre produz compostos que chamamos de “precursores principais”. São esses precursores que podem gerar tudo dentro da célula: desde seu DNA até às membranas celulares. Na bactéria E.coli, por exemplo, existem 12 dessas substâncias principais: Eritrose 4-fosfato, o famoso Acetil CoA,  Frutose 6-fosfato, Glucose 6-fosfato, Alfa-cetoglutarato, Oxaloacetato, Ribose 5-fosfato, Fosfoenolpiruvato, 3-fosfoglicerato, Piruvato (esse carinha é famoso também), Triose-fosfato e Succinil CoA. Isso quer dizer que a grande maioria de todas a milhares de reações dentro da E.coli em algum momento formam e/ou consomem essas substâncias em suas etapas de reação.

Assim, ao melhor estilo dos antigos alquimistas, pesquisadores – em especial FC Neidhardt – dissecaram células de E.coli de modo a determinar a quantidade desses precursores que seria necessária para “construir” uma bactéria (ver infográfico acima):

Ou seja, todos os precusores somados às moléculas para se realizar oxidações (NAD), reduções (NADPH) e fornecer energia (ATP), resultam em 1 mol de “XR”, que é a quantidade de biomassa produzida com esses compostos, ou “1 mol de células” (definida aqui como a quantidade de células em 10^6g). XR seria um arcabouço que abarca todas as proteínas,  lipídeos e  nucleotídeos da célula; por isso não podemos dizer que essa é de fato uma equação química, mas uma “pseudo-equação química”, afinal dá pra ver claramente que as quantidades das substâncias não se conservam em termos estequiométricos – pra falar a verdade, não há nem a representação de elementos, são só siglas.

Enfim, esse é o mais próximo que chegamos do desejo dos alquimistas de obter uma receita para a vida como eles idealizaram, mas apesar de parecer pouco, essa pseudo-reação global de “construção de células” nos permite contabilizar literalmente quais são os recursos que as bactérias têm para produzir coisas que não produzem natualmente, ou seja, nos mostram quais são as cartas em jogo quando se altera um organismo geneticamente. E o nome desse jogo é fluxo, fluxo metabólico.

O Fluxoma

Uma célula é como se fosse uma mini indústria: seus operários são enzimas, a chefia é a informação genética e a matéria prima são os metabólitos externos com o qual se produzem as peças – que são os 12 metabólitos principais – para a linha de montagem: as etapas de reações bioquímicas. Essa pequena empresa é um empreendimento talhado pelo mercado competitivo, ditado pela economia minimizadora de enegia, seguindo a lógica da seleção natural. Igualzinho às empresas de verdade. Mas enfim, a grande pergunta é: o que acontece quando a chefia muda? O que acontece quando modificamos geneticamente um microrganismo? Apenas colocar uma informação genética não natural na “chefia” é o mesmo que colocar um administrador inexperiente no comando de todo um processo produtivo que ele não conhece. É ir contra milhares de anos de seleção natural.

Arte de Pedro Pantai. Visite http://meninodacaixadesapato.blogspot.com.br/

Por exemplo, imagine que a nossa célula é uma fábrica de motos. Depois de muitos anos existindo, decidem colocar uma nova chefia adjunta no comando. O novo chefe adjunto decide colocar uma nova maquinaria e funcionários no chão de fábrica, pois quer ampliar a gama de produtos que a empresa fabrica. A indústria de motos então passa a produzir triciclos; nada mal. O problema é que a nova chefia SÓ faz isso. Ele não comunica os antigos funcionários sobre a nova produção, não compra mais matéria prima e, apesar de desejar que o carro chefe da empresa seja triciclos, não move uma palha para que isso aconteça. Em outras palavras: temos uma fábrica de motos que improvisa na fabricação de triciclos. É aí que entra o engenheiro de produç… Ops, o “engenheiro metabólico”.

O grande problema da nossa indústria de motos é apenas de distribuição das peças, afinal – simplificadamente – a grande diferença do produto antigo para o novo é apenas uma roda. Da mesma maneira, em uma célula a grande diferença entre os componentes que ela já produz para existir (o “XR” da pseudo-reação acima) e as novas substâncias que queremos que ela produza (por modificações genéticas) é apenas uma combinação de quantidades diferentes dos 12 precursores principais que levem às reações de síntese que queremos. Para ter controle dessas reações que levam à XR e/ou ao bioproduto desejado, cria-se o chamado “fluxoma”, a contabilização de todos as taxas de reação (os fluxos) de dentro da célula – da mesma forma que o genoma é a contabilização de toda a informação genética de uma célula.

ATENÇÃO: se a matemática não é sua amiga, tome cuidado com o conteúdo a seguir.

Fluxos Metabólicos

A teoria que se aplica para a determinação desses fluxos baseia-se na simples conservação de masa em um sistema fechado, no caso uma célula ou um compartimento celular fechado com metabólitos; especificando a reversibilidade das reações e quais metabólitos são considerados como internos e externos. A equação geral que descreve a conservação de massa de metabólitos em um sisema de volume definido pode ser escrita como:

Em que C (mol/L) é um vetor da concentração de m metabólitos internos; r ((mol/L)/h) é o vetor do grau de reação, ou seja o fluxo,  de n reações que convertem metabólitos; S é a matriz estequiométrica de dimensões  m x n cujos elementos sij representam o coeficiente estequiométrico do elemento i envolvido na reação j; e μ (1/h) é o grau específico de diluição associado com a mudança no volume de um sistema, o que é muito importante considerar no modelo, pois o graus de diluição afetam diretamente as velocidades de reação. Como em uma célula o grau de diluição é muito baixo quando comparado com os graus de reação, as mudanças de volume no sistema são consideradas negligenciáveis. Temos portanto a equação mais simplificada:

Em um estado estacionário, que é o que se considera na análise de um fluxo metabólico, não há acúmulo de metabólitos, e portanto suas concentrações, bem como a população bacteriana, tornam-se constantes, fazendo com que dC/dt = 0:

A caracterização de reações reversíveis é realizada através da detreminação do sinal de ri, em que ri < 0 delimita a reação ocorrendo no sentido oposto, ri = 0 informa a sua não-ocorrência e ri > 0 indica uma reação ocorrendo no sentido esperado.

Uma outra maneira mais simplista de se entender o mesmo raciocínio, partindo do mesmo princípio de conservação de massa, pode ser:

O que é o mesmo que S.r = 0. Considerando as substâncias envolvidas em várias reações, teremos o mesmo resultado:

OBSERVAÇÃO: Aqui acaba o conteúdo matemático. Pode continuar a ler abaixo, já passou…!

Análise de Vias Metabólicas

Então, como dá pra perceber, tudo se resume a encontrar um sistema de equações – sim, os sisteminhas de equações que você aprende a resolver na escola – que descreva o metabolismo da célula envolvendo os metabólitos principais. É exatamente aqui que entram os dados da pseudo-reação global comentada no início, é ela que define, junto com dados experimentais de consumo de substratos, o conjunto de soluções desse sistema de equações (chamados de “modos elementares”). Os sistemas de equações obtidos por análise das vias metabólicas são sempre indeterminados, uma vez que o número de reações bioquímicas as envolvendo é muito maior que o número de espécies de metabólitos, ou seja: tem-se mais equações que variáveis. A tarefa de programas de análise de vias metabólicas é encontrar possíveis soluções para esse sistema que digam quais são os possíveis fluxos de todas as reações envolvidas, com isso é possível analisar qual modo elementar é o que possui maior rendimento de produção do bioproduto desejado, e portanto quais reações que devem ocorrer no sistema em detrimento de outras.

Por exemplo, vejamos o exemplo da produção de Lisina em Corynebacterium glutamicum. Esse aminoácido é naturalmente produzido em nível basal na célula para manutenção da atividade celular, apenas super-expressando os genes envolvidos nas vias de produção de lisina e nocauteando outros genes que produzem enzimas competidoras (essas são grandes maneiras de se alterar os fluxos metabólicos) da biosíntese de lisina é possível aumentar cerca de 11 vezes a produtividade. Isso pode ser feito sem análise nenhuma. Mas se analisando os fluxos metabólicos (imagem abaixo), vemos que é possível quase dobrar a produção industrial de Lisina à partir da mesma quantidade de glicose. Assim como na analogia entre a indústria e a célula, única diferença foi a distribuição dos fluxos entre os precursores principais da C. Glutamicum, ou seja uma combinação diferente de quantidades dos precursores em diferentes reações.

No caso, um aumento do fluxo metabólico pela via das pentoses (formando Ribulose 5-fosfato) em um processo sem produção de CO2 – realizando o ciclo do glioxilato – aumenta a produção por gerar mais NADPH, necessário na biosíntese de Lisina, e que não é produzida na via “normal” de degradação da glicose (via de Embden-Meyerhoff-Parnas).

O Futuro da Engenharia Metabólica

Muitos dizem que a engenharia metabólica será tão eficiente em otimizar os processos biotecnológicos que substituirá completamente os processos químicos orgânicos no futuro, afinal esse é o grande entrave para termos toda uma indústria baseada em uma bioprodução: os processos químicos são muito mais eficientes. Ter toda a indústria química baseada na produção de materiais por organismos nos daria um mundo mais ecológico e renovável. O grande passo para isso já foi dado com a “synthia“, a bactéria sintética de Craig Venter e seu grupo. O desafio de se fazer engenharia metabólica é justamente o problema que foi eliminado – EDITED: OK, não eliminado, mas amenizado – quando se nocauteou todos os genes não essenciais para a sobrevivência na bactéria produzida por Venter, pois qualquer nova via colocada no microrganismo já estaria quase completamente otimizada, uma vez que não existiriam fluxos “não essenciais” em que a bactéria poderia estar “desperdiçando” energia em vez produzir o bioproduto dos genes com que foi modificada. Assim, como um upgrade da engenharia genética, a engenharia metabólica faz aquilo que torna a Biologia Sintética algo simples e bonito: apenas uma mudança inteligente de como a informação é transmitida; uma mudança de design. No final das contas, mais do que pseudo-realizar os sonhos dos alquimistas, entender os fluxos metabólicos é mudar a maneira como os químicos atuais sonham com o futuro, afinal, porque reinventar como produzir substâncias orgânicas se os próprios organismos podem fazer isso pela gente!? Já está mais do que na hora de reinventarmos nossa indústria.

Referências

Vallino JJ, & Stephanopoulos G (2000). Metabolic flux distributions in Corynebacterium glutamicum during growth and lysine overproduction. Reprinted from Biotechnology and Bioengineering, Vol. 41, Pp 633-646 (1993). Biotechnology and bioengineering, 67 (6), 872-85 PMID: 10699864

Neidhardt, F. C., J. Ingraham, and M. Schaechter. 1990. Physiology of the Bacterial Cell: A Molecular Approach. Sinauer Associates, Sunderland, MA.

Podcast: Futures in Biotech

Preciso divulgar esta dica dada pelo meu estimado colega Atila: o podcast realizado pelo site Futures in Biotech. Já escutei os seis primeiros e são sensacionais. Os dois entrevistadores, Marc Pelletier (Pos-doc em Yale) e Leo Laporte, um especialista em TI interessado em Biotech, conseguem extrair dos entrevistados o conteúdo de suas pesquisas de uma forma simples e ao mesmo tempo profunda. Estou mandando o link das entrevistas mais antigas, acho que vale a pena escutar os episódios dos mais antigos para os mais recentes, para acompanhar os podcasts de uma maneira mais didática.