Polimerase Por Segundo

ResearchBlogging.orgA Biologia é imprecisa por natureza, e vice versa. Isso é uma grande dificuldade ao se fazer design de sistemas biológicos sintéticos; aquilo que é muito bonito no papel às vezes nunca pode ser feito por motivos obscuros e por excesso de ruído dos sinais do sistema. Não dá pra prever. Na tentativa de deixar dispositivos sintéticos mais previsíveis, a Biologia Sintética tenta padronizar não somente partes biológicas, mas também os sinais que a compõem a dinâmica de seu sistema. Esses sinais são justamente a passagem de informação entre DNA e o fenótipo desejado, mas… como diabos deixar isso mais preciso e medir a velocidade dessa passagem de informação? Como medir “Polimerases Por Segundo”?

Padronização da Transmissão de Informação

Independente do que um aparelho elétrico faça, existem sinais “universais” que pertencem a todos eles: variações na diferença de potencial, na corrente, no campo elétrico e etc. A transmissão de informação entre os dispositivos eletrônicos que compõem esse aparelho são dadas justamente através desses sinais, fazendo todo o sistema elétrico funcionar. Em circuitos genéticos, sinais análogos à corrente elétrica são as taxas de transcrição e tradução, ou mais especificamente, a velocidade com que – respectivamente – uma polimerase e um ribossomo “leêm” seus nucleotídeos. O problema é que esses sinais (as taxas de transcrição e tradução) não são bons como transmissores de sinais. Entenda o porquê:

PoPS e RiPS: Qual é o sentido disso!?

Para que um transmissor de sinal seja bom, ele precisa facilitar com que dispositivos possam ser facilmente combinados em um sistema – além de ser algo “universal”, como foi dito anteriormente. Foi aí então que, usando experiências da engenharia, os biólogos sintéticos cunharam o termo “PoPS” (Polimerase Per Second – Polimerase Por Segundo) e “RiPS” (Ribossome Per Second – Ribossomo Por Segundo). Muitos pesquisadores acham que a criação desses novos termos é como “reinventar a roda”: qual seria a grande diferença entre isso e as clássicas taxas de transcrição e tradução? A diferença é a abrangência da nova medida. Quando se trata de um sítio operador, um RBS, um RNAm e o próprio gene sendo “lido”, não há diferença alguma em se medir uma taxa de transcrição e o “PoPS” ou uma taxa de tradução e o “RiPS”. Mas faz sentido se medir a taxa de transcrição de um sítio terminador por exemplo!? Esse elemento de DNA, que teoricamente não é transcrito (é ele quem justamente para a transcrição), ainda pode eventualmente ter um “leak” e permitir a passagem de uma polimerase. Usar a expressão “… a taxa de transcrição de um sítio terminador …” não faz sentido nenhum, mas acontece. Se usarmos PoPS, que por definição é o número de vezes que uma RNA polimerase passa por um ponto específico de uma molécula de DNA por unidade de tempo, ainda há sentido, pois nessa definição não importa qual a região do DNA a Polimerase passa. É esse tipo de generalidade que permite o fácil uso e novas combinações de dispositivos sintéticos.

Hierarquia de Abstração

Com a criação de sistemas fáceis de se integrar, os engenheiros biológicos podem se beneficiar de métodos largamente praticados em qualquer campo da engenharia, como a hierarquia de abstração. Com isso é mais simples se lidar com a complexidade de sistemas biológicos quando se omite informações desnecessárias. Desse modo (ver imagem abaixo), alguém trabalhando no nível de abstração das partes biológicas não precisa se preocupar com o design e síntese do DNA que usará, do mesmo modo, alguém trabalhando no nível sistêmico precisa pensar em apenas quais dispositivos incluir e como conectá-los para realizar uma função desejada, sem precisar se preocupar com os outros níveis de abstração.

Imagem retirada de: D. Baker, G. Church, J. Collins, D. Endy, J. Jacobson, J. Keasling, P. Modrich, C. Smolke, and R. Weiss. ENGINEERING LIFE: Building a FAB for biology. Scientific American, pages 44–51, June 2006.

Como medir PoPS?

A maioria dos sistemas criados e estudados hoje em dia em Biologia Sintética envolve controle transcricional da atividade genética, o que faz do PoPS a variável mais difundida na área, principalmente pelas pesquisas envolvendo lógica booleana em sistemas genéticos (portanto não é muito comum encontrar “RiPS” em artigos por aí).
Não existe um método direto para se medir PoPS, mas é possível chegar em seu valor indiretamente através de medições de fluorescência de genes reporter. É possível – se você puder encontrar os parâmetros na literatura ou medí-los – encontrar o PoPS de um dispositivo em cinco passos:

Cinco Passos Para o PoPS

1. Ligação de um Gene Repórter como Output

Antes de mais nada, será preciso de um fluorímetro (é claro) e demum espectofotômetro para medir densidade celular. Como exemplo, vamos observar a parte BBa_F2620:

Esse BioBrick tem como “entrada” a substância de quorum sensing 3-oxohexanoil-homoserina lactona e tem como “saída” PoPS. Em presença de 3OC6HSL, o gene que produz o fator de transcrição luxR promove a transcrição de genes após o Lux pR, na parte final do BioBrick BBa_F2620. Para mensurar o quão ativo o luxpR fica, liga-se outro BioBrick no final do dispositivo para mudar o output do sistema colocando-se o BBa_E0240 – a ORF (Open Reading Frame) do GFP (Green Fluorescent Protein):

Assim tem-se uma nova parte, o BioBrick BBa_T9002:

2. Medição da Fluorescência e Absorbância e Subtração do Background

Para medir a fluorescência do GFP e a absorbância da amostra de células, é preciso criar dois controles: um da absorbância (A) e outro da fluorescência (G). O controle da fluorescência será o próprio BBa_T9002 sem ser induzido pela substância de quorum sensing (G_não-induzido), enquanto o controle da absorbância é feita da maneira trivial, verificando somente a absorbância do meio de cultura (A_background). Para se obter os reais valores de Fluorescência induzida por 3OC6HSL e da densidade celular, basta então subtrair esses valores de background com os valores medidos durante a indução pela substância de quorum sensing:

3. Correlação com a Curva Padrão

Com as correções em mãos, outro procedimento trivial a ser feito é encontrar a curva padrão de fluorescência versus GFP e de absorbância versus número de células. Por exemplo, experimentos feitos em laboratório chegaram a essas retas de correlação de valores:

Em que UFC é “Unidade Formadora de Colônia” – o número de células na amostra. E “GFP” seria o número de moléculas de GFP medidas.

4. Interpolar a Curva de GFP versus Tempo Obtida na Medição

A síntese total de GFP por célula (S_célula) é dada pela taxa de produção de GFP total (S_total) dividida pelo número de células (UFC):

Para encontrar a derivada de [GFP] por tempo, basta plotar os dados de GFP obtidos por tempo e interpolar com uma função logística (provavelmente) para obter a equação que melhor descreve a variação de GFP no tempo.

5. Colocar os Valores Nessa Equação Aqui

Depois de determinada a função Scélula, basta colocá-la nessa fórmula e encontrar o PoPS:

Em que:
a = Taxa de maturação do GFP – 1/s
GammaM = Constante de degradação do RNA – 1/s
GammaI = Constante de degradação do GFP imaturo – 1/s
Rô = Constante de síntese proteica por RNAm (RiPS) – [Proteína]/[RNAm].s
PoPS = Polimerase por segundo – [mRNA]/[DNA].s

CUIDADO: Conteúdo Matemático – Prossiga com Cuidado (Ou não…)

Chega-se nessa expressão através de um pequeno sistema de equações diferenciais:

As equações expressam uma dinâmica simplificada de um sistema de transcrição e tradução de uma informação genética. Para chegar na expressão de PoPS, basta substituir a última equação na segunda e isolar M. Com a expressão resultante, basta substituir a variável M na primeira equação e sua derivada em dM/dt.

ATENÇÃO: Aqui acaba o conteúdo matemático. Está tudo bem agora.

E essa é a história de como você pode encontrar o PoPS – essa variável estranha! – no seu próprio laboratório (ou ao menos entender do que se trata). Assim como um circuito elétrico, que pode ser montado da melhor maneira possível e mesmo assim não funcionar por razões obscuras, sistemas biológicos têm muito mais esse problemático costume de não se comportar como esperado. Contudo essa abordagem mais generalista da atividade transcricional de uma célula é uma boa maneira de se tentar enfrentar o grande desafio de se deixar a biologia mais “engenheirável” e mais “precisa”. Não que essa seja a coisa mais fácil do mundo, mas ela nunca será se ninguém tentar. E estamos aos poucos conseguindo.

Referências:

A Incrível Sociedade dos Microrganismos


ResearchBlogging.orgÉ bem óbvio que um ser humano não existiria sozinho. Não só porque ele não poderia ser gerado, mas porque dificilmente conseguiria sobreviver. Já reparou na quantidade de pessoas que permitem (e permitiram) que você tivesse o dia de hoje como você tem? Cada parafuso, tecido, metal, tijolo e etc que permite você estudar, trabalhar, andar de automóvel, comer e ler esse texto foram pensados, feitos, montados, transportados e vendidos por alguém. Não é possível portanto tentar entender os humanos, bem como a maneira com que eles se comunicam, isoladamente. É preciso olhá-los sistemicamente, como seres sociais. As bactérias também. É cada vez mais reconhecido que as bactérias não existem como células solitárias, mas são como um “organismo colonizador” que elabora complexos sistemas de comunicação que facilitam a sua adaptação às recorrentes mudanças ambientais. E elas nascem poliglotas. A seleção natural esculpiu em diferentes espécies diversos genes que as permitem se comunicar cooperativamente e repressivamente entre espécies e até mesmo entre reinos (como por exemplo em bactérias patogênicas). Damos à essa comunicação bacteriana o nome de “quorum sensing” (“detecção em quórum” – tradução livre).

Quorum Sensing

O termo “quorum sensing” foi cunhado devido à habilidade dos microorganismos expressarem ou aumentarem a expressão de certos genes quando em grande população, podendo dessa forma monitorar a densidade celular (quantidade de células ao seu redor) antes de manifestar algum fenótipo. Um dos exemplos mais ilustrativos disso é da Dictyostelium discoideum, um protozoário que passa uma das fases do seu ciclo de vida produzindo um corpo multicelular. Tem um vídeo bem legal mostrando a formação de um corpo de frutificação através de várias células individuais de Dictyostelium:

[youtube_sc url=http://www.youtube.com/watch?v=vjRPla0BONA]
Reparem rapidamente em 00:30 min as células se locomovendo em “pulsos”, na direção de um local em que todas estão se agregando (é difícil de perceber!). Esse local inicial é em geral onde um grupo de bactérias encontrou alguma fonte de nutrientes. A “pulsação” da locomoção das bactérias acontece devido à substância de quorum sensing que é difundida pelo espaço vinda das células do local de agregação; um pulso inicial provoca – quando em uma população não muito grande, para ser perceptível – um comportamento oscilatório de resposta das células: quando uma célula recebe um sinal (do tipo “Ei, tem comida aqui!”), ela emite um de volta (como se etivesse gritando “Caramba, tem comida lá!”), que é recebido pelas células que mandaram o sinal incialmente (o que seria um “Ótimo! Estou indo praí!”) e por outras ao seu redor, propagando o sinal. Como a transmissão de informação com as substâncias não é imediata e nem totalmente contínua, observa-se os “pulsos”, que são resultado do “gap” entre enviar e receber informações pela difusão de moléculas.

As diferentes Línguas das bactérias

Tabela com exemplos das diferentes famílias de substâncias de QS, as diferentes "línguas" das bactérias. Imagem modificada de S. Atkinson e P. Williams (2009) e de Y. He e L. Zhang (2008). Referências no final do post.

As “línguas”, ou simplesmente certas coisas que as bactérias querem “dizer” (como “Estou afim de dar uma reproduzida!” ou “Fujam, eles estão vindo!”) são “ditas” através de diferentes tipos de substâncias que os microorganismos produzem. No caso da Dictyostelium ali em cima, a substância é AMP cíclico (é quase um ATP, só que duas vezes menos fosfatado… e cíclico, é claro), mas se tratando de bactérias – que ainda é a principal plataforma de aplicação da Biologia Sintética – existem três tipos principais de substâncias de quorum sensing: as acil-homoserinas lactonas (HSL ou AHL), auto-indutores 2 (AI-2) e pequenos ácidos graxos, chamados de “DSF”s (Diffusible Signal Factor – do inglês: Fator Sinalizador Difusível). Existem ainda outras famílias de substâncias de QS, mas aparentemente menos comuns que essas três principais.

O Mecanismo Gênico

A ativação dos sistemas de QS só ocorre em uma alta densidade celular. Isso permite que se chegue uma concentração limiar de substâncias de QS para expressão de genes. 1, 2 e 3 são os três elementos básicos de DNA para se construir um sistema de QS. Imagem modificada de NA. Whitehead et al (2001), referência no final do post.

Para um microrganismo ganhar a abilidade de “falar em outra língua”, em geral são necessários apenas três elementos de DNA: um gene que gere uma enzima que produza uma substância de QS, outro gene que produza o “receptor” dessa substância – que em geral é um fator de transcrição – e um promotor, no qual o fator de transcrição (após se associar à substância de QS) se liga para controlar a expressão gênica (imagem ao lado).

Se uma bactéria (por exemplo) “fala” a mesma “língua” que suas companheiras de colônia, como ela diferenciaria então um sinal próprio (a própria substância de QS sendo produzida) de um sinal de outras células (substância de QS externa)!? Isso é importante, porque se a bactéria receber o próprio sinal que envia, ela entrará em um processo autocatalítico que resultará em uma contínua auto-ativação da célula independente do sinal das bactérias ao seu redor. Acontece que uma bactéria não produz níveis suficientes de QS para “se ouvir”. Sem o sinal externo, a transcrição de genes pelo sistema de quorum sensing é fraca e insuficiente para iniciar um feedback positivo; apenas em alta densidade celular se consegue alcançar uma concentração crítica de substâncias de QS para estimular a transcrição dos genes que o QS controla.

Quorum Sensing no iGEM

Apesar de não ser um meio de transmissão de informação tão rápido e eficiente como o dos light switches, os sistemas de QS são bastante utilizados em dispositivos sintéticos devido à sua especificidade e falta de “falsos sinais” – afinal, é extremamente fácil estimular não-intencionalmente uma célula sensível à luz. No Registry of Parts existem cerca de 6 sistemas de QS completos, padronizados e disponíveis para construção, todos usando (em geral) diferentes AHLs, usados tanto na ativação e inibição da expressão de genes.

Exemplos de utilização desse sistema de transmissão de informação não faltam no iGEM. Já tratamos no blog de um dos inúmeros projetos do iGEM que utilizam quorum sensing, o da Unicamp de 2009. Em seu projeto, o time brasileiro utilizou sinais de AI-2 como um “sistema de alerta” em bactérias produtoras de bioprodutos em um bioreator. Quando um microrganismo contanimante surgisse (produzindo AI-2), o sistema de QS atuaria para comunicar sua presença a todas as bactérias ao redor do organismo invasor, iniciando gatilhos gênicos para produção de substâncias nocivas ao contaminante, afim de exterminá-lo do bioreator.

Parte do vídeo explicativo do time da Unicamp de 2009. Uma pequena esquematização de como usaram quorum sensing.

Aprender como uma população de microrganismos de comunica é extremamente útil para saber como ela se comporta, e no caso da biologia sintética, muito útil para conseguir controlar esse comportamento para transmitir informações em um dispositivo gênico sintético. Mas é claro que prever todo um comportamento de um sistema biológico não é nada fácil. Como já salientava Asimov, há algo em comum no comportamento de humanos e átomos: ambos são muito previsíveis singularmente, mas praticamente caóticos quando em coletivo. Apesar de mais simples, populações de microrganismos também se comportam assim, o que é uma das razões que tornam o trabalho em laboratório muitas vezes frustante e cansativo. Um guia nesse caos é essa compreensão sistêmica da comunicação entre bactérias (que origina certas resistências a antibióticos inesperadas e outras coisas bizarras), que assim como seres humanos, as torna seres mais sociais do que você possa imaginar.

Referências

  1. Whitehead, N. (2001). Quorum-sensing in Gram-negative bacteria FEMS Microbiology Reviews, 25 (4), 365-404 DOI: 10.1016/S0168-6445(01)00059-6
  2. Atkinson, S., & Williams, P. (2009). Quorum sensing and social networking in the microbial world Journal of The Royal Society Interface, 6 (40), 959-978 DOI: 10.1098/rsif.2009.0203
  3. He YW, & Zhang LH (2008). Quorum sensing and virulence regulation in Xanthomonas campestris. FEMS microbiology reviews, 32 (5), 842-57 PMID: 18557946

 

Computadores bacterianos

De acordo com o verbete da wikipedia, um computador é uma máquina programável desenhada para, automaticamente, realizar um sequência de operações aritiméticas ou lógicas. Um computador pode prover-se de inúmeros atributos, dentre eles armazenamento de dados, processamento de dados, cálculo em grande escala, desenho industrial, tratamento de imagens gráficas, realidade virtual, entretenimento e cultura. Os primeiros computadores analógicos surgiram no século XVII e eram capazes de realizar as funções básicas de somar, subtrair, multiplicar e dividir. Mas foi na II Guerra Mundial, em meados do século XX, que realmente nasceram os computadores atuais. A Marinha dos Estados Unidos, em conjunto com a Universidade de Harvard, desenvolveu o computador Harvard Mark I, projetado pelo professor Howard Aiken, com base no calculador analítico de Babbage. O Mark I ocupava 167m2 e pesada cerca de 30 tonelada aproximadamente, conseguindo multiplicar dois números de dez dígitos em três segundos.Seu funcionamente era parecido com uma calculadora simples de hoje em dia. Nem é preciso falar o quanto esta tecnologia se desenolveu até hoje, em que hoje se discuti processadores quânticos e se faz computação em nuvem. Uma plataforma diferente das “baseadas no silício”, que estamos acostumados, são os biocomputadores. Em 1994, em um experimento muito elegante, Leonard Adleman desenvolveu o primeiro experimento envolvendo um computador de DNA para resolver o problema do Caminho Hamiltoniano: um problema que envolve caminhos hamiltonianos é o problema do caixeiro viajante, em que um caixeiro deseja visitar um conjunto de N cidades (vértices), passando por cada cidade exatamente uma vez, fazendo o caminho de menor tamanho possível (Figura 1).

 

Figura 1. O grafo em vermelho é hamiltoniano.

Cada bola é um nó e cada flecha é uma aresta. Existem multiplas possibilidades de construir um computador baseado em DNA, em que cada um possui suas vantagens e desvantagens. A maioria deles funciona utilizando as portas lógicas (AND, OR, NOT) associadas a lógica digital utilizando como base o DNA, como por exemplo, o contador bacteriano . Porém os primeiros computadores moleculares baseados em DNA, são reações in vitro utilizando, por exemplo, enzimas de restrição, ligases, e DNA (Benenson et al. 2001). Através da mistura desse componentes e reações em cascada de digestão, ligação e hibridização, o output final é uma molécula detectável que representa o resultado computacional. Em 1994, Leonard Aldleman foi capaz desenvolver um computador in vitro baseado em DNA para solucionar o problema do Caminho Hamiltoniano (Figura 1), porém apenas em 2009, Baumgardner e colaboradores conseguiram resolver um problema complexo in vivo, em E. coli. Porém, para entender, é necessário uma série de abstrações para tornar sequências de DNA em vértices e arestas de um caminho hamiltoniano (ver Figura 2). A primeira abstração trata segmentos de DNA como as arestas de um determinado grafo. As arestas de DNA são flanqueados por sítios hixC que podem ser embaralhados por um recombinase Hin, criando diversas ordens e orientações randômicas para as arestas do grafo. A segunda abstração está relacionada com os nós, com exceção do nó terminal, em que um nó é um gene divido ao meio por uma sequência hixC. Os autores conseguiram construir enzimas funcionais portando essas sequências codificadas no DNA. Dessa maneira, a primeira metade (5´) de um nó é encontrada na aresta de DNA que termina em um nó, enquanto a segunda metade (3´) do gene é encontrado em uma aresta de DNA que se origina no nó. Calma, realmente não é fácil entender, é preciso pensar e abstrair, veja a figura 2.


Figura 2. Construção de DNA que codificam um problema do Caminho Hamiltoniano com três nós. a. O grafo contendo o caminho Hamiltoniando começa no nó RFP, procedendo para o nó GFP e terminando no nó TT. b. Construção ABC representam a solução para o problema dos três nós. Os três fragmentos de DNA flanqueado por hixC estão na ordem e orientação corretas, de maneira que os genes GFP e RFP estão intactos. ACB possui o gene RFP intacto, porém o gene GFP está errado, por fim, a construção BAC não possue nenhum gene intacto.

A Figura 2a mostra o grafo com os 3 nós e as 3 arestas que foram escolhidas para serem codificados no computador bacteriano. O gráfico contêm um único caminho hamiltoniano que começa no nó RFP, viajando pela aresta A até o nó GFP, e utilizando a aresta B até alcançar o nó final TT. A aresta C, the RFP até TT é um detrator. A Figura 2b ilustra como as construções de DNA foram utilizadas para solucionar o problema do Caminho Hamiltoniano com um controle positivo e duas configurações sem soluções. Já que as soluções precisam originar no nó RFP e terminar no nó GFP, a aresta A de DNA contêm na extremidade 3´a metade de RFP seguida por a extremidade 5´de GFP. A aresta B de DNA se origina em GFP e termina em TT, dessa maneira, esse fragmento de DNA possui 3´GFP seguido de um terminado de transcrição duplo. A aresta C se origina em uma metade 3´ de RFP e termina em TT. Finalmente, com os genes codificadores para RFP e GFP estão intactos, com promotores e RBS, e seguintes de um terminador de transcripção, colônias ABC expressam fluorescência vermelha e verde, dessa maneira, possuem aparência amarela.

Para concluir a abstração eu gosto de imaginar que a recombinase Hin é o caxeiro viajante que faz o seu caminho pelo DNA e a sequência de DNA contem o mapa do caminho realixado.

A programação de bacteria para computar soluções de problemas complexos podem oferecer as mesmas vantagens dos computadores atuais que estamos acostumados, porém, com as seguintes características adicionais: (i) sistemas bacterianos são autônomos, eliminando a necessidade de intervenção humana, (ii) computadores bacterianos podem se adaptar a condições flutuantes, evoluindo para resolver desafios de determinados problemas e (iii) o crescimento exponencial de bactérias continuamente aumente o número de processadores trabalhando em um problema (Baumgardner et al., 2009). Sem contar que eles ainda poderiam fazer fotossíntese…

Adleman LM: Molecular computation of solutions to combinatorial problems. Science 1994, 266:1021-1024.

Benenson Y, Paz-Elizur T, Adar R, Keinan E, Livneh Z, Shapiro E: Programmable and autonomous computing machine made of biomolecules. Nature 2001, 414:430-434.

Baumgardner , J et al. Solving a Hamiltonian Path Problem with a bacterial computer. J. Biol. Eng. 2009, 24;3:11.

Ligações Improváveis: RNA antisense, Sudoku e Redes Neurais

A ciência é cheia de ligações improváveis.

Veja por exemplo o estudo das partículas subatômicas e seus spins: quem diria que conhecer isso poderia permitir uma revolução na neurociência? Entendendo como o núcleo atômico dos átomos se comporta em um campo magnético foi possível construir o aparelho que permite literalmente olhar dentro de nosso cérebro, passando bem longe de um desconfortável bisturi: o aparelho de Ressonância Magnética Nuclear Funcional (geralmente os hospitais e clínicas tiram o “Nuclear” do nome porque isso assusta os pacientes; é sério!).

Chamamos essas ligações de “improváveis” principalmente por causa da sua contra-intuitividade, afinal quem pensaria em analisar o comportamento de cérebros ao se estudar algumas das menores coisas do universo!? Fazer essas pontes é o que se precisa para criar inovação, e é exatamente na busca desse tipo de coisa que nas últimas reuniões do Clube de Biologia Sintética começamos a fazer algumas ligações (não necessariamente na ordem do título) que “do lado de fora” têm uma aparência improvável, mas que no fundo talvez só sejam contra-intuitivas.

Tudo começou, ou melhor, tudo deveria ter começado (para amenizar a aparente desconexão) falando-se da mais novinha regulação de expressão gênica no mundo das descobertas científicas:

O RNA de Interferência

Representação do funcionamento dos RNAs antisense: quando se ligam à uma fita de RNA mensageiro com alto grau de complementariedade entre as fitas (diz-se "complementariedade" entre duas fitas de DNA (ou RNA) quando o código genético de ambas têm sequências de nucleotídeos que ligam-se entre si através dos pares A-T (U em RNAs) e C-G formados entre as fitas), há o bloqueiro da atuação da RNA polimerase, impedindo a tradução do RNA em proteína. Se não houver muita correspondência entre as fitas de RNA a traduação continua normalmente.

É mais uma daquelas descobertas “nobélicas”, estudada pelos pesquisadores americanos Andrew Fire e Craig Mello em 1998, ganhando o prêmio em 2006. A grande ideia dos RNAs de interferência (iRNA) é o pareamento  de pequenos segmentos de RNA – que não são codificados em proteínas – com RNAs mensageiros, impedindo que sejam traduzidos por “bloquear” o ribossomo . Esse sistema de inibição gênica envolve várias enzimas (se quiser saber mais veja esse ótimo vídeo) e é um pouco mais complexo do que o sistema de regulação gênica daquilo que chamamos de RNA antisense, mas na essência funcionam do mesmo jeito: bloqueio da tradução através de um RNA antisense complementar. A grande diferença entre os RNAs antisense e os de interferência, que são comumente confundindos com sinônimos, é que os iRNA atuam através de toda uma via de reações enzimáticas em eucariotos, enquanto os RNA antisense são mais característicos de seres procarióticos e não precisam de uma via enzimática para regularem a expressão gênica.

Diferentemente dos outros tipos de regulação mediados por inibidores, que são basicamente proteínas que se ligam ao DNA inibindo a transcrição gênica, com os RNAs antisense têm-se uma gama muito maior de inibidores da expressão gênica. Imagine que você quer controlar uns 2 ou 3 genes em uma bactéria: existem muitos metabólitos que podem fazer esse trabalho (por exemplo IPTG, galactose, TetR e etc.), mas e se você quiser ter um controle de mais genes, digamos, uns 20!? Dá-lhe repressores! Por outro lado, se for possível usar RNAs de interferência suficientemente eficientes, poderia se fazer um vetor de transformação bem mais enxuto (em relação aos sítios repressores) além de poder construir um mecanismo de repressão mais orientado ao “alvo” de repressão: basta construir um RNA mensageiro complementar. É exatamente essa versatilidade que torna possível contruir uma…

 Bactéria Resolvedora de Sudoku

Legal: Sudoku, Bactérias e RNA antisense… O que essas coisas têm a ver!?

Essa grande ideia veio do time japonês UT-Tokyo do iGEM de 2010, e além de usar RNAs antisense, também usou do dispositivo gênico baseado em recombinases semelhante ao que o time da Unicamp usou em 2009 para a mesma finalidade, que é diferenciar diferentes populações de bactérias. O sistema que eles criaram funciona basicamente assim:

Populações Diferentes

Diferentes tipos de Populações

Eles representaram (em um sudoku 4×4) cada posição por uma população específica de E.coli’s. Cada posição tem algo em seu DNA que a torna diferente de todas.

Diferentes Estados

Estados das Populações

Cada população pode se diferenciar em quatro tipos diferentes de E.coli’s correspondentes à cada número que um sudoku 4×4 permite (1, 2, 3 e 4).

Comunicação entre as Posições (Populações)

Comunicação viral entre as posições (populações) do sudoku

As populações devem se comunicar para transmitir a informação de suas posições para as outras posições; afinal é assim que se resolve um sudoku: podemos dizer que uma posição é 1, 2, 3 ou 4 depois de recebermos as informações de quais números existem no quadrado, linha e coluna correspondente à posição em questão.

Essa comunicação é feita através de vetores virais, que são vírus que as bactérias produzem para infectar as outras populações correspondentes às outras posições, transmitindo as informações que possuem (como sua “posição” e “estado”: 1, 2, 3 ou 4).

Diferenciação dos Estados

Diferenciação dos estados

Para o sudoku funcionar, quando uma posição identificar qual é o estado de suas vizinhas, ela deve se diferenciar justamente no estado que não recebeu sinal. Por exemplo (imagem ao lado), se a posição (1,1) (linha 1, coluna 1) receber as informações de que certas posições em seu quadrado, linha e coluna já estão diferenciadas nos estados 3, 2 e 1, ela deve se diferenciar em 4. Para conseguir fazer isso, os japoneses usaram o dispositivo chamado “4C3 leak switch”, que se baseia na probabilidade de uma polimerase em “ignorar” os sítios terminadores de transcrição. Para entender melhor, veja a imagem abaixo:

Cada gene codifica um tipo de recombinase (as setinhas apontando para a esquerda: Hin, flpe, Ligand 3 e Ligand 4). Quando a E.coli for infectada por um vírus de uma posição com que se comunica, ele inserirá um plasmídeo que expressa uma dessas 4 recombinases, agindo nas posições que flanqueam o mesmo gene na bactéria. Por exemplo, na imagem da diferenciação dos estados, a posição (2,2) envia um vírus à (1,1) passando a informação de que possui o estado “2”, expressando a recombinase flpe e retirando o respectivo gene do plasmídeo bacteriano através das posições FTR que flanqueiam o gene (ver imagem acima). Ao fazer isso, também retirará o sítio terminador que fica entra os FTR, aumentando a probabilidade da polimerase atravessar todas as sequências de recombinases de sequências invertidas e expressar a cre recombinase (setinha cinza apontando para a direita). Depois, se a posição (1,1) receber mais dois vírus diferentes, ele perderá 3 genes de recombinase e três sítios terminadores, restando apenas um sítio terminador entre o promotor pT7 e o gene cre. Nesse estágio, a probablilidade de a polimerase ultrapassar o sítio terminador (daí que vem o “leak”) é considerável, e quando o faz, transcreve a cre recombinase, que retira seu próprio gene e os dois sítios terminadores duplos depois dele, conectando o gene de recombinase que não foi retirado do plasmídeo junto dos genes que também estão em sentido reverso, transcritos pelo promotor pSP6. Além disso promove a produção de vírus através da retirada dos dois sítios de parada que separam o segundo promotor pT7  do gene que transcreve a polimerase que atua no promotor pSP6 e o gene que produz o capsídeo do vírus. O empacotamento das sequências genéticas no vírus acontecem após a loading sequence (retângulo rosa). Isso faz com que a posição 1 passe também a “emitir” vírus informando seu estado e posição.

Para entender de verdade, vale assistir o vídeo (começa mesmo aos 24 seg) que o próprio time japonês fez para mostrar o funcionamento do sistema (percebam o sotaque!):

Restrição de Posições

Para isso dar certo é preciso que somente as populações da respectiva linha, coluna e quadrado comuniquem-se entre si, ou seja, deve have uma restrição à comunicação entre as populações de posições não-relacionadas segundo o sudoku. Como isso é feito!? Sim! RNAs antisense!

Tudo isso só consegue funcionar graças à atuação dos RNAs antisense que coordenam o fluxo de informação entre as diferentes populações associadas às diferentes posições do sudoku. Na imagem do 4C3 leak switch são as location sequence que contém todas as sequências codificantes dos RNAs de interferência de cada posição. Com isso é possível construir uma tabela de correspondência de antisense que dirá quais antisense uma posição deve fazer para inibir a atuação dos vírus de outras posições não-relacionadas:

Mas espera aí! O sudoku é uma tabela 2D, como é possível separar as diferentes populações, uma em cada posição característica, e assim fazer a transferência de informação!? É preciso construir algo físico – uma tabela de sudoku de verdade – para esse sistema sintético!? Resposta: não é preciso “separar” as populações, a interação entre os RNAs antisense dos vírus de cada população que remete à uma posição dá conta do recado. Você pode misturar todas a populações em um tubo de ensaio (com o input, é claro) e depois analisar os estados de cada bactéria pertencente à um tipo de população (por sequenciamento) e assim saber o resultado do sudoku.

Esse conceito de restrição de informação por RNAs antisense, e esse fluxo de informação por vírus é essencial para se entender o que estávamos discutindo no clube de biologia sintética, sobre como fazer em um sistema bactériano uma…

Rede Neural

Por fim: rede neural! Como fazer um dispositivo biológico sintético que imite uma rede neural!?

Bem, abstratamente falando, uma rede neural pode ser simbolizada através da imagem ao lado: os neurônios (as bolinhas) e suas ligações. O que temos em comum entre esses sistema e o sudoku são que temos posições espaciais trocando informações e seguindo um padrão. No sudoku o que restringe o fluxo de informação são as regras que pré-estabelecemos para o jogo, no sistema neuronal o que restringe a comunicação é apenas o espaço (existe um número finito de ligações axônicas que os neurônios podem fazer devido à limitação de espaço), além de outro fator: o “peso” dessas interações, que associa uma intensidade de fluxo de informação entre neurônios (o aumento desses “pesos” durante o tempo devido a um estímulo é o que chamamos de aprendizado).

Rede de Hopfield

Para querer fazer o design de um sistema sintético que se comporte como uma rede
neural devemos usar um modelo que represente uma rede neural! Existem vários deles, mas um mais simples e talvez o mais interessante para usarmos é a Rede de Hopfield, muito usada em computadores para reconhecimento de padrões. Hopfield é chama de uma rede de memória associativa pois consegue armazemar memória através da associação de informações existentes na comunicação entre vários neurônios. Uma das implicações disso é a capacidade de recuperar esse padrão mesmo quando dado um padrão incompleto.

Exemplo do Funcionamento

Imaginemos que, semelhantemente ao sudoku, também tenhamos uma matriz com posições, só que agora 3×3 e tendo apenas dois estados: “preenchida” ou “ativada”(denotada por 1), e “não-preenchida” ou “inativada” (denotada por 0). Podemos construir então “letras” preenchendo essas posições. Queremos que nosso sistema reconheça o padrão incompleto dessas letras e complete-o com sua memória:

Legal, mas como funciona o algoritmo disso!? Basicamente é com a definição das conexões que esses dois padrões têm. Partindo da hipótese que somente as posições próximas podem se comunicar (assim como neurônios, em um modelo simplificado), no padrão que pré-estabelecemos para o sistema, a comunicação entre duas posições preenchidas é considerada excitatória, ou seja, uma posição influencia a outra a permanecer ativada; já quando uma posição não-preenchida se comunica com uma preenchida, a comunicação é considerada inibitória; e por fim, quando duas posições não-preenchidas estão uma ao lado da outra, há indiferença e não há ativação ou inibição entre si (ver imagem abaixo). Com isso podemos criar uma rede de comunicação  característica de cada figura com os pesos dos padrões.

Para a rede reconhecer ambos os padrões, deve-se somar os pesos dos padrões L e T:

Cada peso de comunicação da soma dos pesos é computada para reestabelecer um dos padrões da memória dado um padrão incompleto. Vejamos o exemplo da imagem abaixo: um L incompleto. Para decidir se a posição não-preenchida se preencherá é preciso computar o padrão incial em relação aos pesos na “memória da rede” com a expressão abaixo, em que wik é o peso da interação entre a posição em questão (denotada por i) e uma determinada posição k.

Então somando-se os produtos entre os estados xk (das k posições comunicando-se com a posição incompleta) e os pesos wik das interações entre as k posições e a posição incompleta, define-se o estado que a posição incompleta deve ter: se é de fato um estado inativado ou ativado (preenchido):

x(3,1) = 1 . 1 + 0 . 1

x(3,1) = 1

Portanto, segundo a interação associativa da rede, a posição (3,1) torna-se em um estado ativado (1) completando a letra L. Para diferentes inputs o cálculo é o mesmo e (com algumas exceções) o sistema sempre se ajusta à um dos dois padrões de sua memória: ou um L ou um T.

Como Fazer isso com Bactérias

Assim comom no sudoku, podemos criar diferentes populações de bactérias para cada posição além de – pelo mesmo mecanismo – uma rede de transmissão de RNAs antisense por vírus baseando-se na tabela de pesos das interações entre as populações existentes (a “memória” do sistema), de modo que cada posição tenha os antisense corretos para reprimir ou estimular a produção de uma determinada proteína repórter para cada posição! O que se diferenciaria do sudoku é que precisaríamos construir um aparelho literal do sistema que queremos construir, ou seja: é preciso separar as diferentes populações para discernir os outputs para saber ao certo qual população referente emitiu luz verde por GFP, por exemplo. O input também poderia ser luz, feito através de um light switch.

E assim o ciclo das relações um tanto improváveis se fecha. Mas como a ciência é extremamente mutável vários outros assuntos podem se juntar nessa ciranda e dar origem a outras “improbabilidades”. Você, leitor, também pode fazer parte desse trabalho ou pelo menos acompanhar de perto e conhecer um pouco melhor sobre essas coisas que andam rolando nas discussões do clube de biologia sintética através das reuniões gravadas, em especial (sobre como fazer uma rede neural artificial em bactérias)  essa aqui no nosso canal no LiveStream.

Quem sabe possamos colocar em prática tudo isso!? Vejamos em 2012!

Light Switches: Um Review

ResearchBlogging.orgJá tratamos nesse blog de um dispositivo simples, mas engenhoso, para a transdução de um sinal luminoso em uma resposta genética desejada, no caso um switch de luz vermelha. Mas podemos abranger o conceito de switch de luz para uma variada gama de mecanismos que a própria natureza esculpiu durante os milhares de anos que teve para se divertir sozinha antes que nós aprendêssemos a modificá-la.

Os mecanismos mais óbvios, que conhecemos bem antes de termos conhecimento da existência de uma célula, são os das plantas. Apesar de pensarmos nesses seres vivos como a fonte mais provável das ferramentas que precisamos para construir um light switch, a biologia sintética utilizou até agora principalmente os dispositivos fotossensíveis de microorganismos fototróficos e quimiotróficos, presentes em uma grande quantidade de bactérias.

As funções de muitos fotorreceptores ainda não são muito claras, mas alguns exemplos na natureza da atividade desses mecanismos vão desde a regulação da motilidade celular, formação de pigmentos, reparo de DNA, resposta ao stress , à até “comportamentos multicelulares”, como a formação de biofilmes e de corpos de frutificação, como por exemplo a Stigmantella aurantiaca.

Corpo de frutificação da Stigmantella aurantiaca.

Corpo de frutificação de Stigmantella aurantiaca. Retirado da publicação de van der Hornst et al, mencionada no final do post.

A grande maioria das proteínas fotossensíveis que a seleção natural pôde criar nesses milhões de anos, e que até agora conhecemos, pode ser classificada em seis famílias bem definidas, baseada na estrutura do cromóforo absorvedor de luz, que podem ser: as famosas rodopsinas, os aqui já conhecidos fitocromos, as xantopsinas, os criptocromos, as também famosas fotropinas e as proteínas de domínio BLUF (blue light sensing using flavin (FAD), domínio utilizador de flavina sensível à luz azul).

A natureza é sutil; ela parte de princípios básicos e com eles (utilizando um bocado de tempo) cria as mais variadas soluções para um mesmo problema. Com os fotorreceptores não é diferente. Uma procura de similaridade de sequências que codificam esses seis tipos de fotorreceptores no mecanismo de busca protein BLAST do NCBI revela uma grande quantidade de sequências similares nos genomas de diferentes espécies, indicando um vasto número de receptores ainda não caracterizados em diversos microorganismos. Um exemplo dessa busca pode ser visto da lista deste link: Chemotrophic organisms containing protein photoreceptor domains.

O princípio básico dos fotorreceptores é: uma estrutura molecular que contenha um ou mais domínios que captam a luz (input) e outro(s) que transforme(m) isso em um sinal intracelular (output). Os domínios de input ligam-se a cofatores ou cromóforos, resultando em uma molécula capaz de absorver luz UV ou visível. O domínio do output pode possuir uma atividade enzimática, proteína-ligante, ou DNA-ligante.  Vejamos alguns domínios de input e de output comumente encontrados in natura.

Domínios de Input Domínios de Output
AppA: Anti-repressor de pigmentos fotossintéticos. O AppA foi a primeira proteína com domínio BLUF caracterizada em Rhodobacter sphaeroides. Absorve na região dos 446 nm com o seu cromóforo FAD. Além de sensível à luz, está envolvida em reações redox.BLUF: Um domínio presente em várias proteínas fotoativas, sua estrutura é similar, mas com um mecanismo funcional totalmente diferente, ao domínio PAS.

LOV: Uma subclasse do domínio PAS, nomeado LOV devido ao tipo de sinal que esse domínio detecta: Luz-Oxigênio-Voltagem (light-oxygen-voltage). Esse tipo de domínio foi descoberto em fototropinas de plantas e mais recentemente em proteínas bacterianas. Um tipo de domínio bem “popular”.

PAS: De “Per-Arnt-Sim”, três reguladores transcricionais que contêm esse tipo de domínio. Outro tipo de domínio bem “popular” no quesito receptor de luz. Muitas proteínas com domínio PAS são conhecidas por transmitir o seu sinal associando-se a cofatores.

Fitocromo: Receptor de luz vermelha e infravermelho encontrado em plantas e bactérias, ligando-se em uma cromóforo de bilina (Lembra do red light switch? A Ficocianobilina é um desses cromóforos).

PYP: De photoactive yellow protein (proteína fotoativa amarela). Um receptor de luz citoplasmático que usa ácido p-coumárico como seu cromóforo. Sua absorção máxima é em 446 nm.

Rodopsina: Proteína composta por um conjunto de sete hélices intermembrana (ver imagem na tabela abaixo), ligando-se a um cofator retinal em seu centro hidrofóbico, absorvendo em maior parte luz verde. Há uma grande quantidade de estudo sobre ela.

YtvA: Um bem caracterizado domínio fotoreceptor de luz azul em Bacillus subitilis. Possui um domínio LOV que se liga ao cromóforo monoflavina (FMN), o que resulta numa absorção máxima em torno de 449 nm.

EAL: Domínio com atividade enzimática diguanilato-fosfodiesterase (traduzindo: envolvido na hidrólise de di-GMP cíclico, um importante sinalizador intracelular). Chama-se EAL por causa de sua sequência conservada de resíduos, mas também conhecido como DUF2.GAF: Domínio com atividade de adenilato-ciclase, guanilato-ciclase, e fosfodiesterase. Liga-se à um cofator bilina em alguns fitocromos.GGDEF: Similar ao EAL, possui atividade de ciclase em diguanilatos (di-GMP). Também possui seu nome devido à sua sequência conservada, conhecido também por DUF1.

HisKA: Domínio fosfoaceptor e dimerizador de proteínas histidina-quinases, importantes proteínas na sinalização intracelular.

HTH: Domínio de ligação ao DNA de reguladores de transcrição bacterianos. Eles se ligam ao DNA via seu motivo (sequência específica de aminoácidos) helix-turn-helix (hélice-dobra-hélice).

STAS: O domínio STAS, cujo nome significa domínio transportador de sulfato e antagonista de fatores anti-sigma (traduzindo: promove a atividade do tal fator de transcrição sigma), é o domínio de output do bem caracterizado YtvA, mas também encontrado em outros fotoreceptores.

Sabendo como as coisas são naturalmente, é possível juntar diferentes peças desse zoológico de domínios proteicos e formar diferentes light switches. Vejamos por exemplo o red light switch: basta juntar um domínio input de fitocromo e um output de ligação ao DNA, no caso o GAL4. Para sintetizar um switch de luz azul, verde, amarelo, e etc, o princípio fundamental é o mesmo: basta montar um input e um output desejados. O resto é pura metodologia e testes. Alguns exemplos de construções naturais podem ser:

Combinações naturais de diferentes domínios Input e Output.

Imagem modificada retirada da referência deste post (van der Hornst et al.).
 

Como se pode ver, o domínio de input LOV parece ser o mais versátil, o que talvez explique a sua “popularidade” no mundo bacteriano dos domínios fotossensíveis. Encontra-se um LOV input ligado à vários tipos diferentes de outputs.

Uma coisa interessante a se levar em conta nessas construções naturais é o tempo de alternância entre os diferentes estados dos fotorreceptores, que como vimos no red light switch, se resume (na maioria dos casos) a um estado “ativo” quando exposto a luz e um “inativo” quando no escuro ou quando passado certo tempo de exposição. Quando o ciclo de mudança do estado ativo para o inativo é um pouco lento, ele é geralmente compatível com regulações na expressão gênica, enquanto graus rápidos de mudança são relacionados com uma regulação comportamental (que não envolve diretamente uma regulação gênica, como por exemplo o aumento da taxa de motilidade de uma bactéria quando exposta à luz). Um ciclo de mudança ainda mais rápido sugere funções bioenergéticas para o fotoreceptor. Isso é um parâmetro importante a se levar em conta no design de dispositivos sintéticos fotossensíveis.

No fundo, talvez grande parte da própria biologia  sintética se resume ao que discutimos aqui: mudança de informação com recombinação. Caímos então no ponto recursivo da biologia. À diferentes níveis e abordagens sempre teremos  a mesma simples metáfora dos blocos de montar: os blocos sempre são os mesmos, o que muda é a informação que colocamos neles ao fazermos diferentes estruturas com diferentes combinações das unidades. Quer um light switch específico que ainda não foi feito? Já está pronto, só basta combinar informação.

Em posts futuros mostraremos como combinar inputs e outputs para criar light switches de outras cores, novamente, com as construções feitas pelos de times de edições passadas do iGEM. Para maiores e melhores informações sobre fotorreceptores, vale consultar o ótimo review de Michael van der Hornst et al:

van der Horst MA, Key J, & Hellingwerf KJ (2007). Photosensing in chemotrophic, non-phototrophic bacteria: let there be light sensing too. Trends in microbiology, 15 (12), 554-62 PMID: 18024131

Portas Lógicas em Sistemas Gênicos

ResearchBlogging.org

A associação da biologia sintética com a eletrônica é bem grande. A semelhança entre a interação de enzimas, fatores de transcrição e DNA, e circuitos elétricos gera uma interessante conexão interdisciplinar entre engenharia elétrica e biologia, tanto que os próprios fundadores do iGEM e do registry of parts são engenheiros elétricos!

Algumas boas analogias, ou melhor, interpretações dos sistemas gênicos, são feitas com o uso de portas lógicas para classificar o comportamento das interações gênicas. Portas lógicas baseiam-se na lógica booleana, usada largamente em computação. Para entender melhor, vamos ver uns dois exemplos: o NOR e AND.

NOR (“not OR”, o inverso do resultado para a porta OR, conhecido também como NEM):

Imagem retirada e modificada da referência (Khalil, A., & Collins, J.).
 

Como já foi mostrado aqui no blog, esse dispositivo possui dois estados estáveis que podem ser ligados ou desligados através de inputs específicos. Retirando esse input, no caso sinais exógenos como calor e IPTG, o sistema preserva o seu estado, criando assim uma forma molecular não exclusivamente estrutural (i.e. conformação de proteínas e etc) de memória na célula. O raciocínio é o mesmo em eletrônica, como no circuito flip-flop do tipo set-reset, que é capaz de servir como uma memória de um bit em circuitos digitais.

O sistema pode ser interpretado através da tabela verdade de NOR: As entradas são as interações (de repressão ou ativação) do sinal exógeno e do produto gênico, enquanto os números 0 e 1 associados à falso e verdadeiro, podem ser interpretados respectivamente como repressão e ativação nas colunas da entrada, e existência (um) ou não (zero) de
um output na coluna da saída. Então por exemplo, tendo A como o calor (heat) e B como a proteína repressora Cl (produzida por cl-ts) só se terá uma saída (o número 1), ou melhor, um estado estável do toggle (em que é expresso apenas um conjunto de genes), se houver uma interação entre repressões, ou seja, a repressão do repressor, no caso o calor reprimindo a repressão de Cl de lacl, que produz um estado estável de produção de Ptrc2 e GFP (green flourescent protein). Para o outro estado estável, com produção de Cl e repressão do gene lacl, a idéia é a mesma, basta fazer A igual à IPTG e B igual à Ptrc2.

AND (conhecido também por E):

Imagem retirada e modificada da referência (Khalil, A., & Collins, J.).
 

Nesse exemplo, são necessários dois inputs para se obter o output: um de arabinose para transcrever a polimerase T7 com dois stop codons âmbar (é uma classe de stop codons, representada no desenho como pequeninos círculos vermelhos com pontas) no código do seu gene (a polimerase é necessária para expressar o sinal de GFP); e outro sinal de salicilato que promove a transcrição de supD, um RNA transportador supressor de stop codons âmbar. Desse modo, tomando A da tabela verdade como a arabinose, e B como salicilato, pode-se ver claramente que apenas com a ativação da transcrição feita por esses fatores a expressão desses dois genes, pode ocorrer o output de luz fluorescente verde dada pela GFP: o produto de supD suprime os stop codons do gene t7pol, permitindo a transcrição completa de polimerase T7.

Esse é um exemplo de quão sofisticado um sistema gênico pode ser ao se ligar a informação sensorial de múltiplos elementos sensitivos a uma expressão gênica programada. O interessante dessa interface entre engenharia elétrica e microbiologia é a possibilidade de construção de sistemas gênicos com o mesmo princípio de uma série de outros dispositivos já existentes na engenharia, e também o contrário: (porque não!?) usar os dispositivos moleculares que a própria natureza criou e aplicá-los na eletrônica.

Para mais informações sobre outros sistemas bem interessantes, vale ver o review muito legal sobre biologia sintética:

Khalil, A., & Collins, J. (2010). Synthetic biology: applications come of age Nature Reviews Genetics, 11 (5), 367-379 DOI: 10.1038/nrg2775

Switch de Luz Vermelha

ResearchBlogging.org

Os mecanismos de ativação da expressão gênica majoritariamente utilizados em biologia sintética hoje, que utilizam pulsos de algum tipo de metabólito para a indução de uma resposta gênica, possuem diversas desvantagens, indo desde uma cinética de ativação ineficiente a até possivelmente efeitos tóxicos dependendo do metabólito utilizado.

A indução de uma atividade gênica baseada em uma transmissão de
informação na velocidade de fóton é muito mais precisa, rápida e prática que qualquer outro metabólito que exista pelos simples fatos de que um fóton não precisa ser “dissolvido” no citosol, não precisa colidir com o seu alvo de alguma maneira particular para iniciar uma resposta enzimática, e talvez o mais importante: um fóton não causa efeitos pleiotrópicos (i.e. ativação de um gene não desejado) e não antecipados como um metabólito (Bem, isso se você tiver certeza de que não há mais nenhum receptor de luz além daquele que você vai usar na sua bactéria) Somado à isso, a luz é um indutor de resposta gênica barato, universalmente disponível, simples de usar, não-invasivo, atóxico, de alta inducibilidade e reversibilidade, e que pode ser facilmente utilizado em vários sistemas.

Provavelmente no futuro a grande maioria dos mecanismos indutores de máquinas geneticamente modificadas deverão ser induzidos por luz, ou quem sabe por quaisquer outros tipos de indutores de expressão com características equiparáveis.

Para se ter uma noção do funcionamento de um switch de luz, mais particularmente de luz vermelha, vamos dar uma olhada no mecanismo molecular por trás dessa idéia.

Mecanismo Molecular

O mecanismo molecular de ativação por luz provém, como era de se esperar, de proteínas vegetais encontradas no cloroplasto. Elas estão envolvidas no fotoperiodismo das plantas, germinação de sementes, e síntese de clorofila, além de outras coisas. Essas proteínas são os fitocromos.

Os fitocromos não possuem atividade sensível à luz por si só: é
necessário estar covalentemente ligado à um cromóforo, que nas plantas é a fitocromobilina (PφB), e em cianobactérias é a ficocianobilina (PCB), que é o mais usado devido à sua fácil purificação. Na ausência desses cromóforos não há mudanças conformacionais devido à luz nos fitocromos, é ele que capta a energia do fóton e traduz em uma mudança conformacional na proteína, culminando na mudança de sua funcionalidade.

O funcionamento deste biossensor sintético se dá através da construção de proteínas quiméricas a partir de receptores de luz e fatores de transcrição. Para receptores de luz vermelha (660 nm) há pelo menos dois tipos de mecanismos celulares construídos, que são os que vamos falar aqui, ambos utilizando uma idéia muito interessante: a fusão de partes de proteínas, as chamadas proteínas quimeras. Essa fusão vai além do aspecto estrutural e junta características funcionais de cada parte em uma proteína só. Não é demais!?

Um desses mecanismos, utilizando um híbrido entre fitocromo
(podendo ser A ou B) e o domínio quinase da proteína de E.Coli EnvZ. Essa quimera possui um mecanismo de inibição através da exposição à luz vermelha: quando o domínio quinase está fosforilado, há a expressão gênica (no caso, de lacZ, que induz a formação de um pigmento branco por ação da expressão de β-Galactosidase), já na presença de luz vermelha, o domínio torna-se desfosforilado e inibe a expressão (veja a imagem 1). Esse mecanismo molecular para a construção de um light switch foi o utilizado pelo time da universidade do Texas na competição de biologia sintética realizada no verão, no período de atividades independentes do MIT de 2004, o qual impulsionou a criação do iGEM.

O outro mecanismo molecular atua através de duas quimeras: uma
resultante da fusão entre o fitocromo (A ou B) e o domínio de ligação ao DNA (GBD) da proteína GAL4, e a outra um híbrido de PIF3 (phytochrome interaction factor 3) e o domínio de ativação de transcrição (GAD), também do fator de transcrição GAL4. Quando não exposto à luz ou exposto à luz infra-vermelha (far-red light, FR), o fitocromo na conformação Pr (forma inativa) somente fica ligado ao DNA através do domínio do domínio GBD, porém quando exposto à luz vermelha, a proteína quimérica do fitocromo ganha a conformação Pfr (forma ativa) que se liga à PIF3-GAD com alta afinidade, o que induz a transcrição do gene alvo (veja a imagem 2).

Outras proteínas podem ser usadas substituindo PIF3, como FHY1
(far-red elongated hypocotyl 1) ou FHL (FHY1 like), fundidas à GAD também (imagem 3).

O grande diferencial deste último mecanismo de switch é a rapidez
de resposta gênica e fácil modulação. A conversão das formas Pr para Pfr ocorrem em milissegundos, e a transcrição em segundos. A indução reversa é igualmente rápida, exigindo apenas uma dissociação entre a quimera com GBD e a com GAD. Isso permite alto sincronismo e uma indução da expressão uniformizada na população celular.

Agora imagine a aplicabilidade disso, por exemplo, em uma indústria que precise produzir um biomedicamento que necessite ser constituído de proporções de dois diferentes compostos. Ela teria que criar dois processos independentes de produção, dois biorreatores, uma unidade de mistura, teria que dosar as quantidades sendo misturadas e etc: iria ter que sustentar dois processos paralelos. Com um simples mecanismo molecular de light switch o
remédio ficaria muito mais barato e rápido de se produzir com apenas um apagar
e acender de lâmpadas. Os dois constituintes do medicamento poderiam ser produzidos no mesmo biorreator e em proporções que seguiriam apenas o tempo de exposição à determinada luz, no caso deste post, luz vermelha e infravermelha. Bacana não é? E isso é só um exemplo.

Para maiores e mais específicas informações, vale dar uma olhada
nos papers aqui embaixo (a referência 3 traz um modelo matemático bem legal ).

1) Levskaya A, Chevalier AA, Tabor JJ, Simpson ZB, Lavery LA, Levy M, Davidson EA, Scouras A, Ellington AD, Marcotte EM, & Voigt CA (2005). Synthetic biology: engineering Escherichia coli to see light. Nature, 438 (7067), 441-2 PMID: 16306980

2)Shimizu-Sato S, Huq U, Tepperman JM, Quail PH (2002). A light-switchtable gene promoter system Nature Biotechnology, 1041-1044 DOI:10.1038

3) Sorokina O, Kapus A, Terecskei K, Dixon LE, Kozma-Bognar L, Nagy F, & Millar AJ (2009). A switchable light-input, light-output system modelled and constructed in yeast. Journal of biological engineering, 3 PMID: 19761615

Produção de biodiesel por bactérias

ResearchBlogging.org

Imagine uma plantação enorme de soja no interior do Mato Grosso e uma instalação para a extração do óleo de soja, que é composto por vários ácidos graxos. Agora imagine no interior de São Paulo, uma grande usina de etanol cercada por dezenas de quilômetros por cana-de-açúcar. Imagine o etanol e óleo de soja sendo transportados até uma usina de biodiesel para, utilizando um catalisador (normalmente hidróxido de sódio), serem esterificados em um éster (biodiesel) e em glicerina. Muito trabalho e muito recurso para produzir um biocombustível não acham?

Recentemente, um trabalho muito interessante foi publicado pelo Jbei Instute demonstrando a possibilidade de se utilizar uma bactéria para produzir biodiesel em apenas uma etapa, e ainda por cima, utilizando resíduos agroindustriais, como por exemplo, o bagaço de cana-de-açúcar. Essa bactéria modificada geneticamente é capaz de produzir ácidos graxos e etanol e enzimaticamente realizar a esterificação desses produtos em biodiesel. Bacana não é? Os detalhes da pesquisa serão descritos a seguir.

Ácidos graxos têm sido utilizados há séculos para a produção de combustíveis e produtos químicos, incluindo o biodiesel, surfactantes, solventes e lubrificantes. Porém a demanda crescente e a produção limitada de óleos vegetais têm causado questionamentos sobre o aumento dos preços dos alimentos, sobre a prática de utilização dos solos e os aspectos socioambientais relacionados com a sua produção. Uma alternativa é a produção desses derivados de ácidos graxos via conversão biológica utilizando microrganismos como levedura e bactérias. Dentro desses produtos, os etil-ésteres de ácidos graxos (o famoso biodiesel) têm despertado muito interesse. Só para ilustrar, a demanda mundial de diesel vem crescendo três vezes mais que a de gasolina.

Ácidos graxos são produzidos naturalmente por microrganismos, eles compõem, entre outras coisas, a membrana celular. Porém, Jay Keasling e seu grupo construíram uma E. coli geneticamente modificada capaz de produzir ácidos graxos livres (através da expressão de uma tioesterase citoplasmática e da deleção de genes responsáveis pela degradação de ácidos graxos) e etanol (expressando os genes de Zymomonas mobilis). Além disso, foi clonada uma enzima (Acr1) capaz de realizar a transesterificação em bioedisel, sendo que que a glicerina produzida é reabsorvida pela bactéria para a produção de mais biodiesel.

O tamanho e a saturação do ácido graxo influenciam diretamente nas propriedades químicas do biodiesel, como temperatura de fusão. Alguns trabalhos têm demonstrado que,
através da expressão de tioesterases de plantas, é possível produzir ácidos graxos sob medida para diferentes aplicações. Essa ferramenta genética possibilita a produção de biodiesel com composições definidas, dessa maneira, com performance e características desenvolvidas sob medida.

Por fim, essas bactérias foram modificadas para utilizar matérias-primas de baixo custo, como a hemicelulose presente no bagaço de cana-de-açúcar. É uma pesquisa pioneira que mostra bem o tipo de engenharia sistêmica de metabolismo microbiano que vem sido feita. Através de várias modificações genéticas foi possível aumentar a produção de 40 mg/l para quase 700 mg/l de biodiesel. Resultado este ainda baixo para se cogitar uma aplicação a curto-prazo, mas, sem sombra de dúvida, as perspectivas são muito animadoras.

Steen EJ, Kang Y, Bokinsky G, Hu Z, Schirmer A, McClure A, Del Cardayre SB, & Keasling JD (2010). Microbial production of fatty-acid-derived fuels and chemicals from plant biomass. Nature, 463 (7280), 559-62 PMID: 20111002

Dispositivos sintéticos: osciladores

ResearchBlogging.org
Um oscilador eletrônico é um circuito elétrico que produz um sinal eletrônico repetitivo, frequentemente uma onda senoidal ou uma onda quadrada. Eles são amplamente utilizados em aparelhos eletrônicos, incluindo aparelhos de transmissão de rádio e televisão.

Stricker e colaboradores (2008) descrevem a construção de um oscilador sintético biológico. Para isso, uma construção muito interessante foi utilizada, baseada em um promotor híbrido Plac/ara.  Este promotor possui dois operadores que respondem a dois sinais: ele é ativado por AraC na presença de arabinose e é reprimido por LacI na ausência de IPTG. Seguido a este promotor foi clonado os genes araC, lacI e o gene codificador da proteína luminescente GFP. Um pulso de IPTG foi utilizado para sincronizar as células, dessa maneira, AraC é traduzido resultando na ativação do sinal luminescente de GFP. Por outro lado, AraC ativa também a expressão de lacI resultando na repressão de araC e gfp, cessando o sinal luminescente. Como Lac I causa a repressão do próprio lacI, este acaba se reprimindo e um novo ciclo se reinicia (ver figura abaixo).

O período de oscilação pode ser ajustado modificando a concentração do indutor, por ex, podendo variar o período de 13 a 58 minutos. Na Figura acima o gráfico apresenta um período de 40 minutos. O mais interessante, para mim, é que o tempo de geração das bactérias do experimento varia  de cerca 22 a 27 min, assim, a informação e o sincronismo contido no oscilador passa de geração em geração.

Foi verificado que a indução da oscilação foi muito rápida (cerca de 5 min) e inicialmente bem sincronizada, analisando cada célula individualmente. A amplitude da oscilação foi caindo com o progresso do experimento, devido a dessincronização gradual de cada célula da colônia, como já era de ser esperar. Desse fenômeno, emerge um próximo tópico da biologia sintética, a comunicação célula-célula através do desenvolvimento de mecanismos de quorum sensing sintéticos. Assim, a próprias células podem se comunicar para coordenar e sincronizar o seu comportamento. Mas isso é assunto para posts futuros.

Stricker J, Cookson S, Bennett MR, Mather WH, Tsimring LS, & Hasty J (2008). A fast, robust and tunable synthetic gene oscillator. Nature, 456 (7221), 516-9 PMID: 18971928

Dispositivos sintéticos: uma bactéria que conta!

ResearchBlogging.org

Para quem não leu, antes de ler este post, vale a pena ler o post anterior do interruptor para entender alguns conceitos básicos. Um contador é um componente central para circuitos digitais e de computação que guarda (e às vezes mostra) o número de eventos ou processos que ocorreram.

Neste trabalho é descrita a construção de contadores sintéticos para bactérias. Após a construção de um dispositivo aparentemente simples, Friedland et al. (2009) sofisticam bastante a construção do regulador para garantir uma resposta (contagem) robusta.

O primeiro contador descrito pelo trabalho é o “contador riborregulado por uma cascada transcricional” (riboregulated transcriptional cascade counter). Ele conta pulsos de arabinose no meio de cultura utilizando como sinal uma proteína luminescente (GFP). São riborregulados porque o taRNA (controlado por um promotor sensível a arabinose) se liga a cr e impede a formação de um grampo (pareamento) entre RBS e cr. Dessa maneira,  permite o reconhecimento do RBS (sítio de ligação do ribossomo) pelo ribossomo e a tradução do gene (ver Figura abaixo). O interessante é que a transcrição do taRNA é regulada por um promotor sensível a arabinose. Assim, no primeiro pulso de arabinose, ocorre a transcrição de taRNA que permite a tradução da RNA polimerase T7. Após o primeiro pulso a arabinose e taRNA são degradados. No segundo pulso ocorre, da mesma maneira, a transcrição da RNA polimerase T3 através do promotor PT7 que é especificamente reconhecido pela RNA polimerase T7. No terceiro pulso, ocorre também através da mediação de taRNA e da polimerase T3, a transcrição de GFP. Dessa maneira, a bactéria responde aos 3 pulsos de arabinose com um sinal luminescente.

Porém foi verificado um vazamento de expressão de GFP nos pulsos intermediários, além disso, demonstrou-se que se o pulso de arabinose não é dado a uma intensidade e frequência corretas, o contador  não funciona direito. Isto provavelmente ocorre devido aos limites cinéticos intrínsecos envolvendo os tempos de transcrição e degradação de mRNA.

Por esse motivo, um segundo (e muito mais bacana) contador foi construído, chamado contador de cascada de DNA invertase (DNA invertase cascade counter). Que basicamente acoplou ao modelo anterior um controle de invertases na região promotora.

Uma invertase é uma enzima muito interessante, as enzimas Cre, por ex., reconhecem determinadas sequências de DNA que flanqueiam uma determinada região de DNA e invertem a orientação dessa região. Essa enzima é utilizada para ativar os promotores através da inversão de sua orientação (ver Figura abaixo). Com essa construção foi possível obter um controle muito maior da expressão de GFP, ocorrendo, após o terceiro pulso, uma expressão muito maior de GFP. Este contador agora é muito mais robusto em relação à variação de tempo entre os pulsos de arabinose, podendo contar pulsos realizados em intervalos de tempo de 2 a 12 horas. Este novo dispositivo, além de mostrar o sinal luminescente, grava a informação no DNA através das recombinações.

Os autores foram ainda mais longe, trocaram o promotor de sensibilidade a arabinose por promotores capazes de responder a diferentes sinais. Dessa maneira, o dispositivo pode ser programado para gravar e responder diferentes sinais na ordem desejada. Incrível!

Esse dispositivo genético pode ser programado para diferentes funções a fim de sincronizar diferentes sinais para uma determinada resposta. Dependendo dos sinais acoplados ao dispositivo, estes mecanimos podem ser utilizados para biosensores, biorremediação ou na medicina.

Friedland, A., Lu, T., Wang, X., Shi, D., Church, G., & Collins, J. (2009). Synthetic Gene Networks That Count Science, 324 (5931), 1199-1202 DOI: 10.1126/science.1172005