A Incrível Sociedade dos Microrganismos


ResearchBlogging.orgÉ bem óbvio que um ser humano não existiria sozinho. Não só porque ele não poderia ser gerado, mas porque dificilmente conseguiria sobreviver. Já reparou na quantidade de pessoas que permitem (e permitiram) que você tivesse o dia de hoje como você tem? Cada parafuso, tecido, metal, tijolo e etc que permite você estudar, trabalhar, andar de automóvel, comer e ler esse texto foram pensados, feitos, montados, transportados e vendidos por alguém. Não é possível portanto tentar entender os humanos, bem como a maneira com que eles se comunicam, isoladamente. É preciso olhá-los sistemicamente, como seres sociais. As bactérias também. É cada vez mais reconhecido que as bactérias não existem como células solitárias, mas são como um “organismo colonizador” que elabora complexos sistemas de comunicação que facilitam a sua adaptação às recorrentes mudanças ambientais. E elas nascem poliglotas. A seleção natural esculpiu em diferentes espécies diversos genes que as permitem se comunicar cooperativamente e repressivamente entre espécies e até mesmo entre reinos (como por exemplo em bactérias patogênicas). Damos à essa comunicação bacteriana o nome de “quorum sensing” (“detecção em quórum” – tradução livre).

Quorum Sensing

O termo “quorum sensing” foi cunhado devido à habilidade dos microorganismos expressarem ou aumentarem a expressão de certos genes quando em grande população, podendo dessa forma monitorar a densidade celular (quantidade de células ao seu redor) antes de manifestar algum fenótipo. Um dos exemplos mais ilustrativos disso é da Dictyostelium discoideum, um protozoário que passa uma das fases do seu ciclo de vida produzindo um corpo multicelular. Tem um vídeo bem legal mostrando a formação de um corpo de frutificação através de várias células individuais de Dictyostelium:

[youtube_sc url=http://www.youtube.com/watch?v=vjRPla0BONA]
Reparem rapidamente em 00:30 min as células se locomovendo em “pulsos”, na direção de um local em que todas estão se agregando (é difícil de perceber!). Esse local inicial é em geral onde um grupo de bactérias encontrou alguma fonte de nutrientes. A “pulsação” da locomoção das bactérias acontece devido à substância de quorum sensing que é difundida pelo espaço vinda das células do local de agregação; um pulso inicial provoca – quando em uma população não muito grande, para ser perceptível – um comportamento oscilatório de resposta das células: quando uma célula recebe um sinal (do tipo “Ei, tem comida aqui!”), ela emite um de volta (como se etivesse gritando “Caramba, tem comida lá!”), que é recebido pelas células que mandaram o sinal incialmente (o que seria um “Ótimo! Estou indo praí!”) e por outras ao seu redor, propagando o sinal. Como a transmissão de informação com as substâncias não é imediata e nem totalmente contínua, observa-se os “pulsos”, que são resultado do “gap” entre enviar e receber informações pela difusão de moléculas.

As diferentes Línguas das bactérias

Tabela com exemplos das diferentes famílias de substâncias de QS, as diferentes "línguas" das bactérias. Imagem modificada de S. Atkinson e P. Williams (2009) e de Y. He e L. Zhang (2008). Referências no final do post.

As “línguas”, ou simplesmente certas coisas que as bactérias querem “dizer” (como “Estou afim de dar uma reproduzida!” ou “Fujam, eles estão vindo!”) são “ditas” através de diferentes tipos de substâncias que os microorganismos produzem. No caso da Dictyostelium ali em cima, a substância é AMP cíclico (é quase um ATP, só que duas vezes menos fosfatado… e cíclico, é claro), mas se tratando de bactérias – que ainda é a principal plataforma de aplicação da Biologia Sintética – existem três tipos principais de substâncias de quorum sensing: as acil-homoserinas lactonas (HSL ou AHL), auto-indutores 2 (AI-2) e pequenos ácidos graxos, chamados de “DSF”s (Diffusible Signal Factor – do inglês: Fator Sinalizador Difusível). Existem ainda outras famílias de substâncias de QS, mas aparentemente menos comuns que essas três principais.

O Mecanismo Gênico

A ativação dos sistemas de QS só ocorre em uma alta densidade celular. Isso permite que se chegue uma concentração limiar de substâncias de QS para expressão de genes. 1, 2 e 3 são os três elementos básicos de DNA para se construir um sistema de QS. Imagem modificada de NA. Whitehead et al (2001), referência no final do post.

Para um microrganismo ganhar a abilidade de “falar em outra língua”, em geral são necessários apenas três elementos de DNA: um gene que gere uma enzima que produza uma substância de QS, outro gene que produza o “receptor” dessa substância – que em geral é um fator de transcrição – e um promotor, no qual o fator de transcrição (após se associar à substância de QS) se liga para controlar a expressão gênica (imagem ao lado).

Se uma bactéria (por exemplo) “fala” a mesma “língua” que suas companheiras de colônia, como ela diferenciaria então um sinal próprio (a própria substância de QS sendo produzida) de um sinal de outras células (substância de QS externa)!? Isso é importante, porque se a bactéria receber o próprio sinal que envia, ela entrará em um processo autocatalítico que resultará em uma contínua auto-ativação da célula independente do sinal das bactérias ao seu redor. Acontece que uma bactéria não produz níveis suficientes de QS para “se ouvir”. Sem o sinal externo, a transcrição de genes pelo sistema de quorum sensing é fraca e insuficiente para iniciar um feedback positivo; apenas em alta densidade celular se consegue alcançar uma concentração crítica de substâncias de QS para estimular a transcrição dos genes que o QS controla.

Quorum Sensing no iGEM

Apesar de não ser um meio de transmissão de informação tão rápido e eficiente como o dos light switches, os sistemas de QS são bastante utilizados em dispositivos sintéticos devido à sua especificidade e falta de “falsos sinais” – afinal, é extremamente fácil estimular não-intencionalmente uma célula sensível à luz. No Registry of Parts existem cerca de 6 sistemas de QS completos, padronizados e disponíveis para construção, todos usando (em geral) diferentes AHLs, usados tanto na ativação e inibição da expressão de genes.

Exemplos de utilização desse sistema de transmissão de informação não faltam no iGEM. Já tratamos no blog de um dos inúmeros projetos do iGEM que utilizam quorum sensing, o da Unicamp de 2009. Em seu projeto, o time brasileiro utilizou sinais de AI-2 como um “sistema de alerta” em bactérias produtoras de bioprodutos em um bioreator. Quando um microrganismo contanimante surgisse (produzindo AI-2), o sistema de QS atuaria para comunicar sua presença a todas as bactérias ao redor do organismo invasor, iniciando gatilhos gênicos para produção de substâncias nocivas ao contaminante, afim de exterminá-lo do bioreator.

Parte do vídeo explicativo do time da Unicamp de 2009. Uma pequena esquematização de como usaram quorum sensing.

Aprender como uma população de microrganismos de comunica é extremamente útil para saber como ela se comporta, e no caso da biologia sintética, muito útil para conseguir controlar esse comportamento para transmitir informações em um dispositivo gênico sintético. Mas é claro que prever todo um comportamento de um sistema biológico não é nada fácil. Como já salientava Asimov, há algo em comum no comportamento de humanos e átomos: ambos são muito previsíveis singularmente, mas praticamente caóticos quando em coletivo. Apesar de mais simples, populações de microrganismos também se comportam assim, o que é uma das razões que tornam o trabalho em laboratório muitas vezes frustante e cansativo. Um guia nesse caos é essa compreensão sistêmica da comunicação entre bactérias (que origina certas resistências a antibióticos inesperadas e outras coisas bizarras), que assim como seres humanos, as torna seres mais sociais do que você possa imaginar.

Referências

  1. Whitehead, N. (2001). Quorum-sensing in Gram-negative bacteria FEMS Microbiology Reviews, 25 (4), 365-404 DOI: 10.1016/S0168-6445(01)00059-6
  2. Atkinson, S., & Williams, P. (2009). Quorum sensing and social networking in the microbial world Journal of The Royal Society Interface, 6 (40), 959-978 DOI: 10.1098/rsif.2009.0203
  3. He YW, & Zhang LH (2008). Quorum sensing and virulence regulation in Xanthomonas campestris. FEMS microbiology reviews, 32 (5), 842-57 PMID: 18557946

 

Computadores bacterianos

De acordo com o verbete da wikipedia, um computador é uma máquina programável desenhada para, automaticamente, realizar um sequência de operações aritiméticas ou lógicas. Um computador pode prover-se de inúmeros atributos, dentre eles armazenamento de dados, processamento de dados, cálculo em grande escala, desenho industrial, tratamento de imagens gráficas, realidade virtual, entretenimento e cultura. Os primeiros computadores analógicos surgiram no século XVII e eram capazes de realizar as funções básicas de somar, subtrair, multiplicar e dividir. Mas foi na II Guerra Mundial, em meados do século XX, que realmente nasceram os computadores atuais. A Marinha dos Estados Unidos, em conjunto com a Universidade de Harvard, desenvolveu o computador Harvard Mark I, projetado pelo professor Howard Aiken, com base no calculador analítico de Babbage. O Mark I ocupava 167m2 e pesada cerca de 30 tonelada aproximadamente, conseguindo multiplicar dois números de dez dígitos em três segundos.Seu funcionamente era parecido com uma calculadora simples de hoje em dia. Nem é preciso falar o quanto esta tecnologia se desenolveu até hoje, em que hoje se discuti processadores quânticos e se faz computação em nuvem. Uma plataforma diferente das “baseadas no silício”, que estamos acostumados, são os biocomputadores. Em 1994, em um experimento muito elegante, Leonard Adleman desenvolveu o primeiro experimento envolvendo um computador de DNA para resolver o problema do Caminho Hamiltoniano: um problema que envolve caminhos hamiltonianos é o problema do caixeiro viajante, em que um caixeiro deseja visitar um conjunto de N cidades (vértices), passando por cada cidade exatamente uma vez, fazendo o caminho de menor tamanho possível (Figura 1).

 

Figura 1. O grafo em vermelho é hamiltoniano.

Cada bola é um nó e cada flecha é uma aresta. Existem multiplas possibilidades de construir um computador baseado em DNA, em que cada um possui suas vantagens e desvantagens. A maioria deles funciona utilizando as portas lógicas (AND, OR, NOT) associadas a lógica digital utilizando como base o DNA, como por exemplo, o contador bacteriano . Porém os primeiros computadores moleculares baseados em DNA, são reações in vitro utilizando, por exemplo, enzimas de restrição, ligases, e DNA (Benenson et al. 2001). Através da mistura desse componentes e reações em cascada de digestão, ligação e hibridização, o output final é uma molécula detectável que representa o resultado computacional. Em 1994, Leonard Aldleman foi capaz desenvolver um computador in vitro baseado em DNA para solucionar o problema do Caminho Hamiltoniano (Figura 1), porém apenas em 2009, Baumgardner e colaboradores conseguiram resolver um problema complexo in vivo, em E. coli. Porém, para entender, é necessário uma série de abstrações para tornar sequências de DNA em vértices e arestas de um caminho hamiltoniano (ver Figura 2). A primeira abstração trata segmentos de DNA como as arestas de um determinado grafo. As arestas de DNA são flanqueados por sítios hixC que podem ser embaralhados por um recombinase Hin, criando diversas ordens e orientações randômicas para as arestas do grafo. A segunda abstração está relacionada com os nós, com exceção do nó terminal, em que um nó é um gene divido ao meio por uma sequência hixC. Os autores conseguiram construir enzimas funcionais portando essas sequências codificadas no DNA. Dessa maneira, a primeira metade (5´) de um nó é encontrada na aresta de DNA que termina em um nó, enquanto a segunda metade (3´) do gene é encontrado em uma aresta de DNA que se origina no nó. Calma, realmente não é fácil entender, é preciso pensar e abstrair, veja a figura 2.


Figura 2. Construção de DNA que codificam um problema do Caminho Hamiltoniano com três nós. a. O grafo contendo o caminho Hamiltoniando começa no nó RFP, procedendo para o nó GFP e terminando no nó TT. b. Construção ABC representam a solução para o problema dos três nós. Os três fragmentos de DNA flanqueado por hixC estão na ordem e orientação corretas, de maneira que os genes GFP e RFP estão intactos. ACB possui o gene RFP intacto, porém o gene GFP está errado, por fim, a construção BAC não possue nenhum gene intacto.

A Figura 2a mostra o grafo com os 3 nós e as 3 arestas que foram escolhidas para serem codificados no computador bacteriano. O gráfico contêm um único caminho hamiltoniano que começa no nó RFP, viajando pela aresta A até o nó GFP, e utilizando a aresta B até alcançar o nó final TT. A aresta C, the RFP até TT é um detrator. A Figura 2b ilustra como as construções de DNA foram utilizadas para solucionar o problema do Caminho Hamiltoniano com um controle positivo e duas configurações sem soluções. Já que as soluções precisam originar no nó RFP e terminar no nó GFP, a aresta A de DNA contêm na extremidade 3´a metade de RFP seguida por a extremidade 5´de GFP. A aresta B de DNA se origina em GFP e termina em TT, dessa maneira, esse fragmento de DNA possui 3´GFP seguido de um terminado de transcrição duplo. A aresta C se origina em uma metade 3´ de RFP e termina em TT. Finalmente, com os genes codificadores para RFP e GFP estão intactos, com promotores e RBS, e seguintes de um terminador de transcripção, colônias ABC expressam fluorescência vermelha e verde, dessa maneira, possuem aparência amarela.

Para concluir a abstração eu gosto de imaginar que a recombinase Hin é o caxeiro viajante que faz o seu caminho pelo DNA e a sequência de DNA contem o mapa do caminho realixado.

A programação de bacteria para computar soluções de problemas complexos podem oferecer as mesmas vantagens dos computadores atuais que estamos acostumados, porém, com as seguintes características adicionais: (i) sistemas bacterianos são autônomos, eliminando a necessidade de intervenção humana, (ii) computadores bacterianos podem se adaptar a condições flutuantes, evoluindo para resolver desafios de determinados problemas e (iii) o crescimento exponencial de bactérias continuamente aumente o número de processadores trabalhando em um problema (Baumgardner et al., 2009). Sem contar que eles ainda poderiam fazer fotossíntese…

Adleman LM: Molecular computation of solutions to combinatorial problems. Science 1994, 266:1021-1024.

Benenson Y, Paz-Elizur T, Adar R, Keinan E, Livneh Z, Shapiro E: Programmable and autonomous computing machine made of biomolecules. Nature 2001, 414:430-434.

Baumgardner , J et al. Solving a Hamiltonian Path Problem with a bacterial computer. J. Biol. Eng. 2009, 24;3:11.

Ligações Improváveis: RNA antisense, Sudoku e Redes Neurais

A ciência é cheia de ligações improváveis.

Veja por exemplo o estudo das partículas subatômicas e seus spins: quem diria que conhecer isso poderia permitir uma revolução na neurociência? Entendendo como o núcleo atômico dos átomos se comporta em um campo magnético foi possível construir o aparelho que permite literalmente olhar dentro de nosso cérebro, passando bem longe de um desconfortável bisturi: o aparelho de Ressonância Magnética Nuclear Funcional (geralmente os hospitais e clínicas tiram o “Nuclear” do nome porque isso assusta os pacientes; é sério!).

Chamamos essas ligações de “improváveis” principalmente por causa da sua contra-intuitividade, afinal quem pensaria em analisar o comportamento de cérebros ao se estudar algumas das menores coisas do universo!? Fazer essas pontes é o que se precisa para criar inovação, e é exatamente na busca desse tipo de coisa que nas últimas reuniões do Clube de Biologia Sintética começamos a fazer algumas ligações (não necessariamente na ordem do título) que “do lado de fora” têm uma aparência improvável, mas que no fundo talvez só sejam contra-intuitivas.

Tudo começou, ou melhor, tudo deveria ter começado (para amenizar a aparente desconexão) falando-se da mais novinha regulação de expressão gênica no mundo das descobertas científicas:

O RNA de Interferência

Representação do funcionamento dos RNAs antisense: quando se ligam à uma fita de RNA mensageiro com alto grau de complementariedade entre as fitas (diz-se "complementariedade" entre duas fitas de DNA (ou RNA) quando o código genético de ambas têm sequências de nucleotídeos que ligam-se entre si através dos pares A-T (U em RNAs) e C-G formados entre as fitas), há o bloqueiro da atuação da RNA polimerase, impedindo a tradução do RNA em proteína. Se não houver muita correspondência entre as fitas de RNA a traduação continua normalmente.

É mais uma daquelas descobertas “nobélicas”, estudada pelos pesquisadores americanos Andrew Fire e Craig Mello em 1998, ganhando o prêmio em 2006. A grande ideia dos RNAs de interferência (iRNA) é o pareamento  de pequenos segmentos de RNA – que não são codificados em proteínas – com RNAs mensageiros, impedindo que sejam traduzidos por “bloquear” o ribossomo . Esse sistema de inibição gênica envolve várias enzimas (se quiser saber mais veja esse ótimo vídeo) e é um pouco mais complexo do que o sistema de regulação gênica daquilo que chamamos de RNA antisense, mas na essência funcionam do mesmo jeito: bloqueio da tradução através de um RNA antisense complementar. A grande diferença entre os RNAs antisense e os de interferência, que são comumente confundindos com sinônimos, é que os iRNA atuam através de toda uma via de reações enzimáticas em eucariotos, enquanto os RNA antisense são mais característicos de seres procarióticos e não precisam de uma via enzimática para regularem a expressão gênica.

Diferentemente dos outros tipos de regulação mediados por inibidores, que são basicamente proteínas que se ligam ao DNA inibindo a transcrição gênica, com os RNAs antisense têm-se uma gama muito maior de inibidores da expressão gênica. Imagine que você quer controlar uns 2 ou 3 genes em uma bactéria: existem muitos metabólitos que podem fazer esse trabalho (por exemplo IPTG, galactose, TetR e etc.), mas e se você quiser ter um controle de mais genes, digamos, uns 20!? Dá-lhe repressores! Por outro lado, se for possível usar RNAs de interferência suficientemente eficientes, poderia se fazer um vetor de transformação bem mais enxuto (em relação aos sítios repressores) além de poder construir um mecanismo de repressão mais orientado ao “alvo” de repressão: basta construir um RNA mensageiro complementar. É exatamente essa versatilidade que torna possível contruir uma…

 Bactéria Resolvedora de Sudoku

Legal: Sudoku, Bactérias e RNA antisense… O que essas coisas têm a ver!?

Essa grande ideia veio do time japonês UT-Tokyo do iGEM de 2010, e além de usar RNAs antisense, também usou do dispositivo gênico baseado em recombinases semelhante ao que o time da Unicamp usou em 2009 para a mesma finalidade, que é diferenciar diferentes populações de bactérias. O sistema que eles criaram funciona basicamente assim:

Populações Diferentes

Diferentes tipos de Populações

Eles representaram (em um sudoku 4×4) cada posição por uma população específica de E.coli’s. Cada posição tem algo em seu DNA que a torna diferente de todas.

Diferentes Estados

Estados das Populações

Cada população pode se diferenciar em quatro tipos diferentes de E.coli’s correspondentes à cada número que um sudoku 4×4 permite (1, 2, 3 e 4).

Comunicação entre as Posições (Populações)

Comunicação viral entre as posições (populações) do sudoku

As populações devem se comunicar para transmitir a informação de suas posições para as outras posições; afinal é assim que se resolve um sudoku: podemos dizer que uma posição é 1, 2, 3 ou 4 depois de recebermos as informações de quais números existem no quadrado, linha e coluna correspondente à posição em questão.

Essa comunicação é feita através de vetores virais, que são vírus que as bactérias produzem para infectar as outras populações correspondentes às outras posições, transmitindo as informações que possuem (como sua “posição” e “estado”: 1, 2, 3 ou 4).

Diferenciação dos Estados

Diferenciação dos estados

Para o sudoku funcionar, quando uma posição identificar qual é o estado de suas vizinhas, ela deve se diferenciar justamente no estado que não recebeu sinal. Por exemplo (imagem ao lado), se a posição (1,1) (linha 1, coluna 1) receber as informações de que certas posições em seu quadrado, linha e coluna já estão diferenciadas nos estados 3, 2 e 1, ela deve se diferenciar em 4. Para conseguir fazer isso, os japoneses usaram o dispositivo chamado “4C3 leak switch”, que se baseia na probabilidade de uma polimerase em “ignorar” os sítios terminadores de transcrição. Para entender melhor, veja a imagem abaixo:

Cada gene codifica um tipo de recombinase (as setinhas apontando para a esquerda: Hin, flpe, Ligand 3 e Ligand 4). Quando a E.coli for infectada por um vírus de uma posição com que se comunica, ele inserirá um plasmídeo que expressa uma dessas 4 recombinases, agindo nas posições que flanqueam o mesmo gene na bactéria. Por exemplo, na imagem da diferenciação dos estados, a posição (2,2) envia um vírus à (1,1) passando a informação de que possui o estado “2”, expressando a recombinase flpe e retirando o respectivo gene do plasmídeo bacteriano através das posições FTR que flanqueiam o gene (ver imagem acima). Ao fazer isso, também retirará o sítio terminador que fica entra os FTR, aumentando a probabilidade da polimerase atravessar todas as sequências de recombinases de sequências invertidas e expressar a cre recombinase (setinha cinza apontando para a direita). Depois, se a posição (1,1) receber mais dois vírus diferentes, ele perderá 3 genes de recombinase e três sítios terminadores, restando apenas um sítio terminador entre o promotor pT7 e o gene cre. Nesse estágio, a probablilidade de a polimerase ultrapassar o sítio terminador (daí que vem o “leak”) é considerável, e quando o faz, transcreve a cre recombinase, que retira seu próprio gene e os dois sítios terminadores duplos depois dele, conectando o gene de recombinase que não foi retirado do plasmídeo junto dos genes que também estão em sentido reverso, transcritos pelo promotor pSP6. Além disso promove a produção de vírus através da retirada dos dois sítios de parada que separam o segundo promotor pT7  do gene que transcreve a polimerase que atua no promotor pSP6 e o gene que produz o capsídeo do vírus. O empacotamento das sequências genéticas no vírus acontecem após a loading sequence (retângulo rosa). Isso faz com que a posição 1 passe também a “emitir” vírus informando seu estado e posição.

Para entender de verdade, vale assistir o vídeo (começa mesmo aos 24 seg) que o próprio time japonês fez para mostrar o funcionamento do sistema (percebam o sotaque!):

Restrição de Posições

Para isso dar certo é preciso que somente as populações da respectiva linha, coluna e quadrado comuniquem-se entre si, ou seja, deve have uma restrição à comunicação entre as populações de posições não-relacionadas segundo o sudoku. Como isso é feito!? Sim! RNAs antisense!

Tudo isso só consegue funcionar graças à atuação dos RNAs antisense que coordenam o fluxo de informação entre as diferentes populações associadas às diferentes posições do sudoku. Na imagem do 4C3 leak switch são as location sequence que contém todas as sequências codificantes dos RNAs de interferência de cada posição. Com isso é possível construir uma tabela de correspondência de antisense que dirá quais antisense uma posição deve fazer para inibir a atuação dos vírus de outras posições não-relacionadas:

Mas espera aí! O sudoku é uma tabela 2D, como é possível separar as diferentes populações, uma em cada posição característica, e assim fazer a transferência de informação!? É preciso construir algo físico – uma tabela de sudoku de verdade – para esse sistema sintético!? Resposta: não é preciso “separar” as populações, a interação entre os RNAs antisense dos vírus de cada população que remete à uma posição dá conta do recado. Você pode misturar todas a populações em um tubo de ensaio (com o input, é claro) e depois analisar os estados de cada bactéria pertencente à um tipo de população (por sequenciamento) e assim saber o resultado do sudoku.

Esse conceito de restrição de informação por RNAs antisense, e esse fluxo de informação por vírus é essencial para se entender o que estávamos discutindo no clube de biologia sintética, sobre como fazer em um sistema bactériano uma…

Rede Neural

Por fim: rede neural! Como fazer um dispositivo biológico sintético que imite uma rede neural!?

Bem, abstratamente falando, uma rede neural pode ser simbolizada através da imagem ao lado: os neurônios (as bolinhas) e suas ligações. O que temos em comum entre esses sistema e o sudoku são que temos posições espaciais trocando informações e seguindo um padrão. No sudoku o que restringe o fluxo de informação são as regras que pré-estabelecemos para o jogo, no sistema neuronal o que restringe a comunicação é apenas o espaço (existe um número finito de ligações axônicas que os neurônios podem fazer devido à limitação de espaço), além de outro fator: o “peso” dessas interações, que associa uma intensidade de fluxo de informação entre neurônios (o aumento desses “pesos” durante o tempo devido a um estímulo é o que chamamos de aprendizado).

Rede de Hopfield

Para querer fazer o design de um sistema sintético que se comporte como uma rede
neural devemos usar um modelo que represente uma rede neural! Existem vários deles, mas um mais simples e talvez o mais interessante para usarmos é a Rede de Hopfield, muito usada em computadores para reconhecimento de padrões. Hopfield é chama de uma rede de memória associativa pois consegue armazemar memória através da associação de informações existentes na comunicação entre vários neurônios. Uma das implicações disso é a capacidade de recuperar esse padrão mesmo quando dado um padrão incompleto.

Exemplo do Funcionamento

Imaginemos que, semelhantemente ao sudoku, também tenhamos uma matriz com posições, só que agora 3×3 e tendo apenas dois estados: “preenchida” ou “ativada”(denotada por 1), e “não-preenchida” ou “inativada” (denotada por 0). Podemos construir então “letras” preenchendo essas posições. Queremos que nosso sistema reconheça o padrão incompleto dessas letras e complete-o com sua memória:

Legal, mas como funciona o algoritmo disso!? Basicamente é com a definição das conexões que esses dois padrões têm. Partindo da hipótese que somente as posições próximas podem se comunicar (assim como neurônios, em um modelo simplificado), no padrão que pré-estabelecemos para o sistema, a comunicação entre duas posições preenchidas é considerada excitatória, ou seja, uma posição influencia a outra a permanecer ativada; já quando uma posição não-preenchida se comunica com uma preenchida, a comunicação é considerada inibitória; e por fim, quando duas posições não-preenchidas estão uma ao lado da outra, há indiferença e não há ativação ou inibição entre si (ver imagem abaixo). Com isso podemos criar uma rede de comunicação  característica de cada figura com os pesos dos padrões.

Para a rede reconhecer ambos os padrões, deve-se somar os pesos dos padrões L e T:

Cada peso de comunicação da soma dos pesos é computada para reestabelecer um dos padrões da memória dado um padrão incompleto. Vejamos o exemplo da imagem abaixo: um L incompleto. Para decidir se a posição não-preenchida se preencherá é preciso computar o padrão incial em relação aos pesos na “memória da rede” com a expressão abaixo, em que wik é o peso da interação entre a posição em questão (denotada por i) e uma determinada posição k.

Então somando-se os produtos entre os estados xk (das k posições comunicando-se com a posição incompleta) e os pesos wik das interações entre as k posições e a posição incompleta, define-se o estado que a posição incompleta deve ter: se é de fato um estado inativado ou ativado (preenchido):

x(3,1) = 1 . 1 + 0 . 1

x(3,1) = 1

Portanto, segundo a interação associativa da rede, a posição (3,1) torna-se em um estado ativado (1) completando a letra L. Para diferentes inputs o cálculo é o mesmo e (com algumas exceções) o sistema sempre se ajusta à um dos dois padrões de sua memória: ou um L ou um T.

Como Fazer isso com Bactérias

Assim comom no sudoku, podemos criar diferentes populações de bactérias para cada posição além de – pelo mesmo mecanismo – uma rede de transmissão de RNAs antisense por vírus baseando-se na tabela de pesos das interações entre as populações existentes (a “memória” do sistema), de modo que cada posição tenha os antisense corretos para reprimir ou estimular a produção de uma determinada proteína repórter para cada posição! O que se diferenciaria do sudoku é que precisaríamos construir um aparelho literal do sistema que queremos construir, ou seja: é preciso separar as diferentes populações para discernir os outputs para saber ao certo qual população referente emitiu luz verde por GFP, por exemplo. O input também poderia ser luz, feito através de um light switch.

E assim o ciclo das relações um tanto improváveis se fecha. Mas como a ciência é extremamente mutável vários outros assuntos podem se juntar nessa ciranda e dar origem a outras “improbabilidades”. Você, leitor, também pode fazer parte desse trabalho ou pelo menos acompanhar de perto e conhecer um pouco melhor sobre essas coisas que andam rolando nas discussões do clube de biologia sintética através das reuniões gravadas, em especial (sobre como fazer uma rede neural artificial em bactérias)  essa aqui no nosso canal no LiveStream.

Quem sabe possamos colocar em prática tudo isso!? Vejamos em 2012!

Scinamate Synthetic Biology

Vídeo legal sobre SynBio

[youtube=http://www.youtube.com/watch?v=xOx3B2Z_qqE]

[twitter-follow screen_name=’MnlimasBio’]

Light Switches: Um Review

ResearchBlogging.orgJá tratamos nesse blog de um dispositivo simples, mas engenhoso, para a transdução de um sinal luminoso em uma resposta genética desejada, no caso um switch de luz vermelha. Mas podemos abranger o conceito de switch de luz para uma variada gama de mecanismos que a própria natureza esculpiu durante os milhares de anos que teve para se divertir sozinha antes que nós aprendêssemos a modificá-la.

Os mecanismos mais óbvios, que conhecemos bem antes de termos conhecimento da existência de uma célula, são os das plantas. Apesar de pensarmos nesses seres vivos como a fonte mais provável das ferramentas que precisamos para construir um light switch, a biologia sintética utilizou até agora principalmente os dispositivos fotossensíveis de microorganismos fototróficos e quimiotróficos, presentes em uma grande quantidade de bactérias.

As funções de muitos fotorreceptores ainda não são muito claras, mas alguns exemplos na natureza da atividade desses mecanismos vão desde a regulação da motilidade celular, formação de pigmentos, reparo de DNA, resposta ao stress , à até “comportamentos multicelulares”, como a formação de biofilmes e de corpos de frutificação, como por exemplo a Stigmantella aurantiaca.

Corpo de frutificação da Stigmantella aurantiaca.

Corpo de frutificação de Stigmantella aurantiaca. Retirado da publicação de van der Hornst et al, mencionada no final do post.

A grande maioria das proteínas fotossensíveis que a seleção natural pôde criar nesses milhões de anos, e que até agora conhecemos, pode ser classificada em seis famílias bem definidas, baseada na estrutura do cromóforo absorvedor de luz, que podem ser: as famosas rodopsinas, os aqui já conhecidos fitocromos, as xantopsinas, os criptocromos, as também famosas fotropinas e as proteínas de domínio BLUF (blue light sensing using flavin (FAD), domínio utilizador de flavina sensível à luz azul).

A natureza é sutil; ela parte de princípios básicos e com eles (utilizando um bocado de tempo) cria as mais variadas soluções para um mesmo problema. Com os fotorreceptores não é diferente. Uma procura de similaridade de sequências que codificam esses seis tipos de fotorreceptores no mecanismo de busca protein BLAST do NCBI revela uma grande quantidade de sequências similares nos genomas de diferentes espécies, indicando um vasto número de receptores ainda não caracterizados em diversos microorganismos. Um exemplo dessa busca pode ser visto da lista deste link: Chemotrophic organisms containing protein photoreceptor domains.

O princípio básico dos fotorreceptores é: uma estrutura molecular que contenha um ou mais domínios que captam a luz (input) e outro(s) que transforme(m) isso em um sinal intracelular (output). Os domínios de input ligam-se a cofatores ou cromóforos, resultando em uma molécula capaz de absorver luz UV ou visível. O domínio do output pode possuir uma atividade enzimática, proteína-ligante, ou DNA-ligante.  Vejamos alguns domínios de input e de output comumente encontrados in natura.

Domínios de Input Domínios de Output
AppA: Anti-repressor de pigmentos fotossintéticos. O AppA foi a primeira proteína com domínio BLUF caracterizada em Rhodobacter sphaeroides. Absorve na região dos 446 nm com o seu cromóforo FAD. Além de sensível à luz, está envolvida em reações redox.BLUF: Um domínio presente em várias proteínas fotoativas, sua estrutura é similar, mas com um mecanismo funcional totalmente diferente, ao domínio PAS.

LOV: Uma subclasse do domínio PAS, nomeado LOV devido ao tipo de sinal que esse domínio detecta: Luz-Oxigênio-Voltagem (light-oxygen-voltage). Esse tipo de domínio foi descoberto em fototropinas de plantas e mais recentemente em proteínas bacterianas. Um tipo de domínio bem “popular”.

PAS: De “Per-Arnt-Sim”, três reguladores transcricionais que contêm esse tipo de domínio. Outro tipo de domínio bem “popular” no quesito receptor de luz. Muitas proteínas com domínio PAS são conhecidas por transmitir o seu sinal associando-se a cofatores.

Fitocromo: Receptor de luz vermelha e infravermelho encontrado em plantas e bactérias, ligando-se em uma cromóforo de bilina (Lembra do red light switch? A Ficocianobilina é um desses cromóforos).

PYP: De photoactive yellow protein (proteína fotoativa amarela). Um receptor de luz citoplasmático que usa ácido p-coumárico como seu cromóforo. Sua absorção máxima é em 446 nm.

Rodopsina: Proteína composta por um conjunto de sete hélices intermembrana (ver imagem na tabela abaixo), ligando-se a um cofator retinal em seu centro hidrofóbico, absorvendo em maior parte luz verde. Há uma grande quantidade de estudo sobre ela.

YtvA: Um bem caracterizado domínio fotoreceptor de luz azul em Bacillus subitilis. Possui um domínio LOV que se liga ao cromóforo monoflavina (FMN), o que resulta numa absorção máxima em torno de 449 nm.

EAL: Domínio com atividade enzimática diguanilato-fosfodiesterase (traduzindo: envolvido na hidrólise de di-GMP cíclico, um importante sinalizador intracelular). Chama-se EAL por causa de sua sequência conservada de resíduos, mas também conhecido como DUF2.GAF: Domínio com atividade de adenilato-ciclase, guanilato-ciclase, e fosfodiesterase. Liga-se à um cofator bilina em alguns fitocromos.GGDEF: Similar ao EAL, possui atividade de ciclase em diguanilatos (di-GMP). Também possui seu nome devido à sua sequência conservada, conhecido também por DUF1.

HisKA: Domínio fosfoaceptor e dimerizador de proteínas histidina-quinases, importantes proteínas na sinalização intracelular.

HTH: Domínio de ligação ao DNA de reguladores de transcrição bacterianos. Eles se ligam ao DNA via seu motivo (sequência específica de aminoácidos) helix-turn-helix (hélice-dobra-hélice).

STAS: O domínio STAS, cujo nome significa domínio transportador de sulfato e antagonista de fatores anti-sigma (traduzindo: promove a atividade do tal fator de transcrição sigma), é o domínio de output do bem caracterizado YtvA, mas também encontrado em outros fotoreceptores.

Sabendo como as coisas são naturalmente, é possível juntar diferentes peças desse zoológico de domínios proteicos e formar diferentes light switches. Vejamos por exemplo o red light switch: basta juntar um domínio input de fitocromo e um output de ligação ao DNA, no caso o GAL4. Para sintetizar um switch de luz azul, verde, amarelo, e etc, o princípio fundamental é o mesmo: basta montar um input e um output desejados. O resto é pura metodologia e testes. Alguns exemplos de construções naturais podem ser:

Combinações naturais de diferentes domínios Input e Output.

Imagem modificada retirada da referência deste post (van der Hornst et al.).
 

Como se pode ver, o domínio de input LOV parece ser o mais versátil, o que talvez explique a sua “popularidade” no mundo bacteriano dos domínios fotossensíveis. Encontra-se um LOV input ligado à vários tipos diferentes de outputs.

Uma coisa interessante a se levar em conta nessas construções naturais é o tempo de alternância entre os diferentes estados dos fotorreceptores, que como vimos no red light switch, se resume (na maioria dos casos) a um estado “ativo” quando exposto a luz e um “inativo” quando no escuro ou quando passado certo tempo de exposição. Quando o ciclo de mudança do estado ativo para o inativo é um pouco lento, ele é geralmente compatível com regulações na expressão gênica, enquanto graus rápidos de mudança são relacionados com uma regulação comportamental (que não envolve diretamente uma regulação gênica, como por exemplo o aumento da taxa de motilidade de uma bactéria quando exposta à luz). Um ciclo de mudança ainda mais rápido sugere funções bioenergéticas para o fotoreceptor. Isso é um parâmetro importante a se levar em conta no design de dispositivos sintéticos fotossensíveis.

No fundo, talvez grande parte da própria biologia  sintética se resume ao que discutimos aqui: mudança de informação com recombinação. Caímos então no ponto recursivo da biologia. À diferentes níveis e abordagens sempre teremos  a mesma simples metáfora dos blocos de montar: os blocos sempre são os mesmos, o que muda é a informação que colocamos neles ao fazermos diferentes estruturas com diferentes combinações das unidades. Quer um light switch específico que ainda não foi feito? Já está pronto, só basta combinar informação.

Em posts futuros mostraremos como combinar inputs e outputs para criar light switches de outras cores, novamente, com as construções feitas pelos de times de edições passadas do iGEM. Para maiores e melhores informações sobre fotorreceptores, vale consultar o ótimo review de Michael van der Hornst et al:

van der Horst MA, Key J, & Hellingwerf KJ (2007). Photosensing in chemotrophic, non-phototrophic bacteria: let there be light sensing too. Trends in microbiology, 15 (12), 554-62 PMID: 18024131

Bancos de dados, GenBank, homólogos e ortólogos.