A Busca pelo Código Matemático da Vida
Crédito: NIH Image Gallery

FYI.

This story is over 5 years old.

Tecnologia

A Busca pelo Código Matemático da Vida

A aleatoriedade das mutações nos genes é um dos preceitos fundamentais da biologia. Mas um algoritmo criado por brasileiros questiona se existe uma ordem oculta por trás do acaso.

Da próxima vez que compartilhar um arquivo de voz, texto ou imagem, lembre-se que você está sendo ajudado por um herói anônimo digital: o código corretor de erros, ou ECC, na sigla em inglês. Acontece quase sempre, acredite. Ao transmitirmos ou armazenarmos um arquivo, é bem comum ocorrerem falhas que resultam na perda de dados. Quando rola isso, os softwares do tipo ECC calculam o bit que deveria estar ali e o restauram para recuperar a integridade da mensagem. O sistema é tão eficiente que, ao abrirmos o arquivo, sequer imaginamos que algo se perdeu pelo caminho e foi trazido de volta do passado pelo poder da matemática.

Publicidade

Isso acontece há um tempinho no mundo digital e, agora, um grupo de pesquisadores brasileiros está trazendo os ECCs para a biologia. A razão é simples: analisar sequências de DNA e de RNA do modo mais preciso possível.

Publicado em julho passado na revista científica Scientific Reports – pertencente ao mesmo grupo responsável pela Nature –, o trabalho tem permitido aos pesquisadores tanto vislumbrar o passado (ao apontar indícios de eventos ocorridos há milhões de anos) quanto projetar o futuro (para gerar inovação em áreas como o tratamento de doenças e o desenvolvimento de novos organismos transgênicos).

Mas o mais curioso nessa história é que a pesquisa também gerou polêmica ao fornecer subsídios para questionar uma das ideias canônicas do pensamento biológico: a de que as alterações genéticas acontecem de forma aleatória. Para alguns pesquisadores, elas podem resultar de um ordem lógica – uma sequência algébrica, melhor dizendo.

DNA GERADO POR VIA DIGITAL

Denominado de "algoritmo gerador de sequências de DNA", o código foi desenvolvido por Reginaldo Palazzo Júnior, da Faculdade de Engenharia Elétrica e da Computação da Unicamp, e por duas orientandas de mestrado e doutorado. A equipe é complementada por Marcelo Brandão, do Centro de Biologia Molecular e Engenharia Genética da Unicamp, e por Márcio Castro da Silva, da Escola Superior de Agronomia Luiz de Queiros, da USP, junto de uma aluna de doutorado. São eles que cuidam da parte biológica.

A aproximação entre o universo da genética e o da análise de dados digitais não é gratuita. No mundo do carbono, as informações necessárias para a produção das proteínas de um determinado organismo estão armazenadas no interior das células, sob a forma da molécula de DNA. Este se organiza em duas fitas compostas por quatro unidades diferentes, os nucleotídeos, que estão distribuídos ao longo das fitas em grandes grupos funcionais chamados de genes. A sequência exata dos nucleotídeos dentro do gene é o código que contém a informação necessária para sintetizar as proteínas que constituem e caracterizam um organismo. A totalidade dos genes de um organismo é chamada de genoma.

Publicidade

Quando o organismo precisa "construir" uma nova proteína, a sequencia de nucleotídeos presente numa certa região do DNA fornece o parâmetro para a formação de um RNA mensageiro. Diz-se, então, que a informação do código foi "transcrita" para o RNA. A partir do RNA mensageiro surge a uma nova proteína, na etapa conhecida como "tradução" do código genético.

Assim como ocorre na transmissão dos dados digitais, diversas interferências podem levar ao aparecimento de erros de transcrição e de tradução do código genético, alterando as sequências dos nucleotídeos. Tais variações são conhecidas como mutações e podem vir a gerar alterações na proteína que vai surgir. Os seres vivos possuem seus próprios equivalentes aos ECCs, capazes de vasculhar as sequências de DNA e de RNA mensageiro em busca de erros e fazer retificações. São combatentes de mutações. Nem sempre, porém, os mecanismos funcionam, e as mutações podem ser incorporadas ao DNA permanentemente.

"Será que o organismo perdeu o código matemático? Será que a matemática é um sistema orquestrador do maquinário biológico? São muitas questões em aberto."

Os pesquisadores brasileiros empregaram o algoritmo na análise de 580 genes de diversos seres vivos, entre eles a planta Arabdopsis thaliana, fungos do gênero Saccharomyces e até um gene humano associado ao aparecimento de câncer de mama. Para fazer a análise, o código transforma a sequência dos nucleotídeos numa matriz de bits. A partir daí, estabelece parâmetros do que deveria ser a sequência correta e procura por supostos erros de codificação.

Publicidade

Os resultados das análises sugeriram que, em vários genes, havia nucleotídeos trocados em uma ou mais posições. "Quando se fazia esta regeneração da informação, do código binário para o genético, o resultado apontava para uma mutação", explica o biólogo Brandão. O desafio era entender o que, em termos biológicos, o código matemático estava mostrando.

O passo seguinte foi recriar a história evolutiva desses genes a fim de recuperar as mudanças ocorridas na sequencia de nucleotídeos ao longo do tempo. Os resultados mostraram que muitas das sequências propostas pelo código realmente existiram. "No caso das Arabdopsis thaliana, por exemplo, a análise mostrou que aquela sequência existia até 1 milhão de anos atrás. Só depois disso passou por uma mutação e adquiriu as características que tem hoje", diz Brandão. "Foi uma surpresa constatar que o código estava nos mostrando o passado."

Outro resultado valioso foi identificar casos em que a ocorrência de mutações levou a consequências importantes. É o caso do gene humano F1F0, associado ao câncer de mama. A recuperação da sua história mostrou que, até um período entre 2 e 4 milhões de anos, o gene possuía uma sequência diferente que impedia a transcrição completa do gene que leva à formação da célula maléfica. "No curso da evolução, essa sequência foi pedida e surgiu esta mutação que torna possível hoje o câncer de mama", diz Brandão.

A capacidade do código de identificar posições extremamente funcionais pode gerar importantes desdobramentos. Imagina-se um cenário em que uma pessoa tem seu código genético sequenciado, a fim de mapear sequências de nucleotídeos que eventualmente possam gerar câncer. A seguir, os candidatos são avaliados pelo código para tentar identificar qual mutação tem maior potencial de causar problemas. A partir daí, é possível vislumbrar um tratamento que busque atuar apenas naquela determinada região do DNA.

Publicidade

Um procedimento parecido pode ocorrer no desenvolvimento de um novo vegetal transgênico. Em vez de tentar realizar mutações em diversas regiões do DNA escolhidas de modo aleatório, a empresa desenvolvedora do produto saberia antecipadamente onde atuar para obter uma transformação benéfica e capaz de ser passada à frente para as futuras gerações do organismo. Com perspectivas comerciais tão favoráveis, o código está em processo de patenteamento nos EUA.

NEM TÃO ALEATÓRIO ASSIM

Outro legado importante da pesquisa está em deixar no ar a pergunta: afinal, por que o código funciona? "Será que o próprio mecanismo de reparação do DNA das células obedece ao mesmo código?", questiona Brandão.

A corrente de pensamento hoje dominante na biologia estipula que as mutações ocorrem aleatoriamente. Para o biólogo, no entanto, o sucesso do algoritmo sugere que essa aleatoriedade responde a uma estrutura algébrica que, em alguma medida, orienta a constituição das sequências de DNA.

Será, então, que faz sentido falar ainda em aleatoriedade das mutações? "Já há dez anos se está questionando a ideia da aleatoriedade das mutações. E se elas não são tão aleatórias, pode ser que nosso curso evolutivo também não tenha sido tão aleatório, tão 'jogo de dados'. Não sei a resposta. Mas acho que alguns paradigmas da biologia podem mudar", diz.

O paradigma dominante na biologia atende pelo nome de síntese neo-darwinista e começou a ser formulado na década de 1940. É uma estrutura teórica que procurou adaptar e atualizar conceitos essenciais do pensamento de Darwin, tais como hereditariedade, variabilidade e seleção natural, à medida que novos campos inteiros se abriam dentro da biologia, da genética de populações à biologia molecular. O fato de que um dos expoentes da síntese neo-darwinista, o biólogo inglês Richard Dawkins, seja hoje um dos populares cientistas do planeta só atesta o prestígio de que ela desfruta, inclusive fora da academia.

Publicidade

Ao longo do século 21, vem se consolidando uma pequena mas ativa comunidade de pesquisadores que contesta a síntese neo-darwinista – ou pelo menos alguns elementos dela. Os novos resultados revelados pelas pesquisas turbinam os questionamentos. As indagações que surgiram em Marcelo Brandão após seu trabalho com o algoritmo gerador de sequências de DNA são um bom exemplo de como esta corrente está, aos poucos, agregando simpatizantes.

Em congressos, Brandão já falou sobre o código com adeptos desta linha de contestação da síntese. "Já há pesquisas que mostram que a maior parte das mutações deletérias acontece em regiões determinadas do genoma. Será que o organismo perdeu o código matemático? Será que a matemática é um sistema orquestrador do maquinário biológico? São muitas questões em aberto."

Para os brasileiros, o nome mais conhecido dentre os opositores da síntese Neo-Darwinista é o da israelense Eva Jablonka, da universidade de Tel Aviv. Ela desenvolveu um sistema que chama de síntese evolutiva expandida, tema de seu livro Evolução em Quatro Dimensões. Nele, dedica todo um capítulo a analisar mutações e apresenta diversos exemplos de casos onde elas seriam induzidas ou mesmo dirigidas. "Nem todas as mudanças genéticas devem ser vistas como eventos aleatórios e casuais . (…) A evolução pela seleção natural levou à construção de mecanismos que alteram o DNA em resposta a sinais que as células recebem de outras células no ambiente", escreve ela. (Jablonka já visitou diversas universidades brasileiras e, abaixo, você pode assistir na íntegra e com tradução simultânea, a um curso de três dias que ela proferiu sobre suas ideias na Escola Nacional de Saúde Pública, a ENSP, no Rio, em 2013.)

Publicidade

Mas será que é preciso mesmo aposentar a síntese Neo-Darwinista para acomodar resultados como os obtidos pelo algoritmo gerador de sequências de DNA? Para o professor da Universidade Federal de Minas Gerais, Romeu Cardoso Guimarães, pesquisador de genética há mais de quatro décadas e referência em genética sistêmica, a resposta é não.

Ele pensa que a pesquisa de Palazzo e Brandão pode ter conseguido reproduzir um padrão da própria natureza. Mas isso não é suficiente para questionar, de forma abrangente, o conceito de aleatoriedade, que já foi definida pelo biólogo francês e nobelista Jacques Monod como "independência entre as necessidades do organismo e as mutações que ele experimenta".

Guimarães pondera que, na base dos eventos biológicos, estão as interações entre moléculas que por si mesmas não são aleatórias. "Cada molécula tem suas próprias tendências, pode reagir com uma e não com outra. Nesse sentido, sempre existe alguma coisa de direcionalidade", diz. No caso das sequências de genes, outro fator limitante é o contexto. "Se uma proteína de hemoglobina sofrer uma mutação, não vai virar outro tipo de proteína, como um microtúbulo. É um tipo de aleatoriedade que não tem todos os graus de liberdade possíveis para ocorrer", analisa.

Ele diz que são conhecidos alguns mecanismos em que as mudanças num genoma podem ocorrer guiadas por fatores específicos. Um deles ocorre quando insetos desenvolvem resistência à inseticida. Nesses casos, os insetos que possuem genes capazes de proporcionar alguma resistência ao produto irão experimentar uma multiplicação na quantidade destes genes em seu genoma. "O inseticida está multiplicando a ocorrência da mutação, mas não a está induzindo".

O biólogo da UFMG reconhece que a existência das regiões onde a taxa de mutações é maior, as chamadas "hotspots", é algo bem aceito hoje na comunidade biológica. "Mas neste caso, o que costuma ser dirigido é o local onde as mutações estão acontecendo, não a mutação em si."

Guimarães acha que o debate sobre a possível dirigibilidade das mutações é um tema recorrente nos debates teóricos do campo, mas considera que a aleatoriedade ainda é a melhor forma de explicar a rica variedade de vida que nosso planeta abriga. "Esses mecanismos que provocariam uma mutação direcionada a certa finalidade podem até existir, mas não são eles que respondem pela biodiversidade. Se a vida fosse dirigida, não veríamos uma variedade tão grande de seres."