Por Guilherme Toledo – Departamento de Biologia Celular, Embriologia e Genética – Universidade Federal de Santa Catarina (UFSC)
Imagine que o código genético – o DNA, o RNA e as proteínas – seja como um idioma biológico, com letras, palavras e frases que determinam como a vida funciona. Assim como entendemos e criamos frases em uma língua, cientistas descobriram que podem usar inteligência artificial (IA) para ler, prever e até escrever trechos inteiros do “idioma” da vida.
Neste contexto surge o Evo, uma inteligência artificial inovadora criada por Eric Nguyen e sua equipe, trabalho publicado na revista Science. Evo é um modelo de IA desenvolvido especificamente para compreender profundamente sequências biológicas. Pense em um ChatGPT que, em vez de linguagem humana, entende a linguagem da vida! O Evo foi treinado com impressionantes 2,7 milhões de genomas microbianos, especialmente bactérias e vírus relacionados, tornando o Evo um modelo chamado generalista: ou seja, não é especializado em apenas um grupo ou grupos da árvore da vida.
Mas o que exatamente o Evo faz? O modelo possui duas grandes habilidades: prever e gerar novas informações biológicas.
Na capacidade preditiva, o Evo é tão eficaz que consegue estimar os efeitos de mutações em proteínas ou moléculas de RNA, mesmo sem treinamento específico para cada tarefa. Isso significa que a IA aprendeu sozinha a prever cenários inéditos! Pode determinar, por exemplo, se uma pequena mudança no DNA irá afetar a capacidade de um organismo sobreviver ou como genes específicos são ativados ou desativados. Testes que antes demoravam meses ou anos em laboratório agora podem ser acelerados significativamente com essa tecnologia.
Já na capacidade generativa, o Evo funciona como um verdadeiro escritor criativo da biologia. Assim como o ChatGPT pode gerar textos novos em linguagem humana, o Evo consegue gerar sequências biológicas inteiramente novas e realistas, como DNA, RNA e proteínas, com funções específicas pré-determinadas.
Por exemplo, o Evo projeta ferramentas moleculares avançadas para edição genética, como sistemas CRISPR (sistema revolucionário de edição de genomas, prêmio Nobel de Química em 2020). Tradicionalmente, descobrir novos sistemas CRISPR envolvia buscar organismos existentes, mas o Evo oferece a possibilidade de criar esses sistemas completamente do zero. O Evo também cria elementos transponíveis, sequências de DNA capazes de se mover dentro do genoma, alterando sua estrutura. Além disso, ele pode gerar sequências biológicas em grande escala, incluindo genomas sintéticos completos, com genes semelhantes aos naturais.
Apenas 3 meses após a publicação do Evo, surgiu o Evo 2, um modelo ainda mais avançado, treinado com dados gigantescos – mais de 9 trilhões de nucleotídeos de organismos variados, incluindo bactérias, plantas e seres humanos. O Evo 2 consegue analisar trechos ainda maiores, chegando a um milhão de nucleotídeos simultaneamente, mantendo precisão em nível molecular. Essa evolução permitiu ao Evo 2 entender padrões genéticos complexos em todos os domínios da vida, tornando-o extremamente versátil em aplicações científicas diversas.
Com essa capacidade ampliada, o Evo 2 prevê com precisão efeitos de variações genéticas humanas importantes, incluindo mutações associadas ao câncer e outras doenças, novamente sem precisar de treinamento específico para cada caso. Além disso, pode gerar sequências genômicas realistas para diferentes organismos, incluindo componentes essenciais de cromossomos eucarióticos.
Outra capacidade impressionante é o design de sequências com propriedades específicas. O Evo 2 gera DNA projetado para ter informações de epigenética: o DNA das células não apenas carrega a informação do código genético, possui também uma maneira específica de como se organizar, o que permite à célula definir quais genes estarão ativos.
O Evo e o Evo 2 representam uma verdadeira convergência entre biologia e inteligência artificial. Essas ferramentas avançadas prometem transformar nossa capacidade não apenas de compreender, mas também de projetar e modificar geneticamente organismos de maneira segura e controlada, criando possibilidades extraordinárias para a biologia sintética.
Para assegurar o uso ético dessas tecnologias, os pesquisadores adotaram cuidados especiais: excluíram do treinamento sequências virais que poderiam infectar organismos complexos, como humanos. Além disso, todos os parâmetros dos modelos, juntamente com seus códigos e dados de treinamento, foram disponibilizados abertamente ao público.
A chegada do Evo e do Evo 2 abre uma nova fronteira na ciência, permitindo que pesquisadores pelo mundo possam explorar mais rapidamente os mistérios do código da vida. Estamos diante de um futuro em que poderemos não apenas ler, mas escrever novas histórias no livro da vida.
Para saber mais:
Evo: https://www.science.org/doi/10.1126/science.ado9336
Evo2 preprint: https://arcinstitute.org/manuscripts/Evo2

