Topo

Para onde o mundo vai

DNA pode ser solução para o armazenamento de grandes volumes de dados

Daniel Schultz

03/01/2019 04h00

Em 1959, Richard Feynman, uma das maiores figuras da Física, propôs um desafio aos cientistas da época: o desenvolvimento de uma técnica que permitisse gravar toda a Enciclopédia Britânica na cabeça de um alfinete. Os computadores da época começavam a processar mais e mais dados, e a estrutura do DNA acabara de ser descoberta. Feynman vislumbrava os primórdios da nanotecnologia, e ficava claro que o futuro exigiria o processamento e armazenamento de grandes quantidades de dados.

Ele mesmo já suspeitava que a resposta poderia estar dentro de nós mesmos. Cada uma de nossas células lê, copia e manipula diariamente os 725 megabytes de informação contidos no nosso DNA. Conforme as técnicas de manipulação de DNA vão sendo aprimoradas e barateadas também nos laboratórios, vai se aproximando o dia onde poderemos usar DNA para o armazenamento de qualquer tipo de dados, alcançando níveis sem precedentes de densidade de informação.

Toda a informação digital do mundo caberia em 9 litros de solução. Devido à estabilidade das moléculas de DNA, essa informação poderia ser armazenada por milhares de anos mesmo em temperatura ambiente, enquanto os sistemas magnéticos, eletrônicos ou ópticos de que dispomos hoje em dia duram apenas umas poucas décadas. Um exabyte de informação (uns 200 milhões de DVD's) ocuparia o volume de um grão de areia.

Em 2012 o geneticista George Church e Sri Kosuri, do Instituto Wyss e da Escola de Medicina de Harvard, escreveram o próprio livro de Church em moléculas de DNA, fizeram 70 bilhões de cópias e o "leram" de volta através de sequenciamento. As letras do livro são codificadas utilizando as quatro bases do código genético (A, T, C e G). Assim como ocorre nos computadores, a informação é repartida e distribuída por fragmentos de DNA que contém também um "endereço", permitindo a reconstrução do texto a partir dos fragmentos. A Microsoft mesmo tem investido na técnica. Em 2017, numa parceria com Luis Ceze, da Universidade de Washington, conseguiram gravar e decodificar, sem perda de qualidade, "Smoke on the Water" do Deep Purple, e "Tutu" de Miles Davis.

Toda a tecnologia de manipulação e sequenciamento de DNA desenvolvida durante o Projeto Genoma tem se aprimorado e barateado numa velocidade impressionante, batendo o avanço dos computadores nas últimas décadas, de maneira que hoje em dia se tornaram atividades corriqueiras nos laboratórios. Utilizando uma versão modificada da própria maquinaria celular, podemos fazer bilhões de cópias de fragmentos de DNA em questão de horas. A mesma enzima que que copia o DNA dentro de nossas células pode reconhecer e amplificar fragmentos específicos baseados num "código de barras" que identifica cada fragmento, permitindo que a informação seja buscada de maneira seletiva.

O custo do sequenciamento, que permite a recuperação da informação, vem caindo a um ponto que tornaria a tecnologia economicamente viável. Resta esperar pelos resultados de uma corrida para reduzir o custo da síntese de DNA, ainda muito cara. A Twist Biosciences, por exemplo, em parceria com a Microsoft e a Universidade de Washington, tem desenvolvido uma técnica que utiliza semicondutores para conduzir a reação de síntese em nanoescala, o que a torna muito mais rápida.

Enquanto isso, vão também se desenvolvendo as técnicas de codificação e leitura da informação. De modo a evitar os inevitáveis erros na replicação do DNA, Yaniv Erlich, da Universidade de Columbia, desenvolveu um algoritmo parecido com os jogos de sudoku para codificar a informação. Assim como no sudoku, mesmo que algumas das dicas estejam faltando ainda é possível reconstruir o quebra-cabeça. Como a velocidade de leitura de DNA ainda não se compara com os dispositivos magnéticos usados nos computadores, a tendência é que o DNA seja usado apenas para armazenamento de grandes quantidades de dados, o que requer eficiência na síntese e sequenciamento para facilitar o acesso à informação. Para isso, sistemas híbridos têm sido desenvolvidos, onde toda a parte "líquida" que lida com as soluções de DNA é automatizada e integrada aos computadores convencionais.

O desafio de Feynman foi vencido já faz um certo tempo, e físicos experimentais desenvolveram técnicas que permitem até mesmo a manipulação de átomos individuais numa superfície. Mas apesar disso, no final das contas, a gravação de informação em superfícies planas perde em eficiência quando se requer grandes volumes, mesmo que reduzida à escala atômica. Cada letra da enciclopédia na cabeça do alfinete teria um tamanho por volta de 100 átomos, requerendo tecnologias ainda mais caras e lentas. Pelo que parece, a tecnologia mais eficiente para esse propósito é mesmo a que foi evoluída por 4 bilhões de anos para permitir o armazenamento de projetos complexos como um ser humano completo.

Sobre os autores

Daniel Schultz é cientista, professor de microbiologia e membro do núcleo de ciências computacionais em Dartmouth (EUA). Estuda a dinâmica dos processos celulares, com foco na evolução de bactérias resistentes a antibióticos. É formado em engenharia pelo ITA, doutor em química pela Universidade da Califórnia San Diego e pós-doutorado em biologia sistêmica em Harvard. Possui trabalhos de alto impacto publicados em várias áreas, da física teórica à biologia experimental, e busca integrar essas várias áreas do conhecimento para desvendar os detalhes de como funciona a vida ao nível microscópico.

Monica Matsumoto é cientista e professora de Engenharia Biomédica no ITA. Curiosa, ela tem interesse em áreas multidisciplinares e procura conectar pesquisadores em diferentes campos do conhecimento. Monica é formada em engenharia pelo ITA e doutora em ciências pela USP, e trabalhou em diferentes instituições como InCor/HCFMUSP, UPenn e EyeNetra.

Shridhar Jayanthi é Agente de Patentes com registro no escritório de patentes norte-americano (USPTO) e tem doutorado em Engenharia Elétrica pela Universidade de Michigan (EUA) e diploma de Engenheiro de Computação pelo ITA. Atualmente, ele trabalha com empresas de alta tecnologia para facilitar obtenção de patentes e, nas (poucas) horas vagas, é um estudante de problemas na intersecção entre direito, tecnologia e sociedade. Antes disso, Shridhar teve uma vida acadêmica com passagens pela Rice, MIT, Michigan, Pennsylvania e no InCor/USP, e trabalhou com pesquisa em áreas diversas da matemática, computação e biologia sintética.

Sobre o blog

Novidades da ciência e tecnologia, trazidas por brasileiros espalhados pelo mundo fazendo pesquisa de ponta. Um espaço para discussões sobre os rumos que as novas descobertas e inovações tecnológicas podem trazer para a sociedade.