Todo está en los genes: cómo puede el ADN resolver nuestro problema de almacenamiento de datos

Los datos son el ADN de las economías modernas. Lo serían literalmente, si se consolida el trabajo de un grupo de científicos.

La era de la información ha transformado cada aspecto de nuestras vidas.

Pero cada innovación digital conlleva problemas. Uno de esos problemas es especialmente espinoso: cómo almacenar los enormes volúmenes de datos que generan nuestros dispositivos.

En 2017, existía una demanda de 14,8 billones de gigabytes (14.800 exabytes) de almacenamiento de datos, en comparación con los 400.000 millones de gigabytes en 2009, según la IDC. Y se espera que esa cifra se incremente a razón de un tercio cada año.

Con la tecnología existente, esto se convertirá en algo insostenible. Aunque el coste unitario del almacenamiento de datos ha descendido drásticamente en los últimos años, la gran cantidad de información que se está generando está complicando y haciendo más caro continuar empleando sistemas de archivado electrónico convencionales que ocupan grandes cantidades de espacio y se deterioran con el tiempo.

Por ello, científicos como el Dr. Nick Goldman del Instituto Europeo de Bioinformática (EMBL-EBI) en Cambridge, Reino Unido, están buscando soluciones poco convencionales. Como el ADN.

El ADN, explica Goldman, es un dispositivo de almacenamiento de datos potencialmente brillante dada su "capacidad de codificación de información de alta densidad, su longevidad y su historial demostrado como portador de información".

Es absolutamente cierto que las presiones evolutivas durante cientos de millones de años han convertido el ADN en un medio extremadamente eficiente para el almacenamiento de las grandes cantidades de información que se requieren para generar las proteínas y otros compuestos que constituyen organismos complejos.

Toda esta información está codificada en largas secuencias helicoidales de las cuatro unidades moleculares que constituyen el ADN, muy similar a la forma en la que la totalidad de Internet y todos los demás elementos digitales, desde discos compactos a fotografías tomadas con smartphones, se representan con unos y ceros.

La idea de que el ADN sirva también como dispositivo de almacenamiento no se le ocurrió a Goldman inmediatamente. Fue mientras realizaba su trabajo diario en el EMBL-EBI, catalogando todos los datos de ADN generados por científicos que estudian el genoma humano en todo el mundo, cuando se dio cuenta de que disponía de más información genética que la que podía almacenar.

"Trabajo en un instituto donde una de nuestras tareas es almacenar en ordenadores toda la información sobre el ADN en todos los genomas que científicos de todo el mundo están creando. Y eso nos supone un gran problema. Cada día entra una enorme cantidad de información", comenta Goldman.

Storage-supply-Demand
Oferta y demanda de almacenamiento

Tras muchas y arduas deliberaciones, Goldman y sus compañeros comprendieron que la solución a sus problemas de almacenamiento de datos la tenían delante de sus narices: el propio ADN.

Ellos descubrieron que el ADN no es sólo útil para almacenar codificación biológica, sino que también podría ser un depósito para cualquier información.

Goldman y su equipo desarrollaron debidamente paquetes de datos de 180 pares de bases: el ADN viene en forma de unidad y su equivalente conectado, y la cadena forma algo parecido a una escalera en espiral, por eso se habla de doble hélice. De esos pares de bases, alrededor de 100 contienen realmente la información que está siendo almacenada, 20 se necesitan para indexarla y el resto se necesita para ayudar a que el proceso funcione.

"La parte complicada es realizar la primera copia", explica Goldman. "Una vez que tienes una, es fácil hacer copias sucesivas".

ADN fresco

"Inicialmente, la tecnología se utilizaría para realizar copias de seguridad de datos existentes, cosas que quieres tener sobre seguro", afirma Goldman. Esto es importante porque las tecnologías existentes tienden a deteriorarse con el tiempo y volverse obsoletas rápidamente.

El almacenamiento magnético, por ejemplo, tiende a degradarse. Por otra parte, los avances tecnológicos implican que a veces resulte difícil recuperar datos guardados en sistemas antiguos. ¿Quién tiene hoy en día un ordenador capaz de leer disquetes? O, ya que estamos, ¿un equipo de música capaz de reproducir cintas de ocho tracks?

Por otro lado, el ADN ha existido desde que existe vida en la Tierra. También es duradero.

"Tienes que mantenerlo seco (el agua rompe las hebras)  y la mejor forma de hacerlo es conservarlo a temperaturas por debajo de cero", señala Goldman. Protegerlo de la luz también ayuda a reducir la mutación causada por la radiación.

Pero sujeto a estas restricciones, durará siglos.

Se ha estimado que algunas muestras de ADN tomadas debajo de la capa de hielo de Groenlandia tienen medio millón de años –Si bien todavía no se ha descubierto ADN de los dinosaurios.

Y eso no es todo, el ADN es tan eficiente que un único gramo puede almacenar 215 millones de gigabytes, lo que significa que todos los bits de datos registrados hasta ahora por el hombre podrían caber en el salón de una casa ordinaria.

En efecto, el ADN es capaz de comprimir más información en una secuencia dada que la informática binaria convencional porque tiene cuatro en lugar de sólo dos unidades diferentes (para más detalles, véase la ilustración abajo).

Una posibilidad fascinante, sostiene Goldman, sería registrar datos en el ADN de seres vivos.

Ya se ha hecho a nivel reducido. Por ejemplo, el artista Eduardo Kac ha traducido una frase del libro del Génesis a ADN y lo ha implantado en bacterias. Otros han escrito sus iniciales en organismos modificados genéticamente como forma de marca comercial.

Pero la perspectiva de tener un disco duro en un bicho (en lugar de tener un disco duro lleno de bichos) parece poco probable. Los seres vivos probablemente nunca llegarán a ser vehículos para almacenar enormes volúmenes de datos. Si bien la mayoría de los organismos tienen cadenas largas de ADN "inútil" –ADN redundante o ADN cuya finalidad aún no ha sido descifrada por los científicos–, "existe una cantidad límite de ADN inútil que podría introducirse en organismos vivos", advierte Goldman.

Hay un coste para el organismo que cuenta con demasiado ADN. Cada vez que una célula se divide, todo el ADN añadido se replica junto al código biológicamente necesario, lo que consume energía. Al mismo tiempo, las mutaciones pueden colarse en cada división, lo que puede distorsionar el ADN codificado. Tras varias generaciones, puede terminar como el juego del teléfono escacharrado.

Hasta el momento, el almacenamiento de datos en ADN continúa en gran medida en manos de los laboratorios.

"Diversas empresas se han interesado en la aplicación técnica, aunque se han desanimado en vista de los costes", explica Goldman.

Aunque el coste de leer y registrar en ADN ha disminuido en los últimos años, en comparación con el almacenamiento informático convencional, todavía es tremendamente caro.

Por ejemplo, el coste por secuenciar el primer genoma humano completo alcanzó los miles de millones de dólares al finalizar el milenio. Ahora está alrededor de 1.000 dólares, y la forma más eficiente de codificar datos en ADN ronda los 3.500 dólares por megabyte. El coste de cada lectura asciende a la décima parte de esa suma. En cambio, un céntimo de dólar compra alrededor de mil megabytes de almacenamiento de datos convencional.

storage size

También existen otros obstáculos. Por ejemplo, los investigadores de la Universidad de Washington recientemente han codificado cadenas de software maligno en ADN que estaba siendo secuenciado por una máquina comercial. El software reprogramó el secuenciador genético y luego tomó el control del ordenador.

Pero hay un creciente número de controladores comerciales que hacen el almacenamiento en ADN más barato y más generalizado. Se dice que Microsoft está trabajando para lanzar un sistema de almacenamiento de datos operativo basado en ADN a finales de la década. Hay otras empresas implicadas en la producción de ADN como Twist Bioscience, que colabora con Microsoft, y DNAScript, Nuclera Nucleics, Evonetix, Helixworks y Genome Foundry.

La velocidad de innovación plantea que el almacenamiento en ADN podría generalizarse más pronto de lo que actualmente parece posible.

  1. Convertir el ADN

    converting dna