Esta es la segunda parte de la contribución sobre la codificación de información a nivel atómico y molecular. Haciendo primera parte Hemos hablado sobre cómo se codifica la información en un sistema binario y cómo se superó el registro de almacenamiento de datos al almacenar un bit en un solo átomo. Pasando a este interesante tema, en la segunda parte de este artículo hablaremos sobre cómo se almacenaba la información en una molécula de ADN. Comenzaremos con algunos conceptos básicos.
¿¿Qué es el ADN y cómo se puede utilizar para almacenar información?
Ácido desoxirribonucleico o ADN Es una molécula que tiene la función de almacenar y transmitir información genética en los seres vivos. Entonces, el ADN en sí mismo es un dispositivo de almacenamiento de datos biológicos. Era solo cuestión de tiempo antes de que alguien decidiera usar el ADN para respaldar información (datos) que no es necesariamente biológica. Una molécula de ADN está formada por unidades más pequeñas llamadas Nucleótidos. Todos Nucleótido nuevamente consiste en un azúcar simple (Pentose), en Base de nitrógeno y una unidad fosfato.
Cada unidad Nucleótido puede tener 4 bases nitrogenadas diferentes: A, T., GRAMO o C.. En aras de la simplicidad, podemos nombrar una unidad de nucleótidos completa con la misma letra que identifica la base nitrogenada que contiene. De esta forma, las moléculas de ADN solo están formadas por 4 tipos de nucleótidos: A, T., GRAMO Y. C.. Entonces, una molécula de ADN es básicamente una forma de código que usa 4 letras A, T., GRAMO Y. C..
Haciendo primera parte En esta publicación, hemos hablado sobre cómo usar poco como unidad de información y vimos que los bits utilizan un código binario de ceros y unos (0,1). los ADN En este caso, es la unidad de información que usa dos números en lugar del bit 0 Y. 1 El ADN usa cuatro letras A, T., GRAMO Y. C.. Cada bit tiene la capacidad de tener dos valores (0 o 1) y cada nucleótido tiene la capacidad de tener cuatro valores (A, T, G y C), por lo que cada nucleótido es teóricamente equivalente a 2 bits, es decir. H. Cada nucleótido puede codificar un máximo de 2 bits. Sin embargo, un nucleótido no tiene la capacidad real de almacenar 2 bits. Esto se debe a que las moléculas de ADN que contienen secuencias largas de nucleótidos repetidos, como AAAAAAAAAAA…. o un alto contenido de nucleótidos GC no es viable porque no son sintéticamente estables o causan errores de codificación. Es decir, se estima que la capacidad de almacenamiento real de un nucleótido es de alrededor de 1,83 bits.
Almacenamiento de datos en ADN.
Recientemente se publicó un estudio en la revista Ciencias que describe cómo fue posible codificar y almacenar información en forma de una molécula de ADN. Los científicos responsables de este estudio pudieron salvar un sistema operativo, una película y un virus informático en forma de ADN.
Y en ese momento, te estarás preguntando cómo funciona este dispositivo. Todo esto es posible gracias a una brillante combinación de biología y matemáticas. Ya comentamos en la primera parte de este artículo que cualquier tipo de información se puede codificar en el sistema binario de ceros y unos. En este caso, el sistema operativo, la película y los virus informáticos deben codificarse primero en un sistema binario. Hasta ahora sin problemas. El siguiente paso sería convertir la información que tenemos en código binario en el código de nucleótidos del ADN: A, T, G, C. Sin embargo, no podemos olvidar que hay secuencias que causan problemas como se mencionó anteriormente, secuencias con muchos no se pueden utilizar nucleótidos repetidos o con una gran cantidad de nucleótidos GC. Para solucionar este problema, los autores del estudio lograron aplicar un algoritmo matemático, una serie de transformaciones matemáticas que permiten la codificación de ceros y unos en las letras A, T, G, C, utilizando combinaciones de letras consecutivas repetidas y con muchas letras GC. debería ser evitado. Una vez que hemos codificado todo en la secuencia de las letras A, T, G, C, sintetizamos una molécula de ADN formada por esta secuencia de nucleótidos. De esta forma tenemos un soporte de datos físico, la molécula de ADN, como disco duro o soporte de datos. Este ADN sintetizado, que contiene la información del sistema operativo, la película y el virus informático, se puede transportar como si tuviera una memoria flash, un CD o un disco duro externo. Para sacar la información de la molécula de ADN, como hacemos con el código binario de ceros y unos, se utiliza un proceso de decodificación de datos inverso que convierte el código de las letras A, T, G, C en un sistema operativo, película y un virus informático.
Este progreso es espectacular y se ha guardado un 60% más de datos que cualquier otro estudio anterior. Además, se logró que el proceso de codificación y decodificación se ejecutara sin errores. Según los propios autores del estudio, la información almacenada en forma de ADN podría restaurarse con precisión cada vez que se decodificara la información. Sin embargo, como dijimos en la primera parte de esta publicación, debemos tener cuidado a la hora de emocionarnos con estos estudios. Hay una gran tendencia a exagerar en la prensa. Pasarán unos años más antes de que esta tecnología llegue a nuestros hogares o tengamos discos duros de ADN. Por el momento, este sistema de codificación-decodificación es muy caro y lleva demasiado tiempo recuperar la información. Antes de terminar otra curiosidad, la película que se almacenó en forma de ADN no era una película larga como El señor de los anillos, sino una película corta de unos segundos titulada: Llegada de un tren a la estación de La Ciotat Grabado en 1895 por los hermanos Lumiere, inventores del cinematógrafo.





