}

El que ens fa ser, per a escriure el que fem

2023/04/26 Judith Zubia Aranburu Iturria: Elhuyar aldizkaria

L'ésser humà sempre ha tingut una especial passió per transmetre coneixement a les generacions futures, la qual cosa ens ha portat a descobrir i/o desenvolupar algunes maneres de guardar informació. Fins al moment se sap que les seves primeres evidències es troben entre els penya-segats de fa 40.000 anys. Més endavant, amb la creació de les llengües, elaborem els primers textos escrits. Així mateix, el descobriment del paper i el desenvolupament de la impremta, van fer que durant anys els llibres apareguessin com a font d'informació.

Canvi de perfil, no obstant això, XX. es va produir a mitjan segle XX, coincidint amb l'aparició de l'electrònica digital. De fet, els desenvolupaments del transistor i del microxip van permetre, entre altres coses, el naixement de l'emmagatzematge digital de dades.

Què és l'emmagatzematge digital de dades?

L'emmagatzematge digital de dades consisteix a emmagatzemar informació digital per mitjans electrònics. Així mateix, la informació digital és aquella que s'expressa a través del sistema binari (utilitzant els 0 i 1). Els valors 0 i 1 representen situacions. Per exemple, el 0 correspon a l'estat “apagat” i l'1 a l'estat “encès”, o el 0 a una tensió elèctrica concreta i l'1 a una altra tensió. En qualsevol cas, representen dues situacions. En el sistema binari, cadascuna d'aquestes unitats d'estat rep el nom de bit i es construeix un byte amb 8 bits consecutius. A partir d'ella, i a través de milers de bytes, es construeix text, imatges, vídeos, àudios i una altra informació digital.

L'emmagatzematge digital de dades permet guardar grans quantitats d'informació en un espai físic reduït, així com llegir i editar diverses vegades[1]... La cinta magnètica, el disquet, el CD, el DVD i l'USB són alguns dels sistemes d'emmagatzematge d'informació digital més característics de les últimes dècades. No obstant això, aquests medis físics, a més de tenir una supervivència limitada, no faciliten l'intercanvi d'informació. En aquest sentit, el sistema d'emmagatzematge de dades dominant en l'actualitat és el núvol. Còmode, ràpid, accessible, segur, il·limitat i sostenible, no?

Spoiler: El núvol no existeix

Doncs no. El “núvol” està format per centres de dades gestionades per empreses com Google, Amazon Web Services (AWS), Microsoft, etc. Per tant, el núvol és una metàfora que s'utilitza per a resumir la complexitat d'aquestes infraestructures[2]...

Fixem-nos un moment en la quantitat de dades generada per dia l'any 2022: 8,5 milions de cerques en Google, 720.000 hores en YouTube, 93 milions de fotos en Instagram, 867 milions en Txio Usant i 333 mil milions de correus electrònics, entre altres. Així, hem generat i consumit prop de 94 cettabytes en l'últim any (1 zettabyte = 1 E + 21 bytes). És a dir, si cada bit fos una moneda d'un euro i acumuléssim monedes fins a formar 1 cettabyte, estaríem conformant una distància de 1.970 anys de llum, suficient perquè Alpha Centauri sol pogués arribar fins a 225 raigs més pròxims al sistema hissar.

En aquest sentit, aquests centres de dades han arribat a constituir uns gegantescos magatzems de servidors que s'organitzen en unes superfícies d'uns 10.000 m², en nombroses columnes i línies. Aquests servidors necessiten, per descomptat, un sistema de fred per a evitar sobreescalfaments. Per si això fos poc, i perquè el “núvol” estigui operatiu en tot moment i no s'apreciï la influència de fallades en la xarxa elèctrica, en aquestes zones hi ha generadors que s'alimenten de dièsel. Així, una zona d'aquest tipus consumeix en un any una energia equivalent a la utilitzada per 50.000 habitatges. Davant la tendència creixent d'emmagatzematge digital de dades, l'energia necessària per a mantenir aquesta producció digital arribaria a superar el consum energètic actual de tot el planeta a la fi d'aquest segle.[3]...

Alternatives?

Una cosa és clara, això no és el camí. Hem de canviar de direcció. Trobar una alternativa o vàries. No és fàcil, no, però preguntem a algú que sap més de la supervivència que nosaltres, a algú que té més experiència que nosaltres. Preguntem a la naturalesa.

Com ha aconseguit la naturalesa recordar de generació en generació a l'ésser humà o a l'arbre? Com ha canviat i té la naturalesa el nostre entorn perquè en cada època i lloc concret tinguem unes característiques diferencials? Bàsicament, amb una sola molècula: ADN (àcid desoxiribonucleic)[4]...

Quan parlem d'ADN ens ve a la ment la pròpia vida, però no la informació ni els ordinadors. Doncs bé, el mateix ADN és un codi de 4 lletres per a guardar i transmetre informació en un organisme. Aquesta molècula és una hèlix de doble cadena formada per quatre nucleòtids (adenina (A), timina (T), guanina (G) i citosina (C).

Per a convertir la informació digital en ADN, el primer que cal fer és codificar les dades (veure 1. Imatge). Existeixen diverses maneres de fer-ho, de manera similar a com existeixen diversos llenguatges per a escriure un algorisme. Una opció és utilitzar l'adenina per a expressar 00 del sistema binari, 01 guanina, 10 citosina i 11 timina.[5]... Aquest procés permet construir una seqüència d'ADN d'una sola cadena amb una eficiència del 99%. Per què no amb una eficiència del 100%? Doncs bé, en el procés de síntesi de l'ADN hi ha una sèrie d'errors que no es poden evitar i, per tant, la informació màxima que pot guardar cada nucleòtid en comptes de 2 bits és de 1,8 bits. Cal destacar que aquest 1% defectuós pot causar problemes en l'emmagatzematge de dades. Per això, en lloc de crear una sola cadena, es generen nombroses còpies per a garantir que la informació es conserva en la seva integritat.

1.- Il·lustració: Procés de codificació de dades del sistema binari a l'ADN. Ed. Judith Zubia Aranburu

A continuació s'emmagatzemarà l'ADN sintetitzat. Encara que s'han desenvolupat diversos sistemes d'emmagatzematge, es poden considerar dues estratègies. Una alternativa seria congelar i mantenir l'ADN. Aquesta molècula pot mantenir-se estable durant milions d'anys en aquestes condicions. Una altra possibilitat és encapsular l'ADN i integrar-lo en un altre material. Aquesta estratègia es basa en la idea de “DNA-of-Things” o “ADN de les coses” i consisteix bàsicament a codificar la informació a l'ADN i emmagatzemar-la en els objectes quotidians. Un exemple és el treball realitzat en 2019 per investigadors de Suïssa i Israel.[6]... Ells van codificar un arxiu digital a l'ADN i el van encapsular en unes partícules de vidre. Posteriorment aquestes partícules van ser barrejades amb el polímer de policaprolactona (PCL) i dipositades en un objecte per mitjà de la impressió 3d. Per tant, van aconseguir que l'objecte imprès incorporés la informació emmagatzemada en aquest fitxer. A més, van extreure l'ADN de qualsevol part de l'objecte imprès i el van amplificar mitjançant PCR (Polymerase Chain Reaction), demostrant que aquest arxiu podia ser emmagatzemat en nous objectes (veure 2). Imatge).

2.- Il·lustració: Procés d'emmagatzematge d'informació digital per ADN. Ed. Judith Zubia Aranburu

Realitat o ciència-ficció?

Encara que l'ús de l'ADN per a emmagatzemar dades ens resulta estrany, aquesta idea cada vegada té menys de ciència-ficció. És una estratègia que s'alinea molt bé amb els reptes que tenim els humans per a aquest segle.

L'emmagatzematge d'informació per ADN és energèticament més eficient i sostenible que els sistemes actuals (veure 3). Imatge), perquè l'ADN ben encapsulat pot trigar segles en temperatura. A més, no necessita fer tasques d'escriptura, i els fitxers així desats poden copiar-se i replicar-se fàcilment.

3. Il·lustració: Supervivència, capacitat i cost d'alguns sistemes d'emmagatzematge [7]. Ed. Judith Zubia Aranburu

Per si això fos poc, aquest sistema d'emmagatzematge és molt dens, ja que el volum ocupat per la informació emmagatzemada mitjançant ADN és molt reduït. En un sol gram d'ADN es poden ficar 215 petabytes (1 petabyte = 1 E + 15 bytes)[8]... Es preveu la generació de 169 cettabytees a nivell mundial per a l'any 2025. Si s'emmagatzema per ADN, només ompliria una tassa.

No obstant això, cal assenyalar que l'emmagatzematge de dades per ADN continua sent car, i que haurà de transcórrer almenys un parell de dècades des que els sistemes de síntesis i extracció de l'ADN baixin els preus i comencin a utilitzar-se de forma generalitzada[9]...

A més, la recuperació a la velocitat adequada dels fitxers emmagatzemats continua sent un repte. De fet, cada càpsula utilitzada per a emmagatzemar l'ADN porta un codi d'ADN que correspon al seu contingut com a etiqueta. Per tant, per a seleccionar i extreure un fitxer concret, mantenint la resta, cal afegir l'iniciador corresponent a aquesta etiqueta d'ADN. Amb la tecnologia actual, aquest procés és molt llarg. L'emmagatzematge de dades per ADN pot, en principi, utilitzar-se exclusivament per a la realització del denominat “emmagatzematge fred”. És a dir, utilitzar únicament per a emmagatzemar dades inactives o molt poc utilitzats[10]...

Una mirada al futur

I ara imagina't. Imagineu un futur com aquest. Imagineu que compreu unes noves ulleres i que tota la informació sobre la seva graduació, material i procés de fabricació estigui en aquestes. Imagineu que anessin a fer la compra i que el preu de cada menjar fos el producte, sense el codi. L'ADN és biodegradable i, per tant, cap a dins. Utilitzar el que ens hem imaginat per a escriure el que fem.

Però imagineu també què podria suposar això per a la seguretat i la protecció de dades. Quines conseqüències tindria l'ús incorrecte d'aquesta tecnologia? Què podem arribar a fer? Quina és la responsabilitat dels científics i enginyers en el desenvolupament d'aquesta tecnologia? Com tots els avanços tecnològics i científics que han dut a terme un canvi de missió, aquest no sols generarà dilemes ètics sinó que qüestionarà altres temes.

Que quan ve ve ve i ve com ve, almenys que no ens sorprengui.

 

BIBLIOGRAFIA

[1] A. Siddiqa, A. Karim and A. Gani, “Big data storage technologies: a survey,” Frontiers of Information Technology & Electronic Engineering, vol. 18, pàg. 1040-1070, 2017.

[2] I. Via, O. Ajayi, B. Akanle and R. Ahuja, “An Overview of Data Storage in Cloud Computing,” International Conference on Next Generation Computing and Information Systems (ICNGCIS), pàg. 29-34, 2017.

[3] A. A. Khan and M. Zakarya, “Energy, performance and cost efficient cloud datacentres: A survey,” Computer Science Review, vol. 40, 2021.

[4] L. Ceze, J. Nivala and K. Strauss, “Molecular digital data storage using DNA,” Nature Reviews Genetics, vol. 20, pàg. 456-466, 2019.

[5] I. Erlich and D. Zielinski, “DNA Fountain enables a robust and efficient storage architecture,” Science, vol. 355, pàg. 950-954, 2017.

[6] J. Koch, S. Gantenbein, K. Masania, W. J. Stark, I. Erlich and R. N. Grass, “A DNA-of-things storage architecture to create materials with embedded memory,” Nature Biotechnology, vol. 38, pàg. 39-43, 2019.

[7] L. C. Meiser, B. H. Nguyen, I.-J. Chen, J. Nivala, K. Strauss, L. Ceze and R. N. Grass, “Synthetic DNA applications in information technology,” Nature Communications, vol. 13, ez. 352, 2022.

[8] R. Heckel, “An arxivi written in DNA,” Nature Biotechnology, vol. 36, pàg. 236-237, 2018.

[9] P. M. Church, I. Gao and S. Kosuri “Next-Generation Digital Information Storage in DNA,” Science, vol. 337, p. 1628, 2018.

[10] C. Matange, J. M. Tuck and A. J. Keung, “DNA stability: a central design consideration for DNA data storage systems,” Nature Communications, vol. 12, ez. 1358, 2021.

 

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia