Egészségtudományi folyóirat

Kulcsszavak

Digitális adattárolás; dezoxiribonukleinsav (DNS); bináris; kódolás; dekódolás; szekvenálás

Bevezetés

Most a nagy adatok robbanásszerű korszakát éljük. Ezek a nagy adatok léteznek és szinte mindenhol lefedik az élelmiszerboltoktól a bankokig, az offline-tól az online-ig, az akadémiától az iparig, a kórháztól a közösségig, a szervezettől a kormányzatig. A nagy adatok tárolása és kezelése komoly aggodalomra ad okot. Jelenleg a legtöbb adatot világszerte főként mágneses és optikai adathordozókon tárolják, mint például HDD (merevlemezes meghajtó), DISK, CD, kazetták, DVD, hordozható merevlemezek és USB csík meghajtók . Ezeknek az archivált adatoknak a növekedési sebessége azonban robbanásszerűen, exponenciális ütemben növekszik. Ezek a hagyományos adathordozók és korlátozott adattárolási kapacitásuk nem tudnak megfelelni a digitális adatok gyors növekedésének. Eközben ezen adathordozók adattárolási tartóssága az egyik legnagyobb kihívás. Tartósságuk nagyon korlátozott. Ezek az adathordozók csak nagyon korlátozott ideig tartanak ki. A lemezek például több évig, a szalagok pedig több évtizedig tartanak. Más elektronikus adattárolók több évtizedig tarthatók jó állapotban. Az adattárolási kapacitás egy másik probléma a nagy digitális adatok tárolásánál. Egy CD több száz megabájt (MB) adatot tárolhat. Egy nagy merevlemez néhány terabájt (TB) adatot tárolhat. Ezek kapacitása azonban messze elmarad a robbanásszerűen növekvő információs adatok igényétől .

A Patrizio szerint 2018-ban világszerte összesen 33 Zettabájt (ZB) adat áll rendelkezésre (https://www.networkworld.com), ami 22 billió gigabájtnak (GB) felel meg. Ezért újszerű tárolási technológiára és innovatív rendszerre van szükség, hogy megfeleljen a modern kor követelményeinek. A dezoxiribonukleinsav (DNS) egyedülálló előnyei miatt várhatóan ideális közeg lesz a digitális adattároláshoz . A digitális adatok DNS-ben való tárolása nem újdonság. Valójában Mihail Neiman szovjet fizikus írta le 1960-ban (https:// www.geneticsdigest.com). Azonban először 1988-ban mutatták be, hogy a DNS képes digitális adatok tárolására. Itt először is bemutatjuk a DNS mint a digitális adattárolás új médiumának alkalmazásait, és ezután részletesen tárgyaljuk az adattároló médiumként szolgáló DNS-t.

A korábbi tanulmányok áttekintése

A bináris számrendszer

A számítógépek és más digitális elektronikus eszközök az adatokat a bináris számrendszerrel tárolják és működnek, amely csak két digitális számot vagy 0-t és 1-et használ . A szövegeket a számítógépes rendszerben bináris változatra alakítják át. A számítógépek viszont bináris számrendszerben működnek, és számolnak, végül az információkat olvasható szövegekké alakítják át. Egy bájt nyolc bitet tartalmaz, amely vagy 0-ból vagy 1-ből áll, és 28 (256) lehetséges értékkel rendelkezik (0-tól 255-ig), és egyetlen betűt tárol (1. ábra és 1. táblázat) . Amint az a konverziós ASCII táblázatban (1. táblázat) látható. A huszonhat betűt a kis- és nagybetűkkel együtt a betű, a bináris és a hexadecimális számok között alakítják át. Egy nagy fájl vagy dokumentum tárolásához sokkal több memóriaadatra van szükség. Egy közönséges dalhoz több tucat megabájtra lehet szükség, egy film tárolásához néhány gigabájtra, egy nagy könyvtárban tárolt könyvekhez pedig több terabájtra. A 2. táblázatban láthatóak a bináris rendszer használatára vonatkozó mérési és memóriaméretek a legkisebb egységtől, a “bájttól” a nagy egységekig, beleértve a bájtot (B), kilobájtot (KB), megabájtot (MB), gigabájtot (GB), terabyte (TB), pegabyte (PB), exabyte (EB), zettabyte (ZB), yottabyte (YB), brontobyte (BB), geopbyte (GPB) és így tovább (https://www.geeksforgeeks.org&https://whatsabyte.com). Az olyan egységek, mint a brontobyte (BB), Geopbyte (GPB) elképzelhetetlenül nagy értékek, amelyeket a való világunkban talán soha nem használunk (2. táblázat).

1. ábra: A “DNS digitális adattárolás” szövegrészletet bináris bitekké alakítottuk.

Table 1: The conversion ASCII table of the twenty-six letters with the upper and lower cases among letter, binary and hexadecimal.

Letter Binary Hexadecimal Letter Binary Hexadecimal
A 1000001 41 a 1100001 61
B 1000010 42 b 1100010 62
C 1000011 43 c 1100011 63
D 1000100 44 d 1100100 64
E 1000101 45 e 1100101 65
F 1000110 46 f 1100110 66
G 1000111 47 g 1100111 67
H 1001000 48 h 1101000 68
I 1001001 49 i 1101001 69
J 1001010 4A j 1101010 6A
K 1001011 4B k 1101011 6B
L 1001100 4C l 1101100 6C
M 1001101 4D m 1101101 6D
N 1001110 4E n 1101110 6E
O 1001111 4F o 1101111 6F
P 1010000 50 p 1110000 70
Q 1010001 51 q 1110001 71
R 1010010 52 r 1110010 72
S 1010011 53 s 1110011 73
T 1010100 54 t 1110100 74
U 1010101 55 u 1110101 75
V 1010110 56 v 1110110 76
W 1010111 57 w 1110111 77
X 1011000 58 x 1111000 78
Y 1011001 59 y 1111001 79
Z 1011010 5A z 1111010 7A

*Note: ACSII (American Standard Code for Information Interchange): serial digital codes to represent number, letters, numerals, and other symbols and to be used as a standard format in the computer system.

Table 2: The sizes of measurement and memory.

Sizes Byte Magnitude Units Storage*
1 B 100 Byte A character “A”, “1”, “$”
10 B 101
100 B 102
1 KB 103 Kilo byte The size for graphics of small websites ranges between 5 and 100 KB
10 KB 104
100 KB 105
1 MB 106 Mega byte
( 1 MB: 1 million)
The size for a high resolution JPEG image is about 1-5 MB
10 MB 107 The size for a 3-minute song is about 30 MB
100 MB 108
1 GB 109 Giga byte The size for a standard DVD drive is about 5 GB
10 GB 1010 (1 GB: 1 billion)
100 GB 1011
1 TB 1012 Tera byte
(1 TB: 1 trillion)
The size for a typical internal HDD is about 2 TB
10 TB 1013
100 TB 1014
1 PB 1015 Peta byte
(1 PB: 1 quadrillion)
Google store over 100 PB of all data in their drivers.
10 PB 1016
100 PB 1017
1 EB 1018 Exa byte
(1 EB: 1 quintillion)
Several hundred EBs of data are transferred over global internet per year
Facebook built an entire data center to store 1 EB of data in 2013
10 EB 1019
100 EB 1020
1 ZB 1021 Zetta byte
(1 ZB: 1 sextillion)
33 ZBs of global data in 2018.
160-180 ZBs of data is predicted in 2025.
10 ZB 1022
100 ZB 1023
1 YB 1024 Yotta byte
(1 YB: 1 septillion)
1YB = 1 million EBs
1 YB = Size of the entire World Wide Web
10 YB 1025
100 YB 1026
1 BB 1027 Bronto byte
(1 BB: 1 octillion)
1BB equals to 1 million ZBs
The only thing there is to say about a Brontobyte is that it is a 1 followed by 27 zeros!
10 BB 1028
100 BB 1029
1 GPB 1030 Geop byte (1 GPB: 1 nonillion) 1, No one knows why this term was created. It is highly doubtful that anyone alive today will EVER see a Geopbyte hard drive.

The digital data storage

Digital Data Storage (DDS) was introduced and developed in 1980s. It is a computer-based data storage technology that is based on the Digital Audio Tape (DAT) format. These digital data were stored on the silicon-based chips. Silicon is the primary material of most semiconductor and microelectronic chips. A tiszta memória minőségű szilícium ritkán fordul elő a természetben. Várhatóan a közeljövőben az összes mikrocsip minőségű szilícium elfogy világszerte. A Moore-törvény (Az integrált áramkörökben elhelyezett tranzisztorok száma kétévente majdnem megduplázódik, vagy a több tranzisztoros chipek több tranzisztorral gyorsabban működnek) is a végéhez közeledik. Így a chipek nem tudnak további tranzisztorokat elhelyezni, és elérik kapacitásuk határát.

A jelenlegi digitális adatok nagy részét hagyományos mágneses, optikai és egyéb adathordozókon, például HDD-n (merevlemezes meghajtó) és CD-n tárolják. Ezek az adathordozók korlátozott adattárolási kapacitásuk mellett nagyon korlátozott ideig tárolhatók. Érzékenyek a környezetre vagy az adattárolási feltételekre. Bármilyen környezeti és feltételes változás, például mágneses expozíció, magas nedvesség, magas hőmérséklet, mechanikai sérülés, esetleg ezen adathordozók károsodását vagy adatvesztését eredményezheti. És a gyakori használat is károsodásukhoz vagy adatvesztéshez vezethet. A nagy mennyiségű adat tárolásához és az adatok robbanásszerű növekedésének követelményeihez nagy mennyiségű adathordozóra van szükségünk, mint például lemezek, CD-k, DVP-k, merevlemezek . Ezek magas költségekhez vezetnek és időigényesek lesznek.

Mivel egyidejűleg a digitális adatok növekedése és az adattárolás követelménye exponenciális ütemben növekszik. Az IBM 2011-ben épített egy nagy központot 120 PB adattárolási kapacitással. A Facebook 2013-ban egy másik nagyobb központot épített 1 EB (1000 PBs) adattárolási kapacitással. A világ összes digitális felhasználója naponta több mint 44 exabájt (EB) (44000 PBs) adatot termelt. 2010-ben összesen 1 zettabyte (ZB, 1000 EBs vagy 1 millió PBs) adatot termeltek világszerte, 2018-ban pedig 33 zettabyte (ZB) adatot, 2025-re pedig 150-200 zettabyte (ZBs) adatot jósolnak (idézi a Datanami honlapja: https:// www.datanami.com és a Network world honlapja: https:// www.networkworld.com) . Ezen adatok tárolásához több százezer hatalmas űrközpontra lenne szükség. A Facebooknak 2018-ban összesen 15 adatközpont-helyszíne volt, és további új központokat jelentettek be. Nebraskában négy további adatközpontot építenek, amelyek hat nagy épületből állnak, és több mint 2,6 millió négyzetméternyi adattároló területet foglalnak magukban. Akárhogy is, az adattárolási terület soha nem tudja befogni az adatok exponenciális növekedését. A jelenlegi tárolóeszközök sem képesek kielégíteni a tárolási igényt. Sürgősen szükség van az adattárolás új generációs technológiájának kifejlesztésére a jelenlegi szilíciumalapú adattárolás helyett. A dezoxiribonukleinsav (DNS), mint lehetséges digitális adattároló médium, egyedülálló tulajdonságaival és potenciális előnyeivel az adattárolás központi színpadára kerül.

A dezoxiribonukleinsav (DNS)

1953-ban Dr. Crick és Watson felfedte, hogy a DNS molekula kettős szálakkal rendelkezik, amelyek egymás köré tekerednek és kettős spirális szerkezetet alkotnak. Általában a genetikai anyagok a legtöbb természetes szervezetben kettős spirális DNS-szálakból állnak, egyesek egyszálú DNS-ek, mások pedig egy- vagy kétszálú RNS-ek. A DNS-összetevők vagy nukleotidok nitrogénbázisokból, foszfátcsoportokból és dezoxiribózcsoportokból állnak. A két betű az egyes DNS-molekulák gerinceként épül fel, és minden bázispár az egyes szálakból hidrogénkötéssel kapcsolódik egymáshoz. A DNS-nukleotidok négyféle bázisból állnak, beleértve az adenint (A), a citozint (C), a guanint (G) és a timint (T) (2. ábra) , a ribonukleinsav (RNS) négyféle bázist tartalmaz, beleértve az adenint (A), a citozint (C), a guanint (G) és az uracilt (U) a timin (T) helyett. Az adenin (A) és a guanin (G) purin, a citozin (C), a timin (T) és az uracil (U) pedig pirimidin . In DNA molecules, the base-pairing rule is that A pairs with T, and G pairs with C (Figures 3 and 4) .

Figure 3: The schematic structure of deoxyribonucleic acid (DNA). There are four types of nucleotides being composed of a deoxyribose, a phosphate group and one of the four nucleobases (A, T, G, C). The double strand DNA forms a double helix via pairing A with T and C with G, and connecting with hydrogen bonds in between. Cited from Genetics Generation (website:https://knowgenetics.org).

Figure 4: A DNS-replikáció sematikus folyamata. A DNS-molekula két komplementer szálból áll. A félkonzervatív replikáció során a DNS-molekulák kettős szálai szétválnak. Mindkét szülői szál sablonként szolgál a komplementer szál (leányszál) előállításához. Minden komplementer bázis a szülői szálon lévő bázis ellentéteként kerül az új szálhoz (A a T-vel, C a G-vel). Az új kettős szálú DNS-molekula egy szülői és egy leányszálból áll. Ezek a DNS-molekulák rendkívül konzervatívak. Idézve a Dia megosztásból (honlap:https://www.slideshare.net/quaninaquan/dnareplication- slide-11981512).

A folyamat lényege, hogy a kettős szálú DNS-molekula úgy tekeredik ki, hogy a két szülői szál mindegyike elválik, és szülői templátként szolgál az új leány DNS-molekulák szintéziséhez. A komplementer nukleotidok hozzáadódnak a leányszálhoz, a foszfátok és dezoxiribózok alkotják az új nukleotidok gerincét, az új bázisok pedig a bázispárosodási szabályon keresztül (A párosodik T-vel, G párosodik C-vel) a szülői szál bázisainak ellentétével párosulnak, és hidrogénkötésekkel tartják a helyükön . Végül minden új, kettős szálú DNS-molekula egy szülői és egy leányszálból áll. A DNS-molekulák ebben a félig konzervatív modellben replikálódnak, a genetikai DNS-eket konzervatívan és állandóan tartják, és generációról generációra szállnak át (5. ábra) .

5. ábra: A digitális adatok DNS-ben való tárolásának sematikus folyamata, beleértve a kódolást (egy bináris karakterlánc kódolása oligoDNS-be) és a dekódolást (DNS-szekvenciák dekódolása bináris adatokká). A kódoláshoz egy 24 bájtos szöveges karakterláncot (“DNS digitális adattárolás”) alakítottak át bináris bitekké, amelyeket ezt követően bázisonként egy bitet használva egy oligoDNS-be kódoltak, a purinokat (A, G) 1-nek, a pirimidineket (C, T) pedig 0-nak rendelve. Az oligoDNS-t szintetizáltuk, és a szöveg tartalmát oligoDNS-fragmentumokként mentettük el. A dekódoláshoz a DNS-fragmentumokat PCR segítségével felerősítették, szekvenálták és bináris bitekre dekódolták, majd végül olvasható információvá alakították.

A digitális DNS-adattárolás folyamata

A digitális DNS-adattárolás folyamata a bináris adatok kódolása és dekódolása a szintetizált DNS-szálakra és azokról. A szövegeket, számokat, képeket és egyéb olvasható vagy látható szövegeket először bináris nyelvekké alakítjuk át 0 és 1 helyett, majd DNS nukleotid szekvenciákba kódoljuk, a négy bázissal (A, C, G, T) 0 és 1 helyett . Például egy nagybetűs “D” betű binárisan “01000100”, egy kisbetűs “d” “01100100” egy üres ” ” betűvel “00100000” (1. ábra). A 3. és 5. ábrán a “DNS digitális adattárolás” mondatot bináris változatra alakítottuk át, hogy 24 bájtos bináris kódokat kapjunk. Ezután a bináris kódokat (bináris biteket) DNS-kódokba kódolták. A négy bázis (A, C, G és T) mindegyikét 1-nek vagy 0-nak kell rendelni. Például a purin (A, G) 1-nek, a pirimidin (C, T) 0-nak van rendelve. Vagy a két bázist, a G-t és a T-t 1s-ként, a másik két bázist, az A-t és a C-t pedig 0-ként kell hozzárendelni. Amint a 4. ábrán látható, az adatkódoláshoz A 24 bájtos szöveges karakterláncot (“DNS digitális adattárolás”) bináris bitekké alakították át, amelyeket ezt követően bázisonként 1 bitet használva egy oligo-DNS-be kódoltak, ahol a purin (A, G) 1s-ként, a pirimidin (C, T) pedig 0-ként van hozzárendelve. Az oligo-DNS-t kémiai úton szintetizálták, majd a szöveg tartalmát hosszú távú tárolás céljából oligo-DNS-fragmentumokként mentették el. Az adatkódoláshoz a DNS-fragmentumokat PCR-rel amplifikáltuk, szekvenáltuk és bináris bitekre dekódoltuk egyszer egy nap, le kell hívnunk az adatokat, hogy a bináris adatok olvashatóvá váljanak. Végül a DNS-szekvencia könyvtárból történő adatolvasás az egyedi DNS-molekulák szekvenálása, a szekvenálási információk átalakítása az eredeti digitális adatokká a szükséges vagy követelmény szerint (5. ábra) .

A DNS-adattároló médium előnyei

Amint fentebb említettük, a globális adatok exponenciális ütemben meredeken növekednek. A hagyományos adathordozók nem tudják kielégítően kezelni a nagy adattárolás követelményét . A DNS a digitális adattárolás lehetséges médiumaként szolgálhat, olyan potenciális előnyei révén, mint a nagy sűrűség, a nagy replikációs hatékonyság, a hosszú távú tartósság és a hosszú távú stabilitás (https:// www.scientificworldinfo.com) . A DNS elméleti maximális kapacitása esetén nukleotidonként körülbelül két bitet képes kódolni. Az IBM által 2011-ben épített teljes adatközpont körülbelül 100 petabájt (PB) adattárolási kapacitással rendelkezik. A nagy sűrűség miatt azonban az adattároló médiumként működő DNS kis méret mellett nagy mennyiségű adatot képes tárolni. Egyetlen gramm DNS az elméleti maximumon körülbelül 200 PB adatot képes tárolni, ami majdnem kétszerese az IBM teljes adatközpontjának. Más szóval, az egész világon rögzített összes információ több kilogramm DNS-ben tárolható, ami mindössze egy cipősdoboznak felel meg, szemben a hagyományos adathordozók több millió nagy adattároló központjának igényével .

Az adatkódolt DNS adathordozó nagy tartóssága miatt képes a hosszú távú tárolásra . A DNS több ezer évig is eltartható hideg, száraz és sötét helyen. Még rosszabb környezetben is a DNS felezési ideje akár száz év is lehet . A DNS alacsony vagy magas hőmérsékleten is stabilan megmaradhat, a -800°C és 800°C közötti széles tartományban. A DNS adathordozók jobban tudják védeni az adatokat, mint a hagyományos digitális adathordozók. Bár az új adatok exponenciális ütemben növekednek, a legtöbbjüket archívumokban tárolják hosszú távú tárolásra . Ezeket a hideg adatokat nem lehet azonnal visszakeresni vagy gyakran használni. Így a DNS adathordozókon való tárolásuk egyszerű, kényelmes és költségmentes. További előnye, hogy a DNS nagymértékben konzerválódik. A természetes DNS-ek nagy hatékonysággal és mindig a bázispárosítási szabály (A a T-vel, C a G-vel) szerint képesek pontosan replikálódni (3. ábra) . Így a DNS adathordozó hosszú ideig képes nagymértékben megőrizni az adatok hűségét.

A DNS adathordozó kihívásai

Egyedi jellemzői alapján és a hagyományos adathordozókkal összehasonlítva a DNS potenciális és ígéretes adathordozó lehet a digitális adattárolás számára. Azonban még hosszú út áll előttünk, mire a DNS-t kereskedelmi forgalomba kerülhet. A kihívások, amelyekkel meg kell küzdenünk, több szempontból is léteznek, beleértve a magas költségeket, az alacsony áteresztőképességet, az adattároláshoz való korlátozott hozzáférést, a rövid szintetikus oligo-DNS fragmentumokat, a szintézis és a szekvenálás hibaarányát .

A DNS adattárolásra való felhasználása sokkal drágább, mint a többi hagyományos médium, mint a szalag, a lemez és a HDD (hard disk drive) (https://www.scientificworldinfo.com) . Jelenleg az adatok kódolása és dekódolása megabájtonként (MB) közel 15 000 dollárba kerül. Eközben a DNS-szintézis jelenlegi technológiája korlátozott, csak rövid oligo-DNS-szekvenciákat lehet szintetizálni. Az egyes oligo DNS-töredékek maximális hossza néhány száz nukleotidra korlátozódik. Így egyetlen archivált fájl tárolásához, különösen 1 nagy fájlhoz több százezer oligo DNS-re lehet szükség. És az adatoknak az oligo DNS-ekbe való írása és az oligo DNS-ekből való lekérdezése is időigényes, több lépés bevonásával, beleértve az adatok binárisra való átalakítását, a bináris kódolását oligo DNS-be, a DNS-szekvenciák szintézisét és tárolását, valamint az egyedi szekvenciák lekérdezését a DNS-tároló könyvtárból, a szekvenálást és a dekódolást, és végül a bináris adatok olvashatóvá alakítását. A hagyományos adathordozók, például a lemez és a szalag rendelkeznek logikai címzési információkkal, az oligo-DNS-ek azonban nem. Így nagyon nehéz az általunk elvárt egyedi kódolt DNS-szekvencia címzése. Eközben a DNS-alapú adattároláshoz való véletlenszerű hozzáférés fontos, azonban az oligo DNS-ek nem rendelkeznek véletlenszerű hozzáférési képességgel . A jelenlegi megközelítéseken keresztül csak tömeges hozzáférés áll rendelkezésre a DNS-adattároláshoz. A teljes DNS-alapú adattárolást rendezni, szekvenálni és dekódolni kell a DNS-adattárolásból, még akkor is, ha csak egyetlen bájtot kell olvasnunk . Ezért szükség van a megfelelő primerre, amelyet a megfelelő DNS-szekvencia szelektív lekérdezéséhez használnak. Ez véletlenszerű hozzáférést is biztosít a DNS-szekvenálás és az adatlekérdezés során. A szekvenálás az egyedi primerrel szelektíven csak a szükséges oligoDNS-t tudja olvasni, nem pedig a teljes DNS-könyvtárat . És jelenleg a DNS-szintézis és a szekvenálás nem teljesen tökéletes. A DNS-szintézis és a szekvenálás során előfordulhat beillesztés, törlés, helyettesítés és egyéb hibák előfordulása, a hibaarány nukleotidonként körülbelül 1% . A DNS-szintézis és a szekvenálás technológiája és költsége nem alkalmas a jelenlegi adattárolásra .

A DNS-adattároló médiumra való tekintettel

A globális adatok exponenciális növekedése, az elegendő tárolóhely hiánya és az innovatív tárolási megközelítések követelménye miatt a DNS mint potenciális vadonatúj médium forró témává válik a nagy adattárolás területén. A nagy sűrűség, a nagy replikációs hatékonyság, a hosszú távú tartósság és a stabilitás révén a DNS saját előnyöket mutat a hagyományos adattároló médiumokkal szemben. Eközben a DNS digitális adattárolás alkalmazásai korlátozottak voltak a magas költségek, a véletlenszerű hozzáférési képesség hiánya, az adatok kódolásának és dekódolásának időigényessége miatt. Szerencsére a DNS-technológia területén a fejlődés gyorsan halad előre. Például az első emberi genom szekvenálásának befejezéséhez a globális tudósok együttműködtek és mintegy 10-20 évig dolgoztak együtt, a teljes költség 2013-ban 3 milliárd dollár volt (Human Genome Project (HGP) weboldal: https://www.genome.gov/human-genomeproject).

Következtetés

Mára a tudósoknak mindössze néhány ezer dollárra és néhány hétre van szükségük ahhoz, hogy befejezzék egy teljes emberi genom szekvenálását. És várható, hogy a közeljövőben egy emberi genom szekvenálása csak száz dollárba vagy néhány óra alatt kerül. Így a költségek várhatóan megfizethetőek lesznek. A véletlenszerű hozzáférés és az információ címzése érdekében a tudósok megoldották ezt a kihívást az egyedi primerek megtervezésével a szükséges információ szelektív címzéséhez és lekérdezéséhez. A hiba előfordulásának elkerülése érdekében a hibajavító metaadatokat oligo DNS-darabkákba kódolják. Időközben feltalálták az egymolekulás DNS-szekvenálókat, amelyek jelenleg is rendelkezésre állnak. Ezek praktikusak és hordozhatóak. Tovább csökkenthetik a DNS-szekvenálás költségeit és egyszerűsíthetik a DNS-információ lekérdezését. Így a DNS-adattárolási technológiák fejlődését követően az adattároló médiumként szolgáló DNS a nagy adatok korszakában arany lehetőséget jelent majd.

  1. Mayer C, McInroy GR, Murat P, Delft PV, Balasubramanian S (2016) An epigenetics-inspired DNA-based data storage system. Angew Chem Int Ed Engl 55: 11144-11148.
  2. Swati A, Mathuria, F, Bhavani, S, Malathy E, Mahadevan R (2017) A review on various encoding schemes used in digital DNA data storage. Int J Civil Eng Technol 8: 7-10.
  3. Appuswamy RLK, Barbry P, Antonini M, Madderson O, Freemont P (2019) Archive: A DNS használata a DBMS tárolási hierarchiájában. CIDR 2019, Biennal Conference on Innovative Data Systems Research, California, USA.
  4. De Silva PY, GU Ganegoda (2016) New trends of digital data storage in DNA. Biomed Res Int pp: 8072463-8072472.
  5. Panda DM, Baig KA, Swain MJ, Behera A, Dash D (2018) DNA as a digital information storage device: hope or hype? Biotech 8: 9-15.
  6. Chen K, Kong J, Zhu J, Ermann N, Predki P, et al. (2019) Digital data storage using DNA nanostructures and solid-state Nanopores. Nano Lett 19: 1210-1215.
  7. Yazdi S, Gabrys R, Milenkovic O (2017) Portable and error-free DNA-based data storage. Sci Rep 7: 5011-5013.
  8. Church GM, Gao Y, Kosuri S (2012) Next-generation digital information storage in DNA. Science 337: 1628-1630.
  9. Kuang SY, Zhu G, Wang ZL (2018) Triboelektrifikációval támogatott önműködő adattárolás. Adv Sci (Weinh) 5: 1700658.
  10. Block FE (1987) Analog and digital computer theory. Int J Clin Monit Comput 4: 47-51.
  11. O’ Driscoll A, Sleator RD (2013) Szintetikus DNS: a nagy adattárolás következő generációja. Bioengineered 4: 123-1235.
  12. Portin P (2014) A DNS-öröklési elmélet születése és fejlődése: hatvan év a DNS szerkezetének felfedezése óta. J Genet 93: 293-302.
  13. Leu K, Obermayer B, Rajamani S, Gerland U, Chen IA (2011) The prebiotic evolutionary advantage of transferring genetic information from RNA to DNA. Nucleic Acids Res 39: 8135-8147.
  14. Burgers PMJ, Kunkel TA (2017) Eukarióta DNS replikációs villa. Annu Rev Biochem 86: 417-438.
  15. Akram F, Haq I, Ali H, Laghari AT (2018) Trends to store digital data in DNA: an overview. Mol Biol Rep 45: 1479-1490.
  16. Organick L, Ang SD, Chen YJ, Lopez R, Yekhanin S, et al. (2018) Random access in large-scale DNA data storage. Nat Biotechnol 36: 242-248.
  17. Bornholt J, Lopez R, Carmean DM, Ceze L, Seelig G, et al. (2016) A DNA-alapú archiváló tárolórendszer. ASPLOS 201 (21st ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Atlanta, GA).
  18. Newman S, Stephenson AP, Willsey M, Nguyen BH, Takahashi CN, et al. (2019) High density DNA data storage library via dehidration with digital microfluidic retrieval. Nat Commun 10: 1706-1710.
  19. Yazdi SM, Yuan Y, Ma J, Zhao H, Milenkovic O (2015) A rewritable, random-access DNA-based storage system. Sci Rep 5: 14138-14140.
  20. Ahn T, Ban H, Park H (2018) Digitális információ tárolása a hosszú olvasású DNS-ben. Genomics Inform 16: e30-35.
  21. Bayley H (2017) Single-molecule DNA sequencing: Eljutni a kút fenekére. Nat Nanotechnol 12: 1116-1117.