Health Science Journal
Klíčová slova
Digitální ukládání dat; kyselina deoxyribonukleová (DNA); binární; kódování; dekódování; sekvenování
Úvod
Dnes je výbušná doba velkých dat. Tato velká data existují a pokrývají téměř všude, od obchodů s potravinami po banky, od offline po online, od akademie po průmysl, od nemocnice po komunitu, od organizace po vládu. Ukládání a správa velkých dat se stává vážným problémem. V současné době je většina dat na celém světě uložena především na magnetických a optických médiích, jako jsou HDD (pevné disky), DISKY, CD, pásky, DVD, přenosné pevné disky a USB streak disky . Rychlost růstu těchto archivních dat se však exponenciálně zvyšuje. Tato tradiční média a jejich omezená kapacita pro ukládání dat nemohou splnit požadavek rychlého nárůstu digitálních dat. Současně je jednou z hlavních výzev trvanlivost těchto médií pro ukládání dat. Jejich trvanlivost je velmi omezená. Tato média vydrží jen velmi omezenou dobu. Například disky vydrží několik let a pásky několik desetiletí. Jiná elektronická úložiště lze v dobrém stavu uchovávat po několik desetiletí. Dalším problémem pro ukládání velkých digitálních dat je kapacita pro ukládání dat. Na CD může být uloženo několik set megabajtů (MB) dat. Velký pevný disk může uchovávat několik terabajtů (TB) dat. Jejich kapacita však zdaleka nedosahuje požadavků na explozivní informační data .
Jak uvedl Patrizio, v roce 2018 je na světě celkem 33 zettabajtů (ZBs) dat (https://www.networkworld.com), což se rovná 22 bilionům gigabajtů (GBs). Proto je zapotřebí nová technologie ukládání a inovativní systém, který by splňoval požadavky této moderní doby. Očekává se, že deoxyribonukleová kyselina (DNA) bude díky svým jedinečným výhodám ideálním médiem pro ukládání digitálních dat . Ukládání digitálních dat do DNA není novinkou. Ve skutečnosti jej popsal sovětský fyzik Michail Neiman v roce 1960 (https:// www.geneticsdigest.com). Poprvé však bylo prokázáno, že DNA může ukládat digitální data, v roce 1988 . Zde nejprve představíme aplikace DNA jako nového média pro ukládání digitálních dat a dále se budeme zabývat podrobnějšími informacemi v této oblasti DNA sloužící jako médium pro ukládání dat.
Přehled předchozích studií
Dvojková číselná soustava
Počítače a další digitální elektronická zařízení ukládají data a pracují s dvojkovou číselnou soustavou, která používá pouze dvě digitální čísla neboli 0 a 1 . Texty se v počítačové soustavě převádějí na binární verzi. Počítače zase pracují a počítají ve dvojkové soustavě, případně převádějí informace na čitelné texty. Jeden bajt obsahuje osm bitů složených z 0 nebo 1 a má 28 (256) možných hodnot (od 0 do 255) a ukládá jedno písmeno (obrázek 1 a tabulka 1) . Jak ukazuje převodní tabulka ASCII (tabulka 1). Dvacet šest písmen s velkými a malými písmeny se převádí mezi písmeny, dvojkovou a šestnáctkovou soustavou. Pro uložení velkého souboru nebo dokumentu je potřeba mnohem více dat v paměti. Běžná skladba může potřebovat desítky megabajtů, pro uložení filmu několik gigabajtů a pro knihy uložené ve velké knihovně několik terabajtů. Jak ukazuje tabulka 2, jsou velikosti měření a paměti pro použití dvojkové soustavy od nejmenší jednotky „bajt“ až po velké jednotky, včetně bajtu (B), kilobajtu (KB), megabajtu (MB), gigabajtu (GB), terabajt (TB), pegabajt (PB), exabajt (EB), zettabajt (ZB), yottabajt (YB), brontobajt (BB), geobajt (GPB) a tak dále (https://www.geeksforgeeks.org&https://whatsabyte.com). Jednotky jako brontobyte (BB), geopbyte (GPB) jsou nepředstavitelně obrovské hodnoty, které se v našem reálném světě možná nikdy nepoužijí (tabulka 2).
Obrázek 1: Textový řetězec „DNA digital data storage“ byl převeden jako binární bity.
Table 1: The conversion ASCII table of the twenty-six letters with the upper and lower cases among letter, binary and hexadecimal.
Letter | Binary | Hexadecimal | Letter | Binary | Hexadecimal |
---|---|---|---|---|---|
A | 1000001 | 41 | a | 1100001 | 61 |
B | 1000010 | 42 | b | 1100010 | 62 |
C | 1000011 | 43 | c | 1100011 | 63 |
D | 1000100 | 44 | d | 1100100 | 64 |
E | 1000101 | 45 | e | 1100101 | 65 |
F | 1000110 | 46 | f | 1100110 | 66 |
G | 1000111 | 47 | g | 1100111 | 67 |
H | 1001000 | 48 | h | 1101000 | 68 |
I | 1001001 | 49 | i | 1101001 | 69 |
J | 1001010 | 4A | j | 1101010 | 6A |
K | 1001011 | 4B | k | 1101011 | 6B |
L | 1001100 | 4C | l | 1101100 | 6C |
M | 1001101 | 4D | m | 1101101 | 6D |
N | 1001110 | 4E | n | 1101110 | 6E |
O | 1001111 | 4F | o | 1101111 | 6F |
P | 1010000 | 50 | p | 1110000 | 70 |
Q | 1010001 | 51 | q | 1110001 | 71 |
R | 1010010 | 52 | r | 1110010 | 72 |
S | 1010011 | 53 | s | 1110011 | 73 |
T | 1010100 | 54 | t | 1110100 | 74 |
U | 1010101 | 55 | u | 1110101 | 75 |
V | 1010110 | 56 | v | 1110110 | 76 |
W | 1010111 | 57 | w | 1110111 | 77 |
X | 1011000 | 58 | x | 1111000 | 78 |
Y | 1011001 | 59 | y | 1111001 | 79 |
Z | 1011010 | 5A | z | 1111010 | 7A |
*Note: ACSII (American Standard Code for Information Interchange): serial digital codes to represent number, letters, numerals, and other symbols and to be used as a standard format in the computer system.
Table 2: The sizes of measurement and memory.
Sizes | Byte Magnitude | Units | Storage* |
---|---|---|---|
1 B | 100 | Byte | A character „A“, „1“, „$“ |
10 B | 101 | ||
100 B | 102 | ||
1 KB | 103 | Kilo byte | The size for graphics of small websites ranges between 5 and 100 KB |
10 KB | 104 | ||
100 KB | 105 | ||
1 MB | 106 | Mega byte ( 1 MB: 1 million) |
The size for a high resolution JPEG image is about 1-5 MB |
10 MB | 107 | The size for a 3-minute song is about 30 MB | |
100 MB | 108 | ||
1 GB | 109 | Giga byte | The size for a standard DVD drive is about 5 GB |
10 GB | 1010 | (1 GB: 1 billion) | |
100 GB | 1011 | ||
1 TB | 1012 | Tera byte (1 TB: 1 trillion) |
The size for a typical internal HDD is about 2 TB |
10 TB | 1013 | ||
100 TB | 1014 | ||
1 PB | 1015 | Peta byte (1 PB: 1 quadrillion) |
Google store over 100 PB of all data in their drivers. |
10 PB | 1016 | ||
100 PB | 1017 | ||
1 EB | 1018 | Exa byte (1 EB: 1 quintillion) |
Several hundred EBs of data are transferred over global internet per year Facebook built an entire data center to store 1 EB of data in 2013 |
10 EB | 1019 | ||
100 EB | 1020 | ||
1 ZB | 1021 | Zetta byte (1 ZB: 1 sextillion) |
33 ZBs of global data in 2018. 160-180 ZBs of data is predicted in 2025. |
10 ZB | 1022 | ||
100 ZB | 1023 | ||
1 YB | 1024 | Yotta byte (1 YB: 1 septillion) |
1YB = 1 million EBs 1 YB = Size of the entire World Wide Web |
10 YB | 1025 | ||
100 YB | 1026 | ||
1 BB | 1027 | Bronto byte (1 BB: 1 octillion) |
1BB equals to 1 million ZBs The only thing there is to say about a Brontobyte is that it is a 1 followed by 27 zeros! |
10 BB | 1028 | ||
100 BB | 1029 | ||
1 GPB | 1030 | Geop byte (1 GPB: 1 nonillion) | 1, No one knows why this term was created. It is highly doubtful that anyone alive today will EVER see a Geopbyte hard drive. |
The digital data storage
Digital Data Storage (DDS) was introduced and developed in 1980s. It is a computer-based data storage technology that is based on the Digital Audio Tape (DAT) format. These digital data were stored on the silicon-based chips. Silicon is the primary material of most semiconductor and microelectronic chips. Čistý paměťový křemík se v přírodě vyskytuje jen zřídka. Očekává se, že všechny zásoby křemíku pro mikročipy na světě v blízké budoucnosti dojdou. Také Moorův zákon (Počet tranzistorů umístěných na integrovaných obvodech se každé dva roky téměř zdvojnásobí, neboli čipy s větším počtem tranzistorů běží rychleji) se blíží ke konci . Čipy tedy nemohou pojmout další tranzistory a dosáhnou hranice své kapacity.
Momentálně je většina současných digitálních dat uložena na tradičních magnetických, optických a dalších médiích, jako jsou HDD (pevné disky) a CD. Kromě omezené kapacity pro ukládání dat lze tato média uchovávat také po velmi omezenou dobu . Jsou citlivá na prostředí nebo podmínky ukládání dat. Jakákoli změna prostředí a podmínek, jako je magnetické působení, vysoká vlhkost, vysoká teplota, mechanické poškození, může případně vést k poškození těchto médií nebo ke ztrátě jejich dat. A časté používání také může vést k jejich poškození nebo ztrátě dat. A také pro uložení velkého množství dat a splnění požadavku na explozivní nárůst dat potřebujeme velké množství takových médií, jako jsou disky, CD, DVP, pevné disky. Ty vedou k vysokým nákladům a jsou časově náročné.
Současně exponenciálně roste nárůst digitálních dat a požadavek na jejich ukládání. Společnost IBM vybudovala v roce 2011 velké centrum s kapacitou ukládání dat 120 PB. Společnost Facebook postavila v roce 2013 další větší centrum s kapacitou ukládání 1 EB (1000 PBs) dat. Všichni uživatelé digitálních technologií na celém světě vyprodukovali denně více než 44 exabajtů (EB) (44000 PBs) dat. V roce 2010 byl celosvětově vyprodukován celkem 1 zetabajt (ZB, 1000 EBs nebo 1 milion PBs) dat, v roce 2018 to bylo 33 zetabajtů (ZB) dat a v roce 2025 se předpokládá 150-200 zetabajtů (ZBs) (citováno z webu Datanami: https:// www.datanami.com a webu Network world: https:// www.networkworld.com) . K uložení těchto dat by byly potřeba stovky tisíc obrovských prostorových center. V roce 2018 měl Facebook celkem 15 datových center a další nová centra byla ohlášena. V Nebrasce postaví další čtyři datová centra, která se budou skládat ze šesti velkých budov s plochou pro ukládání dat přesahující 2,6 milionu čtverečních stop. Ať už je to jakkoli, datové prostory nikdy nemohou zachytit exponenciální nárůst dat. Současná paměťová média také nemohou uspokojit požadavky na ukládání dat. Je naléhavě nutné vyvinout novou generaci technologie ukládání dat namísto současného ukládání dat na bázi křemíku. Díky svým jedinečným vlastnostem a potenciálním výhodám se deoxyribonukleová kyselina (DNA) jako možné digitální médium pro ukládání dat dostává do ústřední fáze ukládání dat.
Základní informace o deoxyribonukleové kyselině (DNA)
V roce 1953 Dr. Crick a Watson odhalili, že molekula DNA má dvojitá vlákna, která se kolem sebe stáčejí a tvoří dvojitou šroubovici. Obecně jsou genetické materiály ve většině přírodních organismů tvořeny dvojitými vlákny šroubovice DNA, přičemž některé jsou tvořeny jedním vláknem DNA a některé další jsou tvořeny jedním nebo dvěma vlákny RNA. Složky DNA neboli nukleotidy se skládají z dusíkatých bází, fosfátových skupin a deoxyribózových skupin. Dvě písmena jsou strukturována jako páteř každé molekuly DNA, přičemž každý pár bází z každého vlákna se spojuje vodíkovou vazbou. Nukleotidy DNA se skládají ze čtyř typů bází včetně adeninu (A), cytosinu (C), guaninu (G) a thyminu (T) (obrázek 2) , přičemž ribonukleová kyselina (RNA) má čtyři typy bází včetně adeninu (A), cytosinu (C), guaninu (G) a uracilu (U) místo thyminu (T). Adenin (A) a guanin (G) jsou puriny, cytosin (C), tymin (T) a uracil (U) jsou pyrimidiny . In DNA molecules, the base-pairing rule is that A pairs with T, and G pairs with C (Figures 3 and 4) .
Figure 3: The schematic structure of deoxyribonucleic acid (DNA). There are four types of nucleotides being composed of a deoxyribose, a phosphate group and one of the four nucleobases (A, T, G, C). The double strand DNA forms a double helix via pairing A with T and C with G, and connecting with hydrogen bonds in between. Cited from Genetics Generation (website:https://knowgenetics.org).
Figure 4: Schematický průběh replikace DNA. Molekula DNA má dvě komplementární vlákna. Během semikonzervativní replikace dochází k oddělení dvou vláken molekul DNA. Každé rodičovské vlákno slouží jako templát pro vytvoření svého komplementárního vlákna (dceřiného vlákna). Každá komplementární báze se přidává do nového vlákna jako opak báze na rodičovském vlákně (A s T a C s G). Nová dvouřetězcová molekula DNA má jedno rodičovské a jedno dceřiné vlákno. Tyto molekuly DNA jsou vysoce konzervativní. Citováno ze Slide Share (webová stránka:https://www.slideshare.net/quaninaquan/dnareplication- slide-11981512).
Proces spočívá v tom, že dvouřetězcová molekula DNA se odvíjí, přičemž každé ze dvou rodičovských vláken je odděleno a funguje jako rodičovská předloha pro syntézu nových dceřiných molekul DNA. Do dceřiného vlákna se přidávají komplementární nukleotidy, přičemž fosfáty a deoxyribosy tvoří páteř nových nukleotidů a nové báze se párují s opačnými bázemi na rodičovském vlákně pomocí pravidla párování bází (A se páruje s T a G s C) a drží na místě pomocí vodíkových vazeb . Nakonec má každá z nových dvouřetězcových molekul DNA jedno rodičovské a jedno dceřiné vlákno. Molekuly DNA se v tomto semikonzervativním modelu replikují, udržují genetické DNA konzervativní a konstantní a předávají se z jedné generace do druhé (Obrázek 5) .
Obrázek 5: Schematický proces ukládání digitálních dat do DNA, včetně kódování (kódování binárního řetězce do oligoDNA) a dekódování (dekódování sekvencí DNA do binárních dat). Pro kódování: Textový řetězec o 24 bajtech („uložení digitálních dat v DNA“) byl převeden na binární bity, které jsou následně zakódovány do oligoDNA pomocí jednoho bitu na bázi, přičemž purinům (A, G) jsou přiřazeny jedničky a pyrimidinům (C, T) nuly. OligoDNA byla syntetizována a obsah textu byl uložen jako fragmenty oligoDNA. Pro dekódování byly fragmenty DNA amplifikovány pomocí PCR, sekvenovány a dekódovány na binární bity a nakonec převedeny na čitelnou informaci.
Proces ukládání digitálních dat DNA
Proces ukládání digitálních dat DNA spočívá v kódování a dekódování binárních dat do a ze syntetizovaných řetězců DNA. Texty, čísla, obrázky a další čitelné nebo viditelné údaje se nejprve převedou na binární jazyky s 0 a 1 místo 0 a pak se zakódují do sekvencí nukleotidů DNA se čtyřmi bázemi (A, C, G, T) místo 0 a 1 . Například velké písmeno „D“ je v binární soustavě „01000100“, malé písmeno „d“ je „01100100“ a prázdné “ “ je „00100000“ (obrázek 1). Na obrázcích 3 a 5 byla věta „DNA digital data storage“ převedena do binární verze, aby se získaly binární kódy o 24 bytech. Poté jsou binární kódy (binární bity) zakódovány do kódů DNA. Každá ze čtyř bází (A, C, G a T) by měla být přiřazena jako 1 nebo 0. Například purin (A, G) je přiřazen jako 1s, přičemž pyrimidin (C, T) je jako 0s. Nebo dvě báze G a T jsou přiřazeny jako 1s, přičemž zbylé dvě A a C jsou 0s. Jak je znázorněno na obrázku 4, pro kódování dat byl textový řetězec o 24 bajtech („digitální úložiště dat DNA“) převeden na binární bity, které jsou následně zakódovány do oligo DNA pomocí 1 bitu na bázi, přičemž purin (A, G) je přiřazen jako 1s a pyrimidin (C, T) jako 0s. Oligo DNA byla chemicky syntetizována a obsah textu byl poté uložen jako fragmenty oligo DNA pro dlouhodobé uložení. Pro dekódování dat byly fragmenty DNA amplifikovány pomocí PCR, sekvenovány a dekódovány na binární bity jednou denně, abychom mohli vyvést binární data, která mají být čitelná, musíme data načíst. Nakonec přečtení dat z knihovny sekvencí DNA spočívá v sekvenování jedinečných molekul DNA, převedení sekvenčních informací do původních digitálních dat podle potřeby nebo požadavku (obrázek 5) .
Výhody média pro ukládání dat DNA
Jak bylo uvedeno výše, globálních dat prudce přibývá exponenciální rychlostí. Tradiční média se nemohou dostatečně vypořádat s požadavkem na ukládání velkého množství dat . DNA může sloužit jako možné médium pro ukládání digitálních dat díky svým potenciálním výhodám, jako je vysoká hustota, vysoká účinnost replikace, dlouhodobá trvanlivost a dlouhodobá stabilita (https:// www.scientificworldinfo.com) . DNA při své teoretické maximální kapacitě může zakódovat přibližně dva bity na jeden nukleotid . Celé datové centrum postavené společností IBM v roce 2011 má kapacitu pro ukládání dat přibližně 100 petabajtů (PB). Vzhledem k tomu, že má vysokou hustotu, může však DNA působící jako médium pro ukládání dat uchovávat velké množství dat při malé velikosti. Jediný gram DNA může při svém teoretickém maximu uložit přibližně 200 PB dat, což je téměř dvakrát více než celé datové centrum IBM . Jinými slovy, všechny informace zaznamenané na celém světě mohou být uloženy v několika kilogramech DNA, nebo se rovnají pouze jedné krabici od bot ve srovnání s požadavkem milionů velkých datových úložných center pro tradiční média .
Datové médium DNA je schopné dlouhodobého ukládání díky tomu, že má vysokou trvanlivost . DNA může vydržet tisíce let v chladných, suchých a tmavých místech. Dokonce i v horším prostředí je poločas rozpadu DNA až sto let . DNA si může uchovat stabilitu při nízkých nebo vysokých teplotách v širokém rozmezí od -800 °C do 800 °C . Nosiče DNA mohou také zabezpečit data více než tradiční digitální nosiče dat . Přestože nových dat přibývá exponenciální rychlostí, většina z nich je uložena v archivech pro dlouhodobé skladování . Tato chladná data nebudou okamžitě vyhledána nebo často používána. Jejich ukládání na média DNA je tedy jednoduché, pohodlné a finančně nenáročné. Další výhodou je, že DNA je vysoce konzervovaná. Přírodní DNA se mohou přesně replikovat s vysokou účinností a vždy s pravidlem párování bází (A s T, C s G) (obrázek 3) . Médium DNA tak může vysoce zachovat věrnost dat po dlouhou dobu.
Výzvy pro médium pro ukládání dat DNA
Na základě svých jedinečných vlastností a ve srovnání s tradičními médii by DNA mohla být potenciálním a slibným médiem pro ukládání digitálních dat . Než však bude možné DNA komerčně využít, čeká ji ještě dlouhá cesta. Problémy, se kterými se musíme vypořádat, existují v různých aspektech, včetně vysoké ceny, nízké propustnosti, omezeného přístupu k datovému úložišti, krátkých syntetických oligo fragmentů DNA, chybovosti při syntéze a sekvenování .
Použití DNA při ukládání dat je mnohem dražší než ostatní tradiční média, jako jsou pásky, disky a HDD (pevné disky) (https://www.scientificworldinfo.com) . V současné době stojí zakódování a dekódování dat téměř 15 000 USD za megabajt (MB). Současná technologie syntézy DNA je přitom omezená a lze syntetizovat pouze krátké oligo sekvence DNA. Maximální délka každého oligo fragmentu DNA je omezena na několik set nukleotidů . K uložení jednoho archivního souboru, zejména 1 velkého souboru, tak mohou být zapotřebí stovky tisíc oligo DNA. A také je časově náročné data zapsat do oligo DNA a načíst je z nich, přičemž se na tom podílí více kroků včetně převodu dat do binární podoby, kódování binární podoby do oligo DNA, syntézy a ukládání sekvencí DNA a načítání jedinečných sekvencí z knihovny pro ukládání DNA, sekvenování a dekódování a nakonec převod binární podoby na čitelná data. Tradiční média, jako jsou disk a páska, mají své logické adresní informace, oligo DNA je však nemají. Je tedy velmi obtížné adresovat jedinečnou zakódovanou sekvenci DNA, kterou očekáváme, že bude mít . Mezitím je důležitý náhodný přístup k ukládání dat na bázi DNA, oligo DNA však nemají schopnost náhodného přístupu . Prostřednictvím současných přístupů je pro ukládání dat DNA k dispozici pouze hromadný přístup. Celé datové úložiště na bázi DNA musí být tříděno, sekvenováno a dekódováno z datového úložiště DNA, přestože potřebujeme přečíst pouze jeden bajt . Proto je zapotřebí správný primer používaný k selektivnímu načtení správné sekvence DNA. To také zajistí náhodný přístup během sekvenování DNA a načítání dat. Sekvenování pomocí jedinečného primeru může selektivně přečíst pouze požadovanou oligoDNA, nikoli celou knihovnu DNA . A v současné době nejsou syntéza a sekvenování DNA zcela dokonalé. Během syntézy a sekvenování DNA může dojít k výskytu inzerce, delece, substituce a dalších chyb, přičemž chybovost je přibližně 1 % na nukleotid . Technologie a náklady na syntézu a sekvenování DNA nejsou vhodné pro současné ukládání dat .
Předpoklad pro médium pro ukládání dat DNA
Vzhledem k exponenciálnímu nárůstu globálních dat, nedostatku dostatečných úložných prostor a požadavku na inovativní přístupy k ukládání se DNA jako potenciální zcela nové médium stává horkým tématem v oblasti ukládání velkých dat. Díky vysoké hustotě, vysoké účinnosti replikace, dlouhodobé trvanlivosti a stabilitě vykazuje DNA oproti tradičním médiím pro ukládání dat své vlastní výhody . Zatím jsou aplikace digitálního ukládání dat pomocí DNA omezené kvůli vysokým nákladům, nedostatečné schopnosti náhodného přístupu, časové náročnosti při kódování a dekódování dat. Naštěstí pokrok v oblasti technologie DNA jde rychle kupředu. Například na dokončení sekvenování prvního lidského genomu spolupracovali a pracovali světoví vědci přibližně 10-20 let, přičemž celkové náklady v roce 2013 činily 3 miliardy dolarů (webové stránky Human Genome Project (HGP): https://www.genome.gov/human-genomeproject).
Závěr
V dnešní době vědcům stačí několik tisíc dolarů a pár týdnů k dokončení sekvenace jednoho celého lidského genomu. A očekává se, že v blízké budoucnosti bude sekvenování jednoho lidského genomu stát jen sto dolarů nebo méně než několik hodin. Lze tedy očekávat, že náklady budou dostupné. Pro náhodný přístup k informacím a jejich adresování vyřešili vědci tento problém návrhem jedinečných primerů, které selektivně adresují a získávají požadované informace. Aby se zabránilo výskytu chyb, jsou metadata pro opravu chyb zakódována v oligo fragmentech DNA. Mezitím byly vynalezeny jednomolekulární sekvenátory DNA, které jsou v současné době k dispozici. Jsou praktické a přenosné. Mohou dále snížit náklady na sekvenování DNA a zjednodušit vyhledávání informací o DNA. V návaznosti na pokrok v technologiích ukládání dat DNA tak bude DNA sloužící jako médium pro ukládání dat zlatou příležitostí v této éře velkých dat.
- Mayer C, McInroy GR, Murat P, Delft PV, Balasubramanian S (2016) An epigenetics-inspired DNA-based data storage system. Angew Chem Int Ed Engl 55: 11144-11148.
- Swati A, Mathuria, F, Bhavani, S, Malathy E, Mahadevan R (2017) A review on various encoding schemes used in digital DNA data storage. Int J Civil Eng Technol 8: 7-10.
- Appuswamy RLK, Barbry P, Antonini M, Madderson O, Freemont P (2019) Archive: Použití DNA v hierarchii úložišť DBMS. CIDR 2019, Biennal Conference on Innovative Data Systems Research, Kalifornie, USA.
- De Silva PY, GU Ganegoda (2016) New trends of digital data storage in DNA. Biomed Res Int pp: 8072463-8072472.
- Panda DM, Baig KA, Swain MJ, Behera A, Dash D (2018) DNA as a digital information storage device: hope or hype? Biotech 8: 9-15.
- Chen K, Kong J, Zhu J, Ermann N, Predki P a další (2019) Digital data storage using DNA nanostructures and solid-state Nanopores. Nano Lett 19: 1210-1215.
- Yazdi S, Gabrys R, Milenkovic O (2017) Portable and error-free DNA-based data storage. Sci Rep 7: 5011-5013.
- Church GM, Gao Y, Kosuri S (2012) Next-generation digital information storage in DNA. Science 337: 1628-1630.
- Kuang SY, Zhu G, Wang ZL (2018) Triboelectrification-Enabled Self-Powered Data Storage. Adv Sci (Weinh) 5: 1700658.
- Block FE (1987) Analog and digital computer theory. Int J Clin Monit Comput 4: 47-51.
- O‘ Driscoll A, Sleator RD (2013) Synthetic DNA: the next generation of big data storage. Bioengineered 4: 123-1235.
- Portin P (2014) Zrod a vývoj teorie dědičnosti DNA: šedesát let od objevu struktury DNA. J Genet 93: 293-302.
- Leu K, Obermayer B, Rajamani S, Gerland U, Chen IA (2011) The prebiotic evolutionary advantage of transfering genetic information from RNA to DNA. Nucleic Acids Res 39: 8135-8147.
- Burgers PMJ, Kunkel TA (2017) Eukaryotic DNA replication Fork. Annu Rev Biochem 86: 417-438.
- Akram F, Haq I, Ali H, Laghari AT (2018) Trends to store digital data in DNA: an overview. Mol Biol Rep 45: 1479-1490.
- Organick L, Ang SD, Chen YJ, Lopez R, Yekhanin S a další (2018) Random access in large-scale DNA data storage. Nat Biotechnol 36: 242-248.
- Bornholt J, Lopez R, Carmean DM, Ceze L, Seelig G, et al. (2016) A DNA-based archival storage system. ASPLOS 201 (21st ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Atlanta, GA).
- Newman S, Stephenson AP, Willsey M, Nguyen BH, Takahashi CN, et al. (2019) High density DNA data storage library via dehydration with digital microfluidic retrieval. Nat Commun 10: 1706-1710.
- Yazdi SM, Yuan Y, Ma J, Zhao H, Milenkovic O (2015) A rewritable, random-access DNA-based storage system. Sci Rep 5: 14138-14140.
- Ahn T, Ban H, Park H (2018) Ukládání digitální informace v DNA s dlouhým čtením. Genomics Inform 16: e30-35.
- Bayley H (2017) Single-molecule DNA sequencing: Getting to the bottom of the well. Nat Nanotechnol 12: 1116-1117.