ΔΙΑΦΗΜΙΣΗ

Το DNA ως μέσο αποθήκευσης τεράστιων δεδομένων υπολογιστή: μια πραγματικότητα πολύ σύντομα;

Μια πρωτοποριακή μελέτη κάνει ένα σημαντικό βήμα προς τα εμπρός στην προσπάθεια ανάπτυξης ενός συστήματος αποθήκευσης ψηφιακών δεδομένων με βάση το DNA.

Ψηφιακό ημερομηνία αυξάνεται με εκθετικό ρυθμό σήμερα λόγω της εξάρτησής μας από gadget και απαιτεί ισχυρή μακροπρόθεσμη αποθήκευση. Η αποθήκευση δεδομένων γίνεται σιγά σιγά πρόκληση επειδή η τρέχουσα ψηφιακή τεχνολογία δεν είναι σε θέση να δώσει λύση. Ένα παράδειγμα είναι ότι τα τελευταία δύο χρόνια έχουν δημιουργηθεί περισσότερα ψηφιακά δεδομένα από ό,τι σε όλη την ιστορία των υπολογιστών, στην πραγματικότητα δημιουργούνται 2.5 κουιντσεκατομμύρια byte {1 quintillion byte = 2,500,000 Terabyte (TB) = 2,500,000,000 Gigabyte (GB)} δεδομένων κάθε μέρα στον κόσμο. Αυτό περιλαμβάνει δεδομένα σε ιστότοπους κοινωνικής δικτύωσης, ηλεκτρονικές τραπεζικές συναλλαγές, αρχεία εταιρειών και οργανισμών, δεδομένα από δορυφόρους, επιτήρηση, έρευνα, ανάπτυξη κ.λπ. Αυτά τα δεδομένα είναι τεράστια και αδόμητα. Ως εκ τούτου, είναι τώρα μια μεγάλη πρόκληση να αντιμετωπίσουμε τις τεράστιες απαιτήσεις αποθήκευσης δεδομένων και την εκθετική τους ανάπτυξη, ειδικά για οργανισμούς και εταιρείες που απαιτούν ισχυρή μακροπρόθεσμη αποθήκευση.

Οι διαθέσιμες επιλογές αυτή τη στιγμή είναι ο σκληρός δίσκος, οι οπτικοί δίσκοι (CD), τα memory stick, οι μονάδες flash και οι πιο προηγμένες μονάδες tapes ή οι οπτικοί δίσκοι BluRay που αποθηκεύουν περίπου έως και 10 Terabyte (TB) δεδομένων. Τέτοιες συσκευές αποθήκευσης αν και χρησιμοποιούνται συνήθως έχουν πολλά μειονεκτήματα. Πρώτον, έχουν χαμηλή έως μέτρια διάρκεια ζωής και πρέπει να φυλάσσονται σε ιδανικές συνθήκες θερμοκρασίας και υγρασίας για να μπορούν να διαρκέσουν πολλές δεκαετίες και επομένως απαιτούν ειδικά σχεδιασμένους φυσικούς χώρους αποθήκευσης. Σχεδόν όλα αυτά καταναλώνουν πολλή ενέργεια, είναι ογκώδη και μη πρακτικά και μπορούν να καταστραφούν με μια απλή πτώση. Μερικά από αυτά είναι πολύ ακριβά, συχνά μαστίζονται με σφάλματα δεδομένων και επομένως δεν είναι αρκετά ανθεκτικά. Μια επιλογή που έχει γίνει παγκοσμίως αποδεκτή από τον οργανισμό ονομάζεται cloud computing – μια ρύθμιση στην οποία μια εταιρεία προσλαμβάνει ουσιαστικά έναν «εξωτερικό» διακομιστή για να χειρίζεται όλες τις απαιτήσεις πληροφορικής και αποθήκευσης δεδομένων, που αναφέρεται ως «σύννεφο». Ένα από τα κύρια μειονεκτήματα του cloud computing είναι τα ζητήματα ασφάλειας και απορρήτου και η ευπάθεια σε επιθέσεις από χάκερ. Υπάρχουν επίσης άλλα ζητήματα, όπως το υψηλό κόστος, ο περιορισμένος έλεγχος από τον γονικό οργανισμό και η εξάρτηση από την πλατφόρμα. Το cloud computing εξακολουθεί να θεωρείται μια καλή εναλλακτική για μακροπρόθεσμη αποθήκευση. Ωστόσο, φαίνεται ότι οι ψηφιακές πληροφορίες που παράγονται παγκοσμίως σίγουρα ξεπερνούν την ικανότητά μας να τις αποθηκεύουμε και απαιτούνται ακόμη πιο ισχυρές λύσεις για την αντιμετώπιση αυτού του κατακλυσμού δεδομένων, παρέχοντας παράλληλα δυνατότητα κλιμάκωσης ώστε να λαμβάνονται υπόψη και οι μελλοντικές ανάγκες αποθήκευσης.

Μπορεί το DNA να βοηθήσει στην αποθήκευση του υπολογιστή;

Τα DNA (Δεοξυριβονουκλεϊκό οξύ) θεωρείται ως ένα συναρπαστικό εναλλακτικό μέσο για την αποθήκευση ψηφιακών δεδομένων. Το DNA είναι το αυτοαναπαραγόμενο υλικό που υπάρχει σε όλους σχεδόν τους ζωντανούς οργανισμούς και είναι αυτό που αποτελεί τη γενετική μας πληροφορία. Ένα τεχνητό ή συνθετικό DNA είναι ένα ανθεκτικό υλικό που μπορεί να κατασκευαστεί χρησιμοποιώντας εμπορικά διαθέσιμα μηχανήματα σύνθεσης ολιγονουκλεοτιδίων. Το κύριο πλεονέκτημα του DNA είναι η μακροζωία του καθώς ένα DNA διαρκεί 1000 φορές περισσότερο από το πυρίτιο (τσιπ πυριτίου - το υλικό που χρησιμοποιείται για την κατασκευή υπολογιστές). Παραδόξως, μόνο ένα κυβικό χιλιοστό DNA μπορεί να χωρέσει ένα εκατομμύριο byte δεδομένων! Το DNA είναι επίσης ένα εξαιρετικά συμπαγές υλικό που δεν αποικοδομείται ποτέ και μπορεί να αποθηκευτεί σε δροσερό, ξηρό μέρος για εκατοντάδες αιώνες. Η ιδέα της χρήσης DNA για αποθήκευση υπήρχε εδώ και πολύ καιρό από το 1994. Ο κύριος λόγος είναι ο παρόμοιος τρόπος με τον οποίο αποθηκεύονται οι πληροφορίες σε έναν υπολογιστή και στο DNA μας – αφού και τα δύο αποθηκεύουν τα σχεδιαγράμματα των πληροφοριών. Ένας υπολογιστής αποθηκεύει όλα τα δεδομένα ως 0 και 1 και το DNA αποθηκεύει όλα τα δεδομένα ενός ζωντανού οργανισμού χρησιμοποιώντας τις τέσσερις βάσεις - θυμίνη (Τ), γουανίνη (G), αδενίνη (Α) και κυτοσίνη (C). Επομένως, το DNA θα μπορούσε να ονομαστεί τυπική συσκευή αποθήκευσης, όπως ακριβώς ένας υπολογιστής, εάν αυτές οι βάσεις μπορούν να αναπαρασταθούν ως 0 (βάσεις A και C) και 1s (βάσεις T και G). Το DNA είναι σκληρό και μακράς διαρκείας, η πιο απλή αντανάκλαση είναι ότι ο γενετικός μας κώδικας – το σχέδιο όλων των πληροφοριών μας που είναι αποθηκευμένες στο DNA – μεταδίδεται αποτελεσματικά από τη μια γενιά στην άλλη με επαναλαμβανόμενο τρόπο. Όλοι οι γίγαντες λογισμικού και υλικού επιθυμούν να χρησιμοποιούν συνθετικό DNA για την αποθήκευση τεράστιων ποσοτήτων για την επίτευξη του στόχου τους για επίλυση μακροπρόθεσμων αρχειοθέτησης δεδομένων. Η ιδέα είναι πρώτα να μετατραπούν οι κωδικοί υπολογιστή 0s και 1s στον κώδικα DNA (A, C, T, G), ο μετατρεπόμενος κώδικας DNA στη συνέχεια χρησιμοποιείται για την παραγωγή συνθετικών κλώνων DNA που μπορούν στη συνέχεια να αποθηκευτούν σε ψυχρή αποθήκευση. Όποτε απαιτείται, οι κλώνοι DNA μπορούν να αφαιρεθούν από την ψυχρή αποθήκευση και οι πληροφορίες τους να αποκωδικοποιηθούν χρησιμοποιώντας μηχανή προσδιορισμού αλληλουχίας DNA και αλληλουχία DNA μεταφράζονται τελικά σε δυαδική μορφή υπολογιστή 1 και 0 για ανάγνωση στον υπολογιστή.

Έχει φανεί1 ότι λίγα μόνο γραμμάρια DNA μπορούν να αποθηκεύσουν πεμπτοσεκατομμύρια byte δεδομένων και να τα διατηρήσουν ανέπαφα για έως και 2000 χρόνια. Ωστόσο, αυτή η απλή κατανόηση έχει αντιμετωπίσει ορισμένες προκλήσεις. Πρώτον, είναι αρκετά ακριβό και επίσης οδυνηρά αργό να γραφτούν δεδομένα στο DNA, δηλαδή η πραγματική μετατροπή των 0 και 1 στις βάσεις DNA (A, T, C, G). Δεύτερον, από τη στιγμή που τα δεδομένα «γραφούν» στο DNA, είναι δύσκολο να βρεθούν και να ανακτηθούν αρχεία και απαιτεί μια τεχνική που ονομάζεται αλληλουχία DNA - διαδικασία προσδιορισμού της ακριβούς σειράς των βάσεων μέσα σε ένα μόριο DNA - μετά την οποία τα δεδομένα αποκωδικοποιούνται πίσω στο 0 και 1.

Μια πρόσφατη μελέτη2 από επιστήμονες από τη Microsoft Research και το Πανεπιστήμιο της Ουάσιγκτον πέτυχαν μια «τυχαία πρόσβαση» στην αποθήκευση DNA. Η πτυχή της «τυχαίας πρόσβασης» είναι πολύ σημαντική γιατί σημαίνει ότι οι πληροφορίες μπορούν να μεταφερθούν προς ή από ένα μέρος (γενικά μια μνήμη) στο οποίο κάθε τοποθεσία, ανεξάρτητα από το σημείο της σειράς και μπορεί να προσπελαστεί απευθείας. Χρησιμοποιώντας αυτήν την τεχνική τυχαίας πρόσβασης, τα αρχεία μπορούν να ανακτηθούν από την αποθήκευση DNA με επιλεκτικό τρόπο σε σύγκριση με παλαιότερα, όταν μια τέτοια ανάκτηση απαιτούσε την ανάγκη αλληλουχίας και αποκωδικοποίησης ενός ολόκληρου δεδομένων DNA για να βρεθούν και να εξαχθούν τα λίγα αρχεία που ήθελε κανείς. Η σημασία της «τυχαίας πρόσβασης» αυξάνεται περαιτέρω όταν η ποσότητα των δεδομένων αυξάνεται και γίνεται τεράστια καθώς μειώνει τον όγκο της αλληλουχίας που πρέπει να γίνει. Είναι για πρώτη φορά που η τυχαία πρόσβαση εμφανίζεται σε τόσο μεγάλη κλίμακα. Οι ερευνητές έχουν επίσης αναπτύξει έναν αλγόριθμο για την αποκωδικοποίηση και την επαναφορά δεδομένων πιο αποτελεσματικά με μεγαλύτερη ανοχή σε σφάλματα δεδομένων, καθιστώντας τη διαδικασία αλληλουχίας επίσης ταχύτερη. Περισσότερα από 13 εκατομμύρια συνθετικά ολιγονουκλεοτίδια DNA κωδικοποιήθηκαν σε αυτή τη μελέτη, η οποία ήταν δεδομένα μεγέθους 200 MB που αποτελούνταν από 35 αρχεία (που περιέχουν βίντεο, ήχο, εικόνες και κείμενο) με μέγεθος από 29 KB έως 44 MB. Αυτά τα αρχεία ανακτήθηκαν μεμονωμένα χωρίς σφάλματα. Επίσης, οι συγγραφείς έχουν επινοήσει νέους αλγόριθμους που είναι πιο εύρωστοι και ανεκτικοί σε σφάλματα κατά τη γραφή και την ανάγνωση των αλληλουχιών DNA. Αυτή η μελέτη δημοσιεύτηκε στο Nature Biotechnology σε μια σημαντική πρόοδο που δείχνει ένα βιώσιμο, μεγάλης κλίμακας σύστημα αποθήκευσης και ανάκτησης DNA.

Το σύστημα αποθήκευσης DNA φαίνεται πολύ ελκυστικό επειδή έχει υψηλή πυκνότητα δεδομένων, υψηλή σταθερότητα και είναι εύκολο να αποθηκευτεί, αλλά προφανώς έχει πολλές προκλήσεις προτού μπορέσει να υιοθετηθεί παγκοσμίως. Λίγοι παράγοντες είναι η χρονοβόρα και έντασης εργασίας αποκωδικοποίηση του DNA (η αλληλουχία) και επίσης η σύνθεση του DNA. Η τεχνική απαιτεί μεγαλύτερη ακρίβεια και ευρύτερη κάλυψη. Παρόλο που έχουν γίνει πρόοδοι σε αυτόν τον τομέα, η ακριβής μορφή στην οποία θα αποθηκεύονται τα δεδομένα μακροπρόθεσμα, καθώς το DNA εξακολουθεί να εξελίσσεται. Η Microsoft έχει δεσμευτεί να βελτιώσει την παραγωγή συνθετικού DNA και να αντιμετωπίσει τις προκλήσεις για να σχεδιάσει ένα πλήρως λειτουργικό DNA σύστημα αποθήκευσης έως το 2020.

***

{Μπορείτε να διαβάσετε την αρχική ερευνητική εργασία κάνοντας κλικ στον σύνδεσμο DOI που δίνεται παρακάτω στη λίστα των αναφερόμενων πηγών}

Πηγές)

1. Erlich Y and Zielinski D 2017. Το DNA Fountain επιτρέπει μια στιβαρή και αποτελεσματική αρχιτεκτονική αποθήκευσης. Επιστήμη. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Τυχαία πρόσβαση σε αποθήκευση δεδομένων DNA μεγάλης κλίμακας. Βιοτεχνολογία Φύσης. 36. https://doi.org/10.1038/nbt.4079

Ομάδα SCIEU
Ομάδα SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Σημαντική πρόοδος στην επιστήμη. Επιπτώσεις στην ανθρωπότητα. Μυαλά που εμπνέουν.

Εγγραφείτε στο newsletter μας

Για ενημέρωση με όλες τις τελευταίες ειδήσεις, προσφορές και ειδικές ανακοινώσεις.

Τα πιο δημοφιλή άρθρα

Κουλτούρα Chinchorro: Η αρχαιότερη τεχνητή μουμιοποίηση της ανθρωπότητας

Η παλαιότερη απόδειξη τεχνητής μουμιοποίησης στον κόσμο έρχεται...

Νανορομπότ που μεταφέρουν τα ναρκωτικά απευθείας στα μάτια

Για πρώτη φορά έχουν σχεδιαστεί νανορομπότ που...

Υπερτροφική επίδραση της άσκησης αντοχής και οι πιθανοί μηχανισμοί

Η αντοχή ή η «αερόβια» άσκηση, θεωρείται γενικά ως καρδιαγγειακή...
- Διαφήμιση -
94,514ΑνεμιστήρεςΑρέσει
47,678οπαδούςΑκολουθώ
1,772οπαδούςΑκολουθώ
30ΣυνδρομητέςΕγγραφείτε