ΔΙΑΦΗΜΙΣΗ

Το DNA ως μέσο αποθήκευσης τεράστιων δεδομένων υπολογιστή: μια πραγματικότητα πολύ σύντομα;

Μια πρωτοποριακή μελέτη κάνει ένα σημαντικό βήμα προς τα εμπρός στην προσπάθεια ανάπτυξης α DNA-Βασισμένο σύστημα αποθήκευσης ψηφιακών δεδομένων.

Ψηφιακό ημερομηνία αυξάνεται με εκθετικό ρυθμό σήμερα λόγω της εξάρτησής μας από gadget και απαιτεί ισχυρή μακροπρόθεσμη αποθήκευση. Η αποθήκευση δεδομένων γίνεται σιγά σιγά πρόκληση επειδή η τρέχουσα ψηφιακή τεχνολογία δεν είναι σε θέση να δώσει λύση. Ένα παράδειγμα είναι ότι τα τελευταία δύο χρόνια δημιουργήθηκαν περισσότερα ψηφιακά δεδομένα από ό,τι σε όλη την ιστορία υπολογιστές, στην πραγματικότητα 2.5 κουιντσεμμύριο byte {1 quintillion byte = 2,500,000 Terabyte (TB) = 2,500,000,000 Gigabyte (GB)} δεδομένων δημιουργούνται καθημερινά στον κόσμο. Αυτό περιλαμβάνει δεδομένα σε ιστότοπους κοινωνικής δικτύωσης, διαδικτυακές τραπεζικές συναλλαγές, αρχεία εταιρειών και οργανισμών, δεδομένα από δορυφόρους, επιτήρηση, έρευνα, ανάπτυξη κ.λπ. Αυτά τα δεδομένα είναι τεράστια και αδόμητα. Ως εκ τούτου, είναι τώρα μια μεγάλη πρόκληση να αντιμετωπίσουμε τις τεράστιες απαιτήσεις αποθήκευσης δεδομένων και την εκθετική τους ανάπτυξη, ειδικά για οργανισμούς και εταιρείες που απαιτούν ισχυρή μακροπρόθεσμη αποθήκευση.

Οι διαθέσιμες επιλογές αυτή τη στιγμή είναι ο σκληρός δίσκος, οι οπτικοί δίσκοι (CD), τα memory stick, οι μονάδες flash και οι πιο προηγμένες μονάδες tapes ή οι οπτικοί δίσκοι BluRay που αποθηκεύουν περίπου έως και 10 Terabyte (TB) δεδομένων. Τέτοιες συσκευές αποθήκευσης αν και χρησιμοποιούνται συνήθως έχουν πολλά μειονεκτήματα. Πρώτον, έχουν χαμηλή έως μέτρια διάρκεια ζωής και πρέπει να φυλάσσονται σε ιδανικές συνθήκες θερμοκρασίας και υγρασίας για να μπορούν να διαρκέσουν πολλές δεκαετίες και επομένως απαιτούν ειδικά σχεδιασμένους φυσικούς χώρους αποθήκευσης. Σχεδόν όλα αυτά καταναλώνουν πολλή ενέργεια, είναι ογκώδη και μη πρακτικά και μπορούν να καταστραφούν με μια απλή πτώση. Μερικά από αυτά είναι πολύ ακριβά, συχνά μαστίζονται με σφάλματα δεδομένων και επομένως δεν είναι αρκετά ανθεκτικά. Μια επιλογή που έχει γίνει παγκοσμίως αποδεκτή από τον οργανισμό ονομάζεται cloud computing – μια ρύθμιση στην οποία μια εταιρεία προσλαμβάνει ουσιαστικά έναν «εξωτερικό» διακομιστή για να χειρίζεται όλες τις απαιτήσεις πληροφορικής και αποθήκευσης δεδομένων, που αναφέρεται ως «σύννεφο». Ένα από τα κύρια μειονεκτήματα του cloud computing είναι τα ζητήματα ασφάλειας και απορρήτου και η ευπάθεια σε επιθέσεις από χάκερ. Υπάρχουν επίσης άλλα ζητήματα, όπως το υψηλό κόστος, ο περιορισμένος έλεγχος από τον γονικό οργανισμό και η εξάρτηση από την πλατφόρμα. Το cloud computing εξακολουθεί να θεωρείται μια καλή εναλλακτική για μακροπρόθεσμη αποθήκευση. Ωστόσο, φαίνεται ότι οι ψηφιακές πληροφορίες που παράγονται παγκοσμίως σίγουρα ξεπερνούν την ικανότητά μας να τις αποθηκεύουμε και απαιτούνται ακόμη πιο ισχυρές λύσεις για την αντιμετώπιση αυτού του κατακλυσμού δεδομένων, παρέχοντας παράλληλα δυνατότητα κλιμάκωσης ώστε να λαμβάνονται υπόψη και οι μελλοντικές ανάγκες αποθήκευσης.

Μπορεί το DNA να βοηθήσει στην αποθήκευση του υπολογιστή;

Τα DNA (Δεοξυριβονουκλεϊκό οξύ) θεωρείται ως ένα συναρπαστικό εναλλακτικό μέσο για την αποθήκευση ψηφιακών δεδομένων. DNA είναι το αυτοαναπαραγόμενο υλικό που υπάρχει σε όλους σχεδόν τους ζωντανούς οργανισμούς και είναι αυτό που αποτελεί τη γενετική μας πληροφορία. Ένα τεχνητό ή συνθετικό DNA είναι ένα ανθεκτικό υλικό που μπορεί να κατασκευαστεί χρησιμοποιώντας εμπορικά διαθέσιμα μηχανήματα σύνθεσης ολιγονουκλεοτιδίων. Το κύριο όφελος του DNA είναι η μακροζωία του ως α DNA διαρκεί 1000 φορές περισσότερο από το πυρίτιο (τσιπ πυριτίου – το υλικό που χρησιμοποιείται για την κατασκευή υπολογιστές). Παραδόξως, μόνο ένα κυβικό χιλιοστό DNA μπορεί να χωρέσει ένα εκατομμύριο byte δεδομένων! DNA είναι επίσης ένα εξαιρετικά συμπαγές υλικό που δεν αλλοιώνεται ποτέ και μπορεί να αποθηκευτεί σε δροσερό, ξηρό μέρος για εκατοντάδες αιώνες. Η ιδέα της χρήσης του DNA για αποθήκευση υπήρχε εδώ και πολύ καιρό από το 1994. Ο κύριος λόγος είναι ο παρόμοιος τρόπος με τον οποίο αποθηκεύονται πληροφορίες σε έναν υπολογιστή και στο DNA – αφού και τα δύο αποθηκεύουν τα σχεδιαγράμματα των πληροφοριών. Ένας υπολογιστής αποθηκεύει όλα τα δεδομένα ως 0 και 1 και το DNA αποθηκεύει όλα τα δεδομένα ενός ζωντανού οργανισμού χρησιμοποιώντας τις τέσσερις βάσεις - θυμίνη (Τ), γουανίνη (G), αδενίνη (Α) και κυτοσίνη (C). Επομένως, το DNA θα μπορούσε να ονομαστεί τυπική συσκευή αποθήκευσης, όπως ακριβώς ένας υπολογιστής, εάν αυτές οι βάσεις μπορούν να αναπαρασταθούν ως 0 (βάσεις A και C) και 1s (βάσεις T και G). Το DNA είναι σκληρό και μακράς διαρκείας, η πιο απλή αντανάκλαση είναι ότι ο γενετικός μας κώδικας - το σχέδιο όλων των πληροφοριών μας που είναι αποθηκευμένες στο DNA - μεταδίδεται αποτελεσματικά από τη μια γενιά στην άλλη με επαναλαμβανόμενο τρόπο. Όλοι οι γίγαντες λογισμικού και υλικού επιθυμούν να χρησιμοποιούν συνθετικό DNA για την αποθήκευση τεράστιων ποσοτήτων για να επιτύχουν τον στόχο τους για επίλυση μακροπρόθεσμων αρχειοθέτησης δεδομένων. Η ιδέα είναι πρώτα να μετατραπούν οι κωδικοί υπολογιστή 0s και 1s στον κώδικα DNA (A, C, T, G), ο μετατρεπόμενος κώδικας DNA χρησιμοποιείται στη συνέχεια για την παραγωγή συνθετικών κλώνων DNA που μπορούν στη συνέχεια να τεθούν σε ψυχρή αποθήκευση. Όποτε απαιτείται, οι κλώνοι DNA μπορούν να αφαιρεθούν από την ψυχρή αποθήκευση και οι πληροφορίες τους να αποκωδικοποιηθούν χρησιμοποιώντας μηχανή προσδιορισμού αλληλουχίας DNA και αλληλουχία DNA μεταφράζονται τελικά σε δυαδική μορφή υπολογιστή 1 και 0 για ανάγνωση στον υπολογιστή.

Έχει φανεί1 ότι λίγα μόνο γραμμάρια DNA μπορούν να αποθηκεύσουν πεμπτοκαμμύρια byte δεδομένων και να τα διατηρήσουν ανέπαφα για έως και 2000 χρόνια. Ωστόσο, αυτή η απλή κατανόηση έχει αντιμετωπίσει ορισμένες προκλήσεις. Πρώτον, είναι αρκετά ακριβό και επίσης οδυνηρά αργό να γραφτούν δεδομένα στο DNA, δηλαδή η πραγματική μετατροπή των 0 και 1 στις βάσεις DNA (A, T, C, G). Δεύτερον, από τη στιγμή που τα δεδομένα «γραφούν» στο DNA, είναι δύσκολο να βρεθούν και να ανακτηθούν αρχεία και απαιτείται μια τεχνική που ονομάζεται DNA αλληλουχία – διαδικασία προσδιορισμού της ακριβούς σειράς των βάσεων εντός α DNA μόριο -μετά από το οποίο τα δεδομένα αποκωδικοποιούνται πίσω σε 0 και 1.

Μια πρόσφατη μελέτη2 από επιστήμονες από τη Microsoft Research και το Πανεπιστήμιο της Ουάσιγκτον πέτυχαν μια «τυχαία πρόσβαση» στην αποθήκευση DNA. Η πτυχή της «τυχαίας πρόσβασης» είναι πολύ σημαντική γιατί σημαίνει ότι οι πληροφορίες μπορούν να μεταφερθούν προς ή από ένα μέρος (γενικά μια μνήμη) στο οποίο κάθε τοποθεσία, ανεξάρτητα από το σημείο της σειράς και μπορεί να προσπελαστεί απευθείας. Χρησιμοποιώντας αυτήν την τεχνική τυχαίας πρόσβασης, τα αρχεία μπορούν να ανακτηθούν από την αποθήκευση DNA με επιλεκτικό τρόπο σε σύγκριση με παλαιότερα, όταν μια τέτοια ανάκτηση απαιτούσε την ανάγκη αλληλουχίας και αποκωδικοποίησης ενός ολόκληρου δεδομένων DNA για να βρεθούν και να εξαχθούν τα λίγα αρχεία που ήθελε κανείς. Η σημασία της «τυχαίας πρόσβασης» αυξάνεται περαιτέρω όταν η ποσότητα των δεδομένων αυξάνεται και γίνεται τεράστια καθώς μειώνει τον όγκο της αλληλουχίας που πρέπει να γίνει. Είναι για πρώτη φορά που η τυχαία πρόσβαση εμφανίζεται σε τόσο μεγάλη κλίμακα. Οι ερευνητές έχουν επίσης αναπτύξει έναν αλγόριθμο για την αποκωδικοποίηση και την επαναφορά δεδομένων πιο αποτελεσματικά με μεγαλύτερη ανοχή σε σφάλματα δεδομένων, καθιστώντας τη διαδικασία αλληλουχίας επίσης ταχύτερη. Περισσότερα από 13 εκατομμύρια συνθετικά ολιγονουκλεοτίδια DNA κωδικοποιήθηκαν σε αυτή τη μελέτη, η οποία ήταν δεδομένα μεγέθους 200 MB που αποτελούνταν από 35 αρχεία (που περιέχουν βίντεο, ήχο, εικόνες και κείμενο) με μέγεθος από 29 KB έως 44 MB. Αυτά τα αρχεία ανακτήθηκαν μεμονωμένα χωρίς σφάλματα. Επίσης, οι συγγραφείς έχουν επινοήσει νέους αλγόριθμους που είναι πιο εύρωστοι και ανεκτικοί σε σφάλματα κατά τη γραφή και την ανάγνωση των αλληλουχιών DNA. Αυτή η μελέτη δημοσιεύτηκε στο Nature Biotechnology σε μια σημαντική πρόοδο που δείχνει ένα βιώσιμο, μεγάλης κλίμακας σύστημα αποθήκευσης και ανάκτησης DNA.

Το σύστημα αποθήκευσης DNA φαίνεται πολύ ελκυστικό επειδή έχει υψηλή πυκνότητα δεδομένων, υψηλή σταθερότητα και είναι εύκολο να αποθηκευτεί, αλλά προφανώς έχει πολλές προκλήσεις προτού μπορέσει να υιοθετηθεί παγκοσμίως. Λίγοι παράγοντες είναι η χρονοβόρα και έντασης εργασίας αποκωδικοποίηση του DNA (η αλληλουχία) και επίσης η σύνθεση DNA. Η τεχνική απαιτεί μεγαλύτερη ακρίβεια και ευρύτερη κάλυψη. Παρόλο που έχει γίνει πρόοδος σε αυτόν τον τομέα η ακριβής μορφή στην οποία θα αποθηκεύονται τα δεδομένα μακροπρόθεσμα ως DNA εξακολουθεί να εξελίσσεται. Η Microsoft έχει δεσμευτεί να βελτιώσει την παραγωγή συνθετικού DNA και να αντιμετωπίσει τις προκλήσεις για να σχεδιάσει ένα πλήρως λειτουργικό DNA σύστημα αποθήκευσης έως το 2020.

***

{Μπορείτε να διαβάσετε την αρχική ερευνητική εργασία κάνοντας κλικ στον σύνδεσμο DOI που δίνεται παρακάτω στη λίστα των αναφερόμενων πηγών}

Πηγές)

1. Erlich Y and Zielinski D 2017. Το DNA Fountain επιτρέπει μια στιβαρή και αποτελεσματική αρχιτεκτονική αποθήκευσης. Επιστήμη. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Τυχαία πρόσβαση σε αποθήκευση δεδομένων DNA μεγάλης κλίμακας. Βιοτεχνολογία Φύσης. 36. https://doi.org/10.1038/nbt.4079

Ομάδα SCIEU
Ομάδα SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Σημαντική πρόοδος στην επιστήμη. Επιπτώσεις στην ανθρωπότητα. Μυαλά που εμπνέουν.

Εγγραφείτε στο newsletter μας

Για ενημέρωση με όλες τις τελευταίες ειδήσεις, προσφορές και ειδικές ανακοινώσεις.

Τα πιο δημοφιλή άρθρα

Νόσος Πάρκινσον: Θεραπεία με ένεση amNA-ASO στον εγκέφαλο

Πειράματα σε ποντίκια έδειξαν ότι η έγχυση αμινο-γεφυρωμένου νουκλεϊκού οξέος τροποποιημένου...

Δεύτερο εμβόλιο ελονοσίας R21/Matrix-M που συνιστάται από τον ΠΟΥ

Ένα νέο εμβόλιο, το R21/Matrix-M έχει προταθεί από την...

COVID-19 και η φυσική επιλογή του Δαρβίνου μεταξύ των ανθρώπων

Με την εμφάνιση του COVID-19, φαίνεται να υπάρχει...
- Διαφήμιση -
94,436ΑνεμιστήρεςΑρέσει
47,672οπαδούςΑκολουθώ
1,772οπαδούςΑκολουθώ
30ΣυνδρομητέςΕγγραφείτε