Με το νέο εργαλείο τεχνητής νοημοσύνης (AI) της Meta, οι ερευνητές θα μπορούν να προβλέπουν καλύτερα τη δομή και τη λειτουργία των πρωτεϊνών. Αυτό θα μπορούσε να επιταχύνει την ανάπτυξη νέων φαρμάκων.
Οι πρωτεΐνες, τα δομικά στοιχεία της ζωής, έχουν ένα μοναδικό τρισδιάστατο σχήμα και ο προσδιορισμός του αποτελεί πρόκληση, οπότε η τεχνητή νοημοσύνη (AI) είναι το κλειδί. Το ESMFold – (Μεταγονιδιωματικός Άτλας), το σύστημα που ανέπτυξε η Meta, έχει ήδη καταφέρει να προβλέψει τη δομή περισσότερων από 740 εκατομμυρίων από αυτά τα μόρια.
Αυτός ο μεταγονιδιωματικός άτλαντας της Meta, ο οποίος κυκλοφόρησε τον Νοέμβριο του 2022 και τώρα επεκτείνεται, περιλαμβάνει πρωτεϊνικές δομές μικροοργανισμών, όπως βακτήρια και ιοί, που δεν έχουν ακόμη χαρακτηριστεί, ανοίγοντας την πόρτα για την επιτάχυνση νέων ανακαλύψεων σε τομείς όπως η ιατρική, η οικολογική βιοχημεία ή οι ανανεώσιμες πηγές ενέργειας.
Η τεχνητή νοημοσύνη που έχει αναπτύξει η Meta για τον σκοπό αυτό ονομάζεται ESMFold και βασίζεται σε γλωσσικά μοντέλα. Κανονικά, αυτά χρησιμοποιούνται για την πρόβλεψη κειμένου από ένα σύνολο λέξεων, αλλά, στην προκειμένη περίπτωση, χρησιμεύουν για την αυτόματη συμπλήρωση πρωτεϊνικών αλληλουχιών και την αποκάλυψη της τρισδιάστατης δομής εκατομμυρίων πρωτεϊνών, συμπεριλαμβανομένων πολλών άγνωστων.
Η Meta δημοσίευσε τα πρώτα δεδομένα από αυτόν τον άτλαντα με τις προβλεπόμενες δομές περισσότερων από 617 εκατομμυρίων πρωτεϊνών τον περασμένο Νοέμβριο και τα δημοσίευσε στην πλατφόρμα bioRxiv, αλλά περίμενε ακόμη την αξιολόγηση από ομοτίμους – τον έλεγχο άλλων επιστημόνων και τη δημοσίευση σε κάποιο περιοδικό.
«Προβλέψεις υψηλής αξιοπιστίας»
Αυτή την Πέμπτη (16.03.2023) δημοσιεύθηκαν τα δεδομένα αυτά σε άρθρο στο Science, το οποίο περιγράφει ότι από το συνολικό αριθμό των πρωτεϊνών που περιλαμβάνονται, 225 εκατομμύρια θεωρούνται «προβλέψεις υψηλής αξιοπιστίας». Ο άτλας έχει πλέον επεκταθεί σε περισσότερες από 740 εκατομμύρια πρωτεΐνες, δήλωσαν πηγές της Meta στην EFE. Αυτές οι πρόσθετες προβλέψεις ολοκληρώθηκαν από το ESMFold σε μόλις έξι ημέρες.
Ακριβώς όπως τα μεγάλα γλωσσολογικά μοντέλα μπορούν να μάθουν μοτίβα στις γλώσσες χωρίς ρητή επίβλεψη, οι συγγραφείς της μελέτης αποδεικνύουν ότι μπορούν επίσης να μάθουν εξελικτικά μοτίβα που διέπουν τις πρωτεϊνικές αλληλουχίες, συνοψίζει το περιοδικό. Σύμφωνα με τους ερευνητές, το ESMFold μπορεί να κάνει ακριβείς προβλέψεις πρωτεϊνικής δομής 60 φορές ταχύτερα από άλλες προσεγγίσεις.
Οι πρωτεΐνες, πολύπλοκα και δυναμικά μόρια που κωδικοποιούνται από τα γονίδιά μας, είναι υπεύθυνες για πολλές από τις ποικίλες και θεμελιώδεις διαδικασίες της ζωής. Αποτελούνται από αλυσίδες εκατοντάδων αμινοξέων και η αλληλουχία αυτών των αμινοξέων καθορίζει τη μοναδική τρισδιάστατη δομή του καθενός από αυτά.
Χρήσιμα για την ιατρική
Αυτή η δομή είναι που τα οδηγεί στο να ταιριάζουν μεταξύ τους και καθορίζει τι κάνουν και πώς το κάνουν. Η γνώση της σημαίνει, εν ολίγοις, κατανόηση της λειτουργίας του κυττάρου και του ανθρώπινου οργανισμού.
Ο πειραματικός προσδιορισμός των τρισδιάστατων δομών εκατοντάδων εκατομμυρίων πρωτεϊνών υπερβαίνει κατά πολύ το πεδίο εφαρμογής χρονοβόρων εργαστηριακών τεχνικών, όπως η κρυσταλλογραφία ακτίνων Χ. Οι υπολογιστικές προσεγγίσεις μπορούν να δώσουν πληροφορίες για τις πρωτεΐνες που δεν είναι δυνατές με τις πειραματικές τεχνικές.
Το «ESM – Μεταγονιδιωματικός Άτλας» με ανοικτά δεδομένα, θα επιτρέψει στους επιστήμονες να αναζητήσουν και να αναλύσουν πρωτεϊνικές δομές σε κλίμακα εκατοντάδων εκατομμυρίων πρωτεϊνών, γεγονός που μπορεί να βοηθήσει στον εντοπισμό δομών που δεν έχουν χαρακτηριστεί στο παρελθόν και να ανακαλύψουν νέες πρωτεΐνες που μπορεί να είναι χρήσιμες στην ιατρική και σε άλλες εφαρμογές, συνοψίζει το 2022 Meta.
Πηγή: DW