Ναι, όσο περίεργο και αν ακούγεται αρχικά, μιας και το ChatGPT δεν είναι κάποιο βιντεοπαιχνίδι, η λειτουργία του βασίζεται εν μέρει σε κάρτες γραφικών και μάλιστα σε…πολλές!
Περνώντας σε λεπτομέρειες, τα τελευταία χρόνια στον χώρο της πληροφορικής έχουμε δει τις GPUs να χρησιμοποιούνται για την επιτάχυνση ολοένα και περισσότερων διεργασιών, μιας και μπορούν να αποδώσουν εξαιρετικά σε εφαρμογές που μπορούν να παραλληλοποιηθούν, όπως τα φόρτα εργασίας τεχνητής νοημοσύνης. Κάπως έτσι, η Nvidia αναμένεται να επωφεληθεί αρκετά από το trend, όπως επισημαίνει η Trendforce.
Συγκεκριμένα, η ερευνητική εταιρία έκανε τους υπολογισμούς και εκτιμά ότι το πιο πρόσφατο μοντέλο του ChatGPT χρειάστηκε τουλάχιστον 20,000 κάρτες γραφικών και μάλιστα όχι απλά μοντέλα για το ευρύ καταναλωτικό κοινό, αλλά ειδικές GPUs με απόδοση 5 petaFLOPS. Μάλιστα, υπάρχουν πολλές πιθανότητες πως ο τεράστιος αυτός αριθμός καρτών μπορεί να αυξηθεί σημαντικά μελλοντικά, καθώς η υπηρεσία της OpenAI γίνεται ολοένα και δημοφιλέστερη, ξεπερνώντας τις 30.000.
Αναλυτικότερα, η Trendforce επισημαίνει:
Στην περίπτωση του Generative Pre-Trained Transformer (GPT) που αποτελεί τη βάση του ChatGPT, ο αριθμός των παραμέτρων εκπαίδευσης που χρησιμοποιήθηκαν για την ανάπτυξη αυτού του μοντέλου αυξήθηκε από περίπου 120 εκατομμύρια το 2018 σε σχεδόν 180 δισεκατομμύρια το 2020. Σύμφωνα με την εκτίμηση της TrendForce, ο αριθμός των GPU που χρειαζόταν το μοντέλο GPT για την επεξεργασία των δεδομένων εκπαίδευσης το 2020 ανήλθε σε περίπου 20.000. Προχωρώντας προς τα εμπρός, ο αριθμός των GPUs που θα χρειαστούν για την εμπορική διάθεση του μοντέλου GPT (ή ChatGPT) προβλέπεται ότι θα ξεπεράσει τις 30.000.
Σημειώστε ότι αυτές οι εκτιμήσεις χρησιμοποιούν την A100 της NVIDIA ως τη βάση για τους υπολογισμούς. Ως εκ τούτου, με τη generative ΑΙ να αποτελεί trend, η ζήτηση αναμένεται να αυξηθεί σημαντικά για τις GPU και να ωφελήσει έτσι τους συμμετέχοντες στη σχετική αλυσίδα εφοδιασμού. Η NVIDIA, για παράδειγμα, θα επωφεληθεί πιθανώς περισσότερο από την ανάπτυξη της generative AI. Η DGX A100 της, η οποία είναι ένα καθολικό σύστημα για φόρτο εργασίας που σχετίζεται με την τεχνητή νοημοσύνη, αποδίδει 5 petaFLOPS και έχει γίνει σχεδόν η κορυφαία επιλογή για την ανάλυση big data και την επιτάχυνση της τεχνητής νοημοσύνης.