Η OpenAI έχει ενσωματώσει το GPT-4o, ένα νέο μοντέλο δημιουργίας εικόνων, απευθείας στο ChatGPT, αντικαθιστώντας την προηγούμενη ενσωμάτωση του DALL-E 3 και προσφέροντας βελτιωμένες δυνατότητες όπως πολυτροπική επεξεργασία και βελτιωμένη απόδοση κειμένου.
Όπως αναφέρει το TechCrunch, η αναβάθμιση επιτρέπει στο ChatGPT να δημιουργεί πιο λεπτομερείς και ακριβείς εικόνες, με το νέο σύστημα να είναι πλέον διαθέσιμο σε διάφορα επίπεδα χρηστών και με πρόσβαση API για προγραμματιστές που έρχεται σύντομα.
Η παροχή δυνατοτήτων δημιουργίας εικόνων του GPT-4o ξεκίνησε στις 25 Μαρτίου 2025, σηματοδοτώντας μια σημαντική αναβάθμιση στις δυνατότητες οπτικής δημιουργίας του ChatGPT. Αυτή η νέα λειτουργία είναι πλέον διαθέσιμη στους χρήστες των επιπέδων Plus, Pro, Team και Free, ενώ οι χρήστες των επιπέδων Enterprise και Education θα αποκτήσουν πρόσβαση σύντομα.
Οι δωρεάν χρήστες περιορίζονται στη δημιουργία έως και 3 εικόνων την ημέρα, ενώ οι συνδρομητές των επιπέδων Plus και ανώτερων μπορούν να δημιουργούν απεριόριστες εικόνες. Η ενσωμάτωση στοχεύει στο να παρέχει πιο συνεπή αποτελέσματα και λιγότερους περιορισμούς περιεχομένου σε σύγκριση με το προηγούμενο σύστημα DALL-E 3.
Οι προγραμματιστές μπορούν να αναμένουν πρόσβαση στο API για τη δημιουργία εικόνων του GPT-4o τις επόμενες εβδομάδες, επιτρέποντας ευρύτερη εφαρμογή σε διάφορες πλατφόρμες και εφαρμογές.
Το GPT-4o διαθέτει αρκετά προηγμένα χαρακτηριστικά που το ξεχωρίζουν από τον προκάτοχό του. Το μοντέλο μπορεί να διαχειριστεί έως και 20 διαφορετικά αντικείμενα ταυτόχρονα, διατηρώντας τις σωστές σχέσεις μεταξύ τους, καθιστώντας το ιδανικό για τη δημιουργία σύνθετων σκηνών. Η συμφραζόμενη επίγνωσή του του επιτρέπει να βασίζεται σε εικόνες και κείμενο στο πλαίσιο συνομιλίας, διασφαλίζοντας συνέπεια σε όλες τις επαναλήψεις. Επιπλέον, το GPT-4o διαπρέπει στη μάθηση εντός συμφραζομένων, επιτρέποντας στους χρήστες να ανεβάζουν εικόνες για ανάλυση από την AI και ενσωμάτωση λεπτομερειών σε νέες δημιουργίες. Λόγω της πολυπλοκότητας και της λεπτομέρειας των παραγόμενων εικόνων, η απόδοση μπορεί να διαρκέσει έως και ένα λεπτό, αλλά τα αποτελέσματα είναι συχνά πιο εντυπωσιακά οπτικά και πιο ευκρινή σε λεπτομέρεια σε σύγκριση με προηγούμενα μοντέλα.