OpenAI – GPT-4o: Έρχεται η μετεξέλιξη του GPT-4 με έμφαση στην ομιλία

Στην κυκλοφορία μιας νέας «ναυαρχίδας» μοντέλου τεχνητής νοημοσύνης με την ονομασία GPT-4o προχωρά το OpenAI, η οποία θα κυκλοφορήσει εκ νέου σε όλα τα προϊόντα της εταιρείας για προγραμματιστές και μη τις επόμενες εβδομάδες.

Σημειώνεται πως το «o» που προστίθεται στο λεκτικό GPT-4 σημαίνει «omni» («όλα»).

Όπως αναφέρθηκε από τον Muri Murati το GPT-4o παρέχει νοημοσύνη «επιπέδου GPT-4», ωστόσο βελτιώνει τις δυνατότητες του GPT-4 σε κείμενο, όραση καθώς και σε ήχο.

«Προχωράμε σε κάτι απίστευτα σημαντικό, διότι έτσι εξετάζουμε το μέλλον της αλληλεπίδρασης μεταξύ ημών και των μηχανών».

Σημειώνεται πως το GPT-4 Turbo -το προηγούμενο κορυφαίο μοντέλο του OpenAI, μια βελτιωμένη έκδοση του GPT-4- λειτουργούσε σε συνδυασμό εικόνων και κειμένου και μπορούσε να αναλύσει εικόνες και κείμενο για να ολοκληρώσει εργασίες όπως η εξαγωγή κειμένου από εικόνες ή ακόμη και η περιγραφή του περιεχομένου αυτών των εικόνων. Με το GPT-4o «στο παιχνίδι» μπαίνει και η ομιλία.

Το ChatGPT προσφέρει εδώ και καιρό μια φωνητική λειτουργία που μεταγράφει κείμενο από το ChatGPT χρησιμοποιώντας ένα μοντέλο μετατροπής κειμένου σε ομιλία. Αλλά το GPT-4o το ενισχύει αυτό, επιτρέποντας στους χρήστες να αλληλεπιδρούν με το ChatGPT περισσότερο, ουσιαστικά παρεμβαίνοντας.

Πλέον οι χρήστες μπορούν να κάνουν μια ερώτηση στο ChatGPT -κάτι που υποστηρίζεται από το GPT-4o- και να διακόπτουν το ChatGPT ενώ αυτό απαντά. Το μοντέλο θα ανταποκρίνεται «σε πραγματικό χρόνο», σύμφωνα με την OpenAI, και μπορεί ακόμη και να αντιληφθεί το συναίσθημα στη φωνή του χρήστη και να παράγει αντίστοιχα φωνή σε «μια σειρά διαφορετικών στυλ συναισθηματικών».

OpenAI – GPT-4o: Έρχεται η μετεξέλιξη του GPT-4 με έμφαση στην ομιλία

Τελευταία άρθρα

Το Άγιον Όρος του Τόμας Μοστσίτσκι σε έκθεση φωτογραφίας στην Αγιορειτική Εστίαx