Στην κυκλοφορία μιας νέας «ναυαρχίδας» μοντέλου τεχνητής νοημοσύνης με την ονομασία GPT-4o προχωρά το OpenAI, η οποία θα κυκλοφορήσει εκ νέου σε όλα τα προϊόντα της εταιρείας για προγραμματιστές και μη τις επόμενες εβδομάδες.
Σημειώνεται πως το «o» που προστίθεται στο λεκτικό GPT-4 σημαίνει «omni» («όλα»).
Όπως αναφέρθηκε από τον Muri Murati το GPT-4o παρέχει νοημοσύνη «επιπέδου GPT-4», ωστόσο βελτιώνει τις δυνατότητες του GPT-4 σε κείμενο, όραση καθώς και σε ήχο.
«Προχωράμε σε κάτι απίστευτα σημαντικό, διότι έτσι εξετάζουμε το μέλλον της αλληλεπίδρασης μεταξύ ημών και των μηχανών».
Σημειώνεται πως το GPT-4 Turbo -το προηγούμενο κορυφαίο μοντέλο του OpenAI, μια βελτιωμένη έκδοση του GPT-4- λειτουργούσε σε συνδυασμό εικόνων και κειμένου και μπορούσε να αναλύσει εικόνες και κείμενο για να ολοκληρώσει εργασίες όπως η εξαγωγή κειμένου από εικόνες ή ακόμη και η περιγραφή του περιεχομένου αυτών των εικόνων. Με το GPT-4o «στο παιχνίδι» μπαίνει και η ομιλία.
Το ChatGPT προσφέρει εδώ και καιρό μια φωνητική λειτουργία που μεταγράφει κείμενο από το ChatGPT χρησιμοποιώντας ένα μοντέλο μετατροπής κειμένου σε ομιλία. Αλλά το GPT-4o το ενισχύει αυτό, επιτρέποντας στους χρήστες να αλληλεπιδρούν με το ChatGPT περισσότερο, ουσιαστικά παρεμβαίνοντας.
Πλέον οι χρήστες μπορούν να κάνουν μια ερώτηση στο ChatGPT -κάτι που υποστηρίζεται από το GPT-4o- και να διακόπτουν το ChatGPT ενώ αυτό απαντά. Το μοντέλο θα ανταποκρίνεται «σε πραγματικό χρόνο», σύμφωνα με την OpenAI, και μπορεί ακόμη και να αντιληφθεί το συναίσθημα στη φωνή του χρήστη και να παράγει αντίστοιχα φωνή σε «μια σειρά διαφορετικών στυλ συναισθηματικών».
- Μερικές “αφελείς” ερωτήσεις για το μέλλον της (ποιάς;) Ευρώπης μετά τον θρίαμβο Τραμπ
- Μισθοί: Τρίτη από το τέλος η Ελλάδα
- Πρόεδρος της FED: «Δεν πάω πουθενά, εδώ θα μείνω»
- Συνάντηση Γεραπετρίτη – Φιντάν σήμερα στην Αθήνα
- Ξεκινάει σήμερα το έκτακτο Συνέδριο του ΣΥΡΙΖΑ-ΠΣ εν μέσω σκληρών αντιπαραθέσεων