Μια πειραματική συνεργασία ανθρώπων και τεχνητής νοημοσύνης
Το iMEdD, σε συνεργασία με το Datalab του Τμήματος Πληροφορικής στο ΑΠΘ και τον υποψήφιο διδάκτορα πολιτικής επιστήμης Αντώνη Γαλανόπουλο, εγκαινιάζει ένα πειραματικό έργο για την ανάλυση των προεκλογικών ομιλιών που εκφωνούνται από τους έξι αρχηγούς των ελληνικών κομμάτων που βρίσκονταν στη Βουλή κατά την τελευταία κοινοβουλευτική περίοδο. Η πρωτοβουλία αυτή συνδυάζει την ανθρώπινη γνώση με το ChatGPT της OpenΑΙ, ένα πρωτοποριακό μοντέλο τεχνητής νοημοσύνης (ΤΝ), προκειμένου να διεξάγει αλγοριθμικές αναλύσεις που εστιάζουν στα θέματα τα οποία θίγονται στις προεκλογικές ομιλίες, στο συναίσθημα που μεταφέρουν αλλά και στη ρητορική πόλωσης και λαϊκισμού. Ο στόχος είναι η διεξαγωγή μιας ολοκληρωμένης ανάλυσης του πολιτικού λόγου και η αξιολόγηση της ικανότητας επεξεργασίας του από μεγάλα γλωσσικά μοντέλα.
ΔΙΑΒΑΣΤΕ ΕΔΩ ΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΚΑΙ ΤΑ ΣΥΜΠΕΡΑΣΜΑΤΑ ΤΗΣ ΕΡΕΥΝΑΣ
Μια ομάδα 16 ειδικών συγκεντρώνει όλες τις διαθέσιμες προεκλογικές ομιλίες του Κυριάκου Μητσοτάκη, του Αλέξη Τσίπρα, του Νίκου Ανδρουλάκη, του Δημήτρη Κουτσούμπα, του Κυριάκου Βελόπουλου και του Γιάνη Βαρουφάκη. Κάθε ομιλία υποβάλλεται σε αλγοριθμική ανάλυση, η οποία εντοπίζει τις διάφορες θεματικές, αξιολογεί το συναίσθημα που διαπνέει την κάθε ομιλία και εκτιμά τα επίπεδα πόλωσης και λαϊκισμού.
Με τις εκλογές στην Ελλάδα να βρίσκονται προ των πυλών, ο πολιτικός λόγος παίρνει πρωταγωνιστικό ρόλο, διαμορφώνοντας την κοινή γνώμη και επηρεάζοντας το μέλλον της χώρας. Στον δημόσιο διάλογο, η σημασία της πολιτικής έκφρασης είναι αδιαμφισβήτητη. Η ανάλυση η οποία πραγματοποιείται στο πλαίσιο του παρόντος έργου φιλοδοξεί να ρίξει φως στην τρέχουσα μορφή που παίρνει ο πολιτικός λόγος στην Ελλάδα, αλλά και να πυροδοτήσει συζητήσεις σχετικά με τη βελτίωσή του.
Το φαινόμενο του λαϊκισμού και της πόλωσης
Επιλέξαμε να μην επικεντρωθούμε στην πόλωση ως φαινόμενο, αλλά να εξετάσουμε αντ’ αυτού τη γλώσσα της πόλωσης, ώστε να προσδιορίσουμε κατά πόσο ο πολιτικός λόγος παρουσιάζει μοτίβα που ενισχύουν την αντίληψη ότι επικρατούν συνθήκες πόλωσης ή που καλλιεργούν συνθήκες πόλωσης στο κοινωνικοπολιτικό τοπίο.
Στην περίπτωση του λαϊκισμού, επιλέξαμε μια δημοφιλή προσέγγιση της πολιτικής θεωρίας η οποία επικεντρώνεται στην παρουσίαση των ιδεών και όχι στο περιεχόμενό τους. Η μέθοδος αυτή δεν αποδίδει θετικό ή αρνητικό πρόσημο στον λαϊκισμό ως επικοινωνιακό ύφος με επίκεντρο τον «λαό». Για να εντοπίσουμε τη χρήση λαϊκιστικών στοιχείων στη γλώσσα, έπρεπε προηγουμένως να προχωρήσουμε σε μια σαφή διάκριση μεταξύ του «λαού» και των «ελίτ» ή των προνομιούχων τάξεων. Η μέθοδος αυτή μας επέτρεψε να εντοπίσουμε και να αναλύσουμε αντικειμενικά και δίκαια τον λαϊκιστικό λόγο.
Το μοντέλο ChatGPT της OpenAI έχει φέρει επανάσταση στην ανάλυση συναισθήματος κειμένου: όσο εκπαιδεύεται, ο αλγόριθμος «μαθαίνει» τα γλωσσικά μοτίβα και τους συσχετισμούς που αναπτύσσονται σε δισεκατομμύρια κείμενα. Το πρόγραμμα εντοπίζει λέξεις και εκφράσεις που μεταφέρουν —θετικά, αρνητικά ή ουδέτερα— συναισθήματα. Το ChatGPT μπορεί να προσδιορίσει την πρόθεση του ομιλητή, αναλύοντας το συνολικό ύφος ενός κειμένου. Αυτή τη δυνατότητα χρησιμοποιούμε, στο πλαίσιο της παρούσας ανάλυσης πολιτικών ομιλιών.
Ανάλυση θεμάτων
Η αναγνώριση των κεντρικών θεμάτων των ομιλιών διαδραματίζει κρίσιμο ρόλο στο παρόν έργο, καθώς συμβάλλει σε μια πιο ολοκληρωμένη κατανόηση των βασικών ζητημάτων που κυριάρχησαν στον πολιτικό λόγο προεκλογικά. Μέσω του συστηματικού εντοπισμού και της κατηγοριοποίησης των πρωταρχικών θεμάτων που συζητούνται από τους πολιτικούς ηγέτες, αξιολογούνται με ακρίβεια οι προτεραιότητες των τελευταίων, οι πολιτικές προτάσεις τους και το συνολικό μήνυμα της εκστρατείας τους, παρέχοντας στους ψηφοφόρους πλήρη εικόνα του πολιτικού τοπίου.
Το μοντέλο τεχνητής νοημοσύνης αναγνωρίζει επαναλαμβανόμενα θέματα και λέξεις-κλειδιά στις πολιτικές ομιλίες και τα ομαδοποιεί αναλόγως. Η πρώτη ανάλυση εξετάζει εάν κάθε παράγραφο της ομιλίας αποτελεί προγραμματική θέση του κόμματος ή κριτική προς τους αντιπάλους. Στη συνέχεια, αναλύοντας τη συχνότητα εμφάνισης και τη συνύπαρξη των λέξεων-κλειδιών και φράσεων, μπορούμε να προσδιορίσουμε τα κυρίαρχα θέματα της συζήτησης. Η μέθοδος αυτή μας επιτρέπει να εντοπίσουμε και να ταξινομήσουμε τα θέματα που υπάρχουν στις πολιτικές ομιλίες με συστηματικό τρόπο.
Περιορισμοί
Η χρήση της τεχνητής νοημοσύνης στην ανάλυση του δημόσιου λόγου έχει τα πλεονεκτήματα και τα μειονεκτήματά της. Από τη μία πλευρά, τα μοντέλα τεχνητής όπως το ChatGPT μπορούν να επεξεργαστούν με ταχύτητα τεράστιες ποσότητες δεδομένων, επιτρέποντας ολοκληρωμένες αναλύσεις μοτίβων ομιλίας, καθώς και ανίχνευση θεμάτων, συναισθήματος και άλλων γλωσσικών χαρακτηριστικών. Η ανάλυση αυτή μας επιτρέπει να εντοπίσουμε τάσεις και ζητήματα που συχνά παραβλέπονται στις συμβατικές αναλύσεις. Από την άλλη πλευρά, τα μοντέλα τεχνητής νοημοσύνης ενδέχεται να διαιωνίζουν προϋπάρχουσες προκαταλήψεις που αναπαράγονται στα δεδομένα πάνω στα οποία εκπαιδεύτηκαν, οδηγώντας σε εσφαλμένα αποτελέσματα και ενισχύοντας αυτές τις προκαταλήψεις.
Προκειμένου να γίνει κατανοητός ο τρόπος λειτουργίας του ChatGPT, ας χρησιμοποιήσουμε ένα απλό παράδειγμα: φανταστείτε έναν μαθητή ή μια μαθήτρια λυκείου στην οποία έχει ανατεθεί να αναλύσει πολιτικές ομιλίες. Αρχικά, συλλέγει δεδομένα διαβάζοντας εφημερίδες και παρακολουθώντας τις πολιτικές συζητήσεις. Στη συνέχεια, θα εφαρμόσει τις γνώσεις που έχει αποκτήσει για τους σκοπούς της ανάλυσης νέων ομιλιών και εξαγωγής σχετικών συμπερασμάτων. Με τον ίδιο τρόπο, το ChatGPT έχει εκπαιδευτεί πάνω σε τεράστιες ποσότητες δεδομένων κειμένου και έχει μάθει μοτίβα και συσχετισμούς λέξεων. Είναι σε θέση να παράγει εμπεριστατωμένες αναλύσεις πάνω σε ένα νέο κείμενο με βάση τις γνώσεις που έχει ήδη αποκομίσει.
Παρ’ όλα αυτά, υπάρχουν περιορισμοί σε αυτά τα συστήματα τεχνητής νοημοσύνης. Καθώς μαθαίνουν από τα δεδομένα πάνω στα οποία εκπαιδεύονται, ενδέχεται να κληρονομήσουν τυχόν εγγενείς προκαταλήψεις που διατυπώνονται σε αυτά τα δεδομένα, οι οποίες θα μπορούσαν να οδηγήσουν σε ανακριβή ή λανθασμένα αποτελέσματα. Για παράδειγμα, εάν ένα μοντέλο τεχνητής νοημοσύνης εκπαιδεύτηκε με κείμενα που διέπονται από πολιτικές προκαταλήψεις, η ανάλυση που θα προκύψει ενδέχεται να κλίνει περισσότερο προς μια συγκεκριμένη άποψη, υπονομεύοντας τον στόχο μιας αντικειμενικής αξιολόγησης.
Ο ανθρώπινος παράγοντας
Η τεχνητή νοημοσύνη δεν είναι η κινητήρια δύναμη αυτού του εγχειρήματος, αλλά αντίθετα λειτουργεί υποστηρικτικά. Μια ομάδα, αποτελούμενη από οκτώ δημοσιογράφους, έναν πολιτικό επιστήμονα, έναν ειδικό στην οπτικοποίηση δεδομένων, τρεις επιστήμονες δεδομένων και δύο επαγγελματίες της τεχνολογίας της πληροφορικής, εξετάζει προσεκτικά κάθε αποτέλεσμα της ανάλυσής μας. Οι πρωταρχικοί τους στόχοι είναι να βελτιώσουν τα δεδομένα και να αξιολογήσουν τις δυνατότητες και τα μειονεκτήματα αυτών των συστημάτων, τα οποία έχουν ήδη φέρει επανάσταση στον τομέα της επεξεργασίας της φυσικής γλώσσας.
Πριν από την εξαγωγή οποιουδήποτε συμπεράσματος από τα διαγράμματα της ανάλυσής μας, θα θέλαμε να σας ζητήσουμε να διαβάσετε τη μεθοδολογία εργασίας την οποία αναρτήσαμε, προκειμένου να κατανοήσετε τις επιλογές που έγιναν στο στάδιο της ανάλυσης και τους περιορισμούς της τεχνολογίας που χρησιμοποιήθηκε. Επιπλέον, σας προτρέπουμε να διαβάσετε τα δύο άρθρα που έχουμε δημοσιεύσει σχετικά με την πόλωση και τον λαϊκισμό ώστε να κατανοήσετε βαθύτερα την προσέγγισή μας στην παρούσα ανάλυση.
Σε περίπτωση που εντοπίσετε τυχόν σφάλματα στις οπτικοποιήσεις μας, σας παρακαλούμε να επικοινωνήσετε μαζί μας στη διεύθυνση [email protected].
Ποιοι εργάζονται για αυτό το έργο
Ιδέα & Συντονισμός Έργου: Θανάσης Τρομπούκης, Κέλλυ Κική (iMEdD)
Δημοσιογραφική Έρευνα/Ανάλυση: Νότα Βαφέα, Κατερίνα Βουτσινά, Στεφανία Ιμπρισίμοβα, Αθηνά Θανάση, Κέλλυ Κική, Χρυσούλα Μαρίνου, Γιώργος Σχοινάς, Θανάσης Τρομπούκης (iMEdD)
Υποστήριξη ΙΤ: Χρήστος Νομικός, Νίκος Σαράντος (iMEdD)
Επιστημονικός Σύμβουλος για θέματα Πολιτικής Θεωρίας: Αντώνης Γαλανόπουλος, Υποψήφιος Διδάκτορας Πολιτικής Επιστήμης, ΑΠΘ
Ανάπτυξη λογισμικού / ανάλυση δεδομένων: Παύλος Σερμπέζης, Στέλιος Καραμανίδης, Δημήτριος-Παντελεήμων Γιακάτος, Ηλίας Δημητριάδης (Datalab)
Διευθύντρια Datalab: Καθηγήτρια Αθηνά Βακάλη
Μετάφραση: Ανατολή Σταυρουλοπούλου