Ο David Holz, ιδρυτής και διευθύνων σύμβουλος της εταιρείας παραγωγής τέχνης τεχνητής νοημοσύνης Midjourney, όταν σκέφτεται το μέλλον της τεχνολογίας του κλάδου του, το παρομοιάζει με το νερό.
Το νερό μπορεί να είναι επικίνδυνο. Μπορούμε εύκολα να πνιγούμε στο νερό. Αλλά δεν έχει καμία πρόθεση. Και η πρόκληση που αντιμετωπίζουν οι άνθρωποι όταν πρόκειται για το νερό είναι να μάθουν να κολυμπούν, να κατασκευάζουν βάρκες και φράγματα και να βρίσκουν τρόπους να χρησιμοποιούν τη δύναμή του.
«Μπορείτε να φτιάξετε δύο εικόνες και να είναι ωραίο, αλλά αν φτιάξετε 100.000 εικόνες, θα έχετε μια πραγματική φυσική αίσθηση πνιγμού», λέει ο Holz σε συνέντευξή του στο Fortune. «Έτσι προσπαθούμε να καταλάβουμε πώς μαθαίνεις στους ανθρώπους να κολυμπούν; Και πώς φτιάχνεις αυτές τις βάρκες που τους επιτρέπουν να πλοηγούνται και να ενδυναμώνονται και να πλέουν στον ωκεανό της φαντασίας, αντί να πνίγονται;».
Να πούμε εδώ ότι David Holz είναι ένας επιχειρηματίας και εφευρέτης που συνίδρυσε μια εταιρεία που ονομάζεται Leap Motion το 2010. Η Leap Motion είναι μια εταιρεία τεχνολογίας που αναπτύσσει και εμπορεύεται λογισμικό και υλικό ανίχνευσης κίνησης και ελέγχου κίνησης. Η τεχνολογία της εταιρείας επιτρέπει στους χρήστες να αλληλεπιδρούν με υπολογιστές και άλλες συσκευές χρησιμοποιώντας κινήσεις χεριών και δακτύλων αντί για ένα παραδοσιακό πληκτρολόγιο, ποντίκι ή οθόνη αφής. Ο Holz ασχολείται με την ανάπτυξη καινοτόμων τεχνολογιών για πολλά χρόνια και έχει αναγνωριστεί για τη συνεισφορά του στον τομέα.
Τι είναι όμως το MidJourney, γιατί όλοι μιλάνε γι αυτό;
Οι generators εικόνων τεχνητής νοημοσύνης έχουν πολλαπλασιαστεί στη Silicon Valley και έχουν γίνει viral στα μέσα κοινωνικής δικτύωσης. Μόλις πριν από μερικές εβδομάδες, ήταν σχεδόν αδύνατο να περιηγηθείτε στο Instagram χωρίς να δείτε τα «μαγικά άβαταρ» της Lensa AI, τα οποία είναι πολύχρωμες ψηφιακές selfies που φτιάχνονται με μια εφαρμογή επεξεργασίας με τη βοήθεια τεχνητής νοημοσύνης.
Τους τελευταίες μήνες, η βιομηχανία της ψυχαγωγίας βρίσκεται σε μεγάλη αναμπουμπούλα, την οποία έχει κυρίως προκαλέσει η εμφάνιση και κατακόρυφη άνοδος αυτών των λογισμικών που παράγουν εικόνες με τη βοήθεια της Τεχνητής Νοημοσύνης. Αυτά τα λογισμικά παραγωγής εικόνων (AI image generators) όχι μόνο κλέβουν την προσοχή του κοινού, αλλά φαίνεται και να διαμορφώνουν ήδη το τοπίο της ψυχαγωγίας. Με πρώτο και πιο γνωστό το Midjourney.
Στο βιβλίο του «Hooked», ο Αμερικανός συγγραφέας Nir Eyal δίνει επιστημονικά τεκμηριωμένα στοιχεία σχετικά με τη διαμόρφωση υγιεινών συνηθειών, τη βελτίωση της παραγωγικότητας και της συγκέντρωσης και τη διαχείριση της απόσπασης της προσοχής. Προτού όμως καταλήξει εκεί, το βιβλίο εμβαθύνει στην ψυχολογία του γιατί ορισμένα προϊόντα και υπηρεσίες τεχνολογίας μπορούν να γίνουν εθιστικά, και οι παρατηρήσεις του Eyal μπορούν να εφαρμοστούν στην ανάλυση των λογισμικών παραγωγής εικόνων Τεχνητής Νοημοσύνης.
Παράλληλα, στην κατανόηση του τρόπου με τον οποίο αυτά τα νέα λογισμικά παραγωγής εικόνων με τη βοήθεια της Τεχνητής Νοημοσύνης ταράζουν τα νερά στη βιομηχανία της ψυχαγωγίας παίζει σημαντικό ρόλο και η λεγόμενη «οικονομία της προσοχής», η νέα οικονομία της ψηφιακής εποχής που επινοήθηκε από τον ψυχολόγο, οικονομολόγο και βραβευμένο με Νόμπελ Hebert A. Simon. Καθώς οι επιχειρήσεις ανταγωνίζονται για μια ρανίδα ενδιαφέροντος, τα λογισμικά παραγωγής εικόνων ΤΝ διεκδικούν ήδη ολοένα και μεγαλύτερο κομμάτι από την πίτα της προσοχής των καταναλωτών, αναδιαμορφώνοντας τον τρόπο με τον οποίο καταναλώνουμε ψυχαγωγία και δημιουργώντας νέες μορφές αυτής.
«Τους τελευταίους 12 μήνες, η ανάπτυξη αυτών των τεχνολογιών ήταν τεράστια», λέει η Mhairi Aitken, συνεργάτιδα ηθικής στο The Alan Turing Institute, το εθνικό ινστιτούτο του Ηνωμένου Βασιλείου για την επιστήμη των δεδομένων και την τεχνητή νοημοσύνη. «Οι χρήστες χρησιμοποιούν generators εικόνων Α.Ι. για να δημιουργήσουν ένα συγκεκριμένο αποτέλεσμα χωρίς να χρειάζεται απαραίτητα να κατανοήσουν ποια είναι η διαδικασία για την οποία δημιουργήθηκε αυτό, ή η τεχνολογία πίσω από αυτό”.
Αυτή τη στιγμή, δεν είναι εύκολο να μιλήσει κανείς με αριθμούς σχετικά με τους χρήστες του Midjourney, ωστόσο το Tokenized σχετικά πρόσφατα ανέφερε ότι ακόμη και «στα τέλη Σεπτεμβρίου 2022, το Midjourney έχει φτάσει τους 2,7 εκατομμύρια χρήστες, και ανά πάσα στιγμή, μεταξύ 300.000 και 600.000 από αυτούς τους χρήστες είναι ενεργά online».
Τα μοντέλα που βρίσκονται πίσω από αυτές τις generators εικόνων Α.Ι. διαπερνούν τα smartphones, επειδή οι πρόσφατες ανακαλύψεις εμβαθύνουν την ικανότητα των μοντέλων να κατανοούν τη γλώσσα και να δημιουργούν πιο ρεαλιστικές φωτογραφίες. «Μαθαίνεις στο σύστημα να εξοικειώνεται με πολλά στοιχεία του κόσμου», εξηγεί ο Holz.
Ως αποτέλεσμα, πρακτικά οποιοσδήποτε χρήστης μπορεί να σχεδιάσει, να επεξεργαστεί και να επανασχεδιάσει τα δικά του χαρακτηριστικά προσώπου σε εικόνες που ανεβαίνουν σε εφαρμογές όπως η Lensa AI, η οποία ξεκίνησε στα τέλη του περασμένου έτους και έχει ήδη περισσότερους από ένα εκατομμύριο συνδρομητές. Στο μέλλον, η Lensa λέει ότι επιδιώκει να εξελίξει το μοντέλο σε ένα one-stop-shop που θα μπορεί να καλύψει όλες τις ανάγκες των χρηστών γύρω από τη δημιουργία οπτικού περιεχομένου και τη φωτογραφία.
Λογισμικά όπως το DALL∙E και το Midjourney απορροφούν από τους χρήστες αρκετό χρόνο και τεράστια προσοχή εις βάρος άλλων υπηρεσιών ψυχαγωγίας και κυρίως streaming, όπως το Netflix και το Disney+. Δεδομένου ότι όλες αυτές οι υπηρεσίες λειτουργούν με βάση συνδρομητικά μοντέλα, πολλοί ήδη προβλέπουν πως πρόκειται να γίνουν σημαντικές αντισταθμίσεις εις βάρος των υπηρεσιών streaming προκειμένου οι χρήστες να μπορέσουν να υποστηρίξουν το νέο τους χόμπι – δηλαδή την παραγωγή εικόνων με τη χρήση ΤΝ.
Καθώς ο ανταγωνισμός για την προσοχή μας γίνεται όλο και πιο έντονος, αυτά τα λογισμικά κερδίζουν ήδη έδαφος, αναδιαμορφώνοντας τον τρόπο με τον οποίο καταναλώνουμε ψυχαγωγία και δημιουργώντας νέες μορφές ψυχαγωγίας.
Η τέχνη που παράγεται από τεχνητή νοημοσύνη εμφανίστηκε αρχικά τη δεκαετία του 1960, αλλά πολλά από τα μοντέλα που χρησιμοποιούνται σήμερα βρίσκονται σε νηπιακό στάδιο. Οι Midjourney, DALL E 2 και Imagen – μερικοί από τους πιο γνωστούς παίκτες στο χώρο – έκαναν το ντεμπούτο τους το 2022. Ορισμένοι από τους μεγαλύτερους τεχνολογικούς γίγαντες του κόσμου δίνουν μεγάλη προσοχή. Το beta μοντέλο A.I. από κείμενο σε εικόνα της Google είναι το Imagen, ενώ υπάρχουν δημοσιεύματα σύμφωνα με τα οποία η Microsoft εξετάζει επένδυση ύψους 10 δισεκατομμυρίων δολαρίων στην OpenAI, στα μοντέλα της οποίας περιλαμβάνονται τα chatbot ChatGPT και DALL E 2.
«Αυτά είναι μερικά από τα μεγαλύτερα, πιο περίπλοκα μοντέλα τεχνητής νοημοσύνης που έχουν αναπτυχθεί ποτέ σε καταναλωτικό επίπεδο», λέει ο Holz. «Είναι η πρώτη φορά που ένας απλός άνθρωπος έρχεται σε επαφή με αυτά τα τεράστια και πολύπλοκα νέα μοντέλα Α.Ι., τα οποία θα καθορίσουν την επόμενη δεκαετία».
Όμως η νέα τεχνολογία εγείρει επίσης ηθικά ερωτήματα σχετικά με την πιθανή διαδικτυακή παρενόχληση, τα deepfakes, τη συναίνεση, την υπερσεξουαλικοποίηση των γυναικών, καθώς και τα πνευματικά δικαιώματα και την εργασιακή ασφάλεια των εικαστικών καλλιτεχνών.
Ο Holz αναγνωρίζει ότι οι generators εικόνων A.I., όπως συμβαίνει με τις περισσότερες νέες τεχνολογικές εξελίξεις, περιέχουν πολλή ανδρική προκατάληψη. Οι άνθρωποι πίσω από αυτά τα μοντέλα έχουν ακόμη δουλειά να κάνουν για να καταλάβουν τους κανόνες πίσω από τη δημιουργία εικόνων τεχνητής νοημοσύνης και περισσότερες γυναίκες θα πρέπει να έχουν αποφασιστικό ρόλο στο πώς εξελίσσεται αυτή η τεχνολογία.
Το μοντέλο «Hooked»
Όπως περιγράφει στο βιβλίο του «Hooked», ο Nir Eyal επινόησε ένα πλαίσιο για την κατανόηση του γιατί ορισμένα προϊόντα και υπηρεσίες μπορούν να γίνουν εθιστικά, το οποίο ονόμασε μοντέλο «Hooked». Το μοντέλο αποτελείται από τέσσερα στάδια: ερέθισμα, δράση, επιβράβευση και επένδυση. Στο πλαίσιο των λογισμικών παραγωγής εικόνων ΤΝ, αυτά τα βήματα μπορούν να εφαρμοστούν για να κατανοήσουμε πώς η τεχνολογία γίνεται εθιστική για τους χρήστες.
Το ερέθισμα για τη χρήση των AI image generators είναι η επιθυμία για ψυχαγωγία ή η ανάγκη για δημιουργία περιεχομένου. Η δράση είναι η πραγματική χρήση του προγράμματος, είτε πρόκειται για απλή περιήγηση στις εικόνες που δημιουργούνται είτε για τη δημιουργία δικών μας εικόνων. Η επιβράβευση είναι η αυτόματη ικανοποίηση που αισθάνεται ο χρήστης και η δέσμευση που προκύπτει μέσω αυτών των εικόνων. Τέλος, η επένδυση είναι ο χρόνος και η προσπάθεια που καταβάλλει ο χρήστης για τη χρήση του λογισμικού, όπως η δημιουργία των δικών του εικόνων ή η εκμάθηση ενός αποτελεσματικότερου τρόπου χρήσης της τεχνολογίας.
Το μοντέλο «Hooked» είναι ιδιαίτερα συναφές με τα εν λόγω λογισμικά παραγωγής εικόνων, ακριβώς επειδή έχουν σχεδιαστεί για να είναι ιδιαίτερα ελκυστικά και ευχάριστα στη χρήση. Οι ρεαλιστικές – και ίσως ακόμη περισσότερο οι σουρεαλιστικές – εικόνες που μπορούν να δημιουργηθούν με την βοήθεια της τεχνολογίας είναι οπτικά πέρα για πέρα εντυπωσιακές συνήθως, γεγονός που τις καθιστά ιδιαίτερα διαδεδομένες. Επιπλέον, η δυνατότητα δημιουργίας εικόνων ή και βίντεο από το μηδέν με την βοήθεια της τεχνολογίας αποτελεί ισχυρό κίνητρο για τους χρήστες να συνεχίσουν να χρησιμοποιούν αυτά τα λογισμικά.
Ένα από τα βασικά στοιχεία του μοντέλου «Hooked» είναι η χρήση ποικίλων ανταμοιβών. Πρόκειται για ανταμοιβές που δεν είναι πάντα ίδιες, αλλά αντίθετα εναλλάσσονται και συχνά είναι απρόβλεπτες. Στην περίπτωση των λογισμικών παραγωγής εικόνων ΤΝ, η απρόβλεπτη φύση των εικόνων και των βίντεο που μπορούν να δημιουργηθούν με την τεχνολογία αποτελεί βασικό παράγοντα της εθιστικότητάς τους. Οι χρήστες συμμετέχουν συνεχώς σε ένα «κυνήγι θησαυρού», κατά κάποιο τρόπο, για νέες και ενδιαφέρουσες εικόνες, γεγονός που τους κάνει να επιστρέφουν ξανά και ξανά.
Ένα άλλο σημαντικό στάδιο του μοντέλου «Hooked» είναι το κομμάτι της «επένδυσης». Καθώς οι χρήστες συνεχίζουν να χρησιμοποιούν την τεχνολογία, επενδύουν περισσότερο σε αυτήν. Μπορεί να αφιερώνουν περισσότερο χρόνο στη χρήση της ή να μαθαίνουν νέες τεχνικές και δεξιότητες για να δημιουργούν ακόμη πιο εντυπωσιακές εικόνες. Αυτή η επένδυση στην τεχνολογία ενισχύει περαιτέρω τη δέσμευση του χρήστη και καθιστά πιο δύσκολο για αυτόν να σταματήσει να τη χρησιμοποιεί.
Όμως, καθώς η τεχνολογία γίνεται όλο και πιο προηγμένη και προσιτή, είναι σημαντικό να κατανοήσουμε και τις πιθανές αρνητικές επιπτώσεις της χρήσης της, κι ιδίως τον εθιστικό χαρακτήρα της.
Η οικονομία της προσοχής
Στη σύγχρονη ψηφιακή εποχή, ο ανταγωνισμός για την ανθρώπινη προσοχή δεν ήταν ποτέ μεγαλύτερος, με μια ατελείωτη ροή πληροφοριών και ψυχαγωγίας διαθέσιμη στα χέρια μας. Η βιομηχανία της ψυχαγωγίας δεν αποτελεί εξαίρεση σε αυτή την τάση, με τις εταιρείες να διεκδικούν συνεχώς την προσοχή του κοινού.
Στην οικονομία της προσοχής, η ίδια η προσοχή αποτελεί πολύτιμο αγαθό και οι εταιρείες που μπορούν να την κατακτήσουν για παρατεταμένα χρονικά διαστήματα έχουν σημαντικό πλεονέκτημα. Τα λογισμικά παραγωγής εικόνων ΤΝ έχουν τη δυνατότητα να φέρουν τα πάνω κάτω στην οικονομία της προσοχής κάνοντας ακριβώς αυτό.
Η προσοχή μας καθημερινά γίνεται αντικείμενο διεκδίκησης από πολλά διαφορετικά πράγματα, συμπεριλαμβανομένων των διαφημίσεων, των προϊόντων, της ψυχαγωγίας, των μέσων κοινωνικής δικτύωσης, ακόμη και του ύπνου. Η προσοχή μας απορροφάται επίσης από δραστηριότητες όπως η μάθηση, η επίλυση προβλημάτων και η λήψη αποφάσεων. Ο χρόνος που μπορεί κάθε άνθρωπος να ασχοληθεί με διάφορες δραστηριότητες είναι πολύ περιορισμένος, γι’ αυτό και στόχος των προϊόντων και υπηρεσιών τεχνολογίας παντός είδους είναι πάνω απ’ όλα να προσφέρουν όσο το δυνατόν μεγαλύτερη χαρά στον καταναλωτή κατά τη χρήση.
Σε αντίθεση με τις παραδοσιακές μορφές ψυχαγωγίας, όπως η τηλεόραση ή ο κινηματογράφος, τα λογισμικά παραγωγής εικόνων προσφέρουν μια διαρκώς μεταβαλλόμενη και απρόβλεπτη ροή ψυχαγωγίας. Αυτό τα καθιστά ιδιαίτερα ελκυστικά, και οι χρήστες μπορούν εύκολα να περάσουν ώρες περιηγούμενοι στις παραγόμενες εικόνες ή δημιουργώντας τις δικές τους. Επιπλέον, καλλιεργούν μια αίσθηση δέσμευσης και ικανοποίησης που δύσκολα μπορεί να αναπαραχθεί με άλλες μορφές ψυχαγωγίας.
Καθώς η τεχνολογία γίνεται όλο και πιο προηγμένη και προσιτή, είναι σημαντικό να εξετάσουμε τις επιπτώσεις της χρήσης της και πώς μπορεί να αναδιαμορφώσει το τοπίο της ψυχαγωγίας. Οι εταιρείες του κλάδου ενδεχομένως να πρέπει να προσαρμοστούν και να ενσωματώσουν την παραγωγή εικόνων με τη βοήθεια της ΤΝ στις στρατηγικές τους για να παραμείνουν ανταγωνιστικές.
Κινηματογράφος και τηλεόραση VS AI Image Generators
Η βιομηχανία κινηματογράφου και τηλεόρασης αντιμετωπίζει ήδη προκλήσεις στην οικονομία της προσοχής, καθώς οι μορφές ψυχαγωγίας που βασίζονται στην τεχνολογία, όπως τα βιντεοπαιχνίδια και τα μέσα κοινωνικής δικτύωσης, κερδίζουν όλο και περισσότερο την προσοχή του κοινού. Η τάση αυτή είναι πιθανό να συνεχιστεί καθώς τα λογισμικά παραγωγής εικόνων γίνονται πιο προηγμένες και προσιτές.
Η κινηματογραφική βιομηχανία αισθάνεται ήδη τις επιπτώσεις αυτής της τάσης, με μείωση των εσόδων από το box office και στροφή προς τις υπηρεσίες streaming. Η ανάπτυξη των υπηρεσιών streaming, όπως το Netflix, έχει οδηγήσει σε μείωση των παραδοσιακών επισκέψεων στις κινηματογραφικές αίθουσες. Καθώς τα λογισμικά παραγωγής εικόνας AI γίνονται πιο διαδεδομένα, μπορεί να αρχίσουν να εκτοπίζουν τις παραδοσιακές μορφές ψυχαγωγίας, μειώνοντας περαιτέρω το κοινό της κινηματογραφικής βιομηχανίας.
Επιπλέον, τα λογισμικά παραγωγής εικόνων ΤΝ έχουν τη δυνατότητα να εμπνεύσουν νέες μορφές ψυχαγωγίας που ούτε καν φανταζόμασταν μέχρι σήμερα. Για παράδειγμα, μπορούν να χρησιμοποιηθούν για τη δημιουργία εξαιρετικά ρεαλιστικών εικονικών κόσμων και χαρακτήρων για βιντεοπαιχνίδια, εμπειρίες εικονικής πραγματικότητας, ακόμη και τον κινηματογράφο και την τηλεόραση. Αυτό θα μπορούσε να οδηγήσει σε ένα νέο είδος ψυχαγωγίας που δεν είναι επί του παρόντος δυνατό με την παραδοσιακή τεχνολογία.
Τεχνολογία κι ανθρώπινη ύπαρξη
Καθώς η τεχνολογία γίνεται όλο και πιο προηγμένη και προσβάσιμη, τίθεται το ερώτημα αν εμείς ως κοινωνία θέλουμε να ασχοληθούμε με την εθιστική τεχνολογία ή αν η τεχνολογία θα πρέπει να σχεδιαστεί έτσι ώστε να αναιρεί τις εθιστικές πτυχές που περιγράφει ο Eyal.
Σε προσωπικό επίπεδο, αναδεικνύει τους κινδύνους της υπερβολικής καταβύθισης στους εικονικούς κόσμους και την πιθανότητα εθισμού. Αποτελεί επίσης υπενθύμιση της σημασίας της εξισορρόπησης της χρήσης της τεχνολογίας με την πραγματική μας ζωή.
Θέτει σημαντικά ερωτήματα σχετικά με τον ρόλο της Τεχνητής Νοημοσύνης στη ζωή μας και τις πιθανές συνέπειες της ανεξέλεγκτης χρήσης της. Καθώς η τεχνολογία ΤΝ συνεχίζει να εξελίσσεται και να ενσωματώνεται όλο και περισσότερο στην καθημερινή μας ζωή, είναι σημαντικό να εξετάσουμε τον αντίκτυπο που μπορεί να έχει στην ψυχική και συναισθηματική μας ευημερία.
Οι κοινωνίες μας θα πρέπει να ζυγίσουν τα υπέρ και τα κατά της ενασχόλησης με εθιστικές τεχνολογίες και να εξετάσουν τις ηθικές επιπτώσεις των λογισμικών δημιουργίας εικόνων Τεχνητής Νοημοσύνης. Είναι ζωτικής σημασίας για τη βιομηχανία να προσαρμόσει και να ενσωματώσει αυτά τα λογισμικά στις στρατηγικές της με υπεύθυνο τρόπο που να λαμβάνει υπόψη τις πιθανές αρνητικές συνέπειες.
Τελικά, το κλειδί είναι να βρεθεί μια ισορροπία μεταξύ των πλεονεκτημάτων και των πιθανών αρνητικών συνεπειών της τεχνολογίας. Παρέχοντας στους χρήστες πληροφορίες και εργαλεία για να λαμβάνουν πιο τεκμηριωμένες αποφάσεις σχετικά με τη χρήση της τεχνολογίας, μπορούμε να συμβάλουμε στον μετριασμό της πιθανότητας εθισμού και άλλων αρνητικών επιπτώσεων.
Πηγές: OLAfaq.gr, Fortune