H κινεζική DeepSeek φέρνει τα πάνω-κάτω στον κόσμο της Τεχνητής Νοημοσύνης

Η κινεζική startup τεχνητής νοημοσύνης (AI) DeepSeek προκαλεί «σεισμό» στις παγκόσμιες τεχνολογικές μετοχές, εγείροντας ερωτήματα σχετικά με την τεχνολογική κυριαρχία της Αμερικής.

Το ενδιαφέρον αυξήθηκε κατά τη διάρκεια του Σαββατοκύριακου σχετικά με το τελευταίο μοντέλο τεχνητής νοημοσύνης της DeepSeek, το οποίο είναι οικονομικά αποδοτικό, ενώ λειτουργεί σε λιγότερο προηγμένα τσιπ, θέτοντας υπό αμφισβήτηση τις γιγάντιες αποτιμήσεις εταιρειών όπως η Nvidia, η οποία έχει ηγηθεί της παγκόσμιας «έκρηξης» των μετοχών AI, καθώς τα τσιπ της θεωρήθηκαν απαραίτητα για την τεχνολογία. Σημειώνεται ότι στις ηλεκτρονικές συναλλαγές πριν το άνοιγμα της Wall Street, η μετοχή του τεχνολογικού κολοσσού καταγράφει έως και «βουτιά» 10%.

Γιατί ταράζει τα νερά η DeepSeek

Ο βασικός λόγος για τον οποίο η DeepSeek φέρνει τέτοια αναστάτωση στις αγορές έγκειται κυρίως στο γεγονός του χαμηλότερου κόστους δημιουργίας του μοντέλου της, το οποίο παρουσιάζει παρόμοιες επιδόσεις με τα μεγάλα chatbot των OpenΑΙ και Google για ένα πολύ μικρότερο μέρος του κόστους.

Την ώρα που οι Αμερικανικοί κολοσσοί ξοδεύουν δισεκατομμύρια σε επενδύσεις υποδομών αλλά και για την προμήθεια προηγμένων τσιπ και «ανασταίνουν» την πυρηνική ενέργεια για τις υπέρογκες ενεργειακές ανάγκες των Data Centers, η DeepSeek με το μοντέλο ανοιχτού κωδικά της δίνει μια ρεαλιστική (τουλάχιστον με βάση τα όσα δείχνουν τα έως τώρα δεδομένα) εναλλακτική.

Το προϊόν της DeepSeek «είναι βαθιά προβληματικό για την άποψη ότι οι σημαντικές κεφαλαιουχικές δαπάνες και τα λειτουργικά έξοδα που έχει αναλάβει η Silicon Valley είναι ο καταλληλότερος τρόπος προσέγγισης της τάσης της Τεχνητής Νοημοσύνης», δήλωσε ο Νιργκούναν Τιρουχελβάμ, επικεφαλής του τμήματος καταναλωτών και διαδικτύου της Aletheia Capital με έδρα τη Σιγκαπούρη. «Θέτει υπό αμφισβήτηση τους τεράστιους πόρους που έχουν αφιερωθεί στην τεχνητή νοημοσύνη».

Η κυκλοφορία του R1 της DeepSeek εγείρει επίσης νέες αμφιβολίες, αμφισβητώντας την άποψη ότι η τεχνολογία Τεχνητής Νοημοσύνης της Κίνας είναι χρόνια πίσω από τις αντίστοιχες των ΗΠΑ, σημειώνει το Bloomberg. Οι εμπορικοί περιορισμοί της Ουάσινγκτον είχαν κρατήσει τα πιο πρωτοποριακά τσιπ μακριά από τα χέρια της Κίνας, αλλά το μοντέλο της DeepSeek κατασκευάστηκε χρησιμοποιώντας τεχνολογία ανοιχτού κώδικα που είναι εύκολα προσβάσιμη.

«Η DeepSeek δείχνει ότι είναι εφικτή η ανάπτυξη ισχυρών μοντέλων τεχνητής νοημοσύνης με χαμηλότερο κόστος», δήλωσε ο Vey-Sern Ling, διευθύνων σύμβουλος της Union Bancaire Privee. «Αυτό μπορεί ενδεχομένως να εκτροχιάσει την επενδυτική αντίληψη για ολόκληρη την αλυσίδα εφοδιασμού τεχνητής νοημοσύνης».

Το μοντέλο τεχνητής νοημοσύνης της DeepSeek – που ιδρύθηκε από τον Liang Wenfeng – θεωρείται ευρέως ανταγωνιστικό σε σχέση με τις τελευταίες προτάσεις των OpenAI και Meta Platforms. Η εφαρμογή της DeepSeek, η οποία επαινέθηκε από τον επενδυτή Marc Andreessen ως «μία από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις», δείχνει το έργο και τη συλλογιστική της καθώς αντιμετωπίζει το γραπτό ερώτημα ή την προτροπή ενός χρήστη.

Το προϊόν που κυκλοφόρησε την περασμένη εβδομάδα, βρίσκεται πλέον στην κορυφή της κατάταξης του App Store της Apple, με τους χρήστες να επαινούν τη διαφάνειά του.

Τι είναι η DeepSeek και πως λειτουργεί;

Η DeepSeek είναι μία καινοτόμος τεχνολογία αναζήτησης δεδομένων που βασίζεται σε τεχνητή νοημοσύνη και μηχανική μάθηση. Χρησιμοποιείται κυρίως για την αναζήτηση βαθύτερων, πιο πολύπλοκων ή δύσκολα προσβάσιμων δεδομένων σε μεγάλα σύνολα πληροφοριών, όπως κείμενα, εικόνες, ήχους ή βίντεο. Σε αντίθεση με τις παραδοσιακές μηχανές αναζήτησης, οι οποίες βασίζονται σε λέξεις-κλειδιά, η DeepSeek επικεντρώνεται στη νοηματική ανάλυση και την αναγνώριση συσχετισμών μεταξύ δεδομένων.

Πώς λειτουργεί;

Η λειτουργία της DeepSeek βασίζεται σε συνδυασμό τεχνολογιών τεχνητής νοημοσύνης, όπως:

Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing – NLP):
Αναγνωρίζει το νοηματικό περιεχόμενο των κειμένων, εξάγει πληροφορίες και ερμηνεύει περίπλοκα ερωτήματα.
Εξόρυξη Δεδομένων (Data Mining):
Αναλύει μεγάλα και ποικίλα σύνολα δεδομένων για να βρει πρότυπα και συσχετίσεις.
Αλγορίθμους Μηχανικής Μάθησης:
Εκπαιδεύεται με τη χρήση τεράστιων βάσεων δεδομένων και προσαρμόζεται σε νέες πληροφορίες για να βελτιώνει συνεχώς την ακρίβεια των αναζητήσεών της.
Δίκτυα Βαθιάς Μάθησης (Deep Learning):
Χρησιμοποιεί βαθιά νευρωνικά δίκτυα για να αναγνωρίζει μοτίβα και νοηματικές σχέσεις σε πολύπλοκα δεδομένα, όπως εικόνες ή βίντεο.
Ενοποιημένη Αναζήτηση:
Ενσωματώνει πληροφορίες από διαφορετικές πηγές (π.χ. βάσεις δεδομένων, διαδικτυακούς τόπους, κοινωνικά δίκτυα) για να παρέχει πλήρη και σχετικές απαντήσεις.

Παραδείγματα χρήσης της DeepSeek:

Στη δημοσιογραφία:
Βοηθά στην αναζήτηση πληροφοριών μέσα από τεράστιες βάσεις δεδομένων, δημόσια αρχεία ή κοινωνικά δίκτυα για την επαλήθευση ειδήσεων (fact-checking).
Στην ιατρική:
Μπορεί να αναλύει δεδομένα από επιστημονικές δημοσιεύσεις ή ιατρικά αρχεία για να βρει πιθανές θεραπείες ή συνδυασμούς φαρμάκων.
Στη νομική έρευνα:
Εντοπίζει προηγούμενες δικαστικές αποφάσεις, νομοθεσίες ή ερμηνείες που σχετίζονται με μία υπόθεση.
Σε εταιρείες:
Βοηθά στην αναζήτηση βέλτιστων πρακτικών, αναλύει δεδομένα πελατών και προσδιορίζει ευκαιρίες για ανάπτυξη.
Για κυβερνητικές υπηρεσίες:
Εντοπίζει μοτίβα σε δεδομένα για την καταπολέμηση εγκλήματος, την παρακολούθηση της παραπληροφόρησης ή την ανάλυση τάσεων.

Το προϊόν της DeepSeek «αμφισβητεί τις σημαντικές κεφαλαιουχικές δαπάνες και τα λειτουργικά έξοδα που έχει αναλάβει η Silicon Valley και είναι αυτός ο καταλληλότερος τρόπος προσέγγισης της τάσης της Τεχνητής Νοημοσύνης», δήλωσε ο Nirgunan Tiruchelvam, επικεφαλής του τμήματος καταναλωτών και διαδικτύου της Aletheia Capital με έδρα τη Σιγκαπούρη. «Θέτει υπό αμφισβήτηση τους τεράστιους πόρους που έχουν αφιερωθεί στην τεχνητή νοημοσύνη».

Στη χρηματιστηριακή αγορά των ΗΠΑ, τα futures του Nasdaq κατέγραψαν «βουτιά» έως και 3,2% και του S&P 500 έως και 1,9%. Απώλειες καταγράφουν και τα ευρωπαϊκά χρηματιστήρια, με τον τεχνολογικό κλάδο να καταγράφει πτώση 4%.

Η πτώση των futures του Nasdaq έρχεται στην αρχή μιας μεγάλης εβδομάδας για τα εταιρικά αποτελέσματα των μεγάλων τεχνολογικών εταιρειών, όπως η Apple και η Microsoft. Η αύξηση των κερδών αναμένεται να έχει επιβραδυνθεί, ενώ οι αποτιμήσεις παραμένουν διογκωμένες, προκαλώντας για άλλη μια φορά ανησυχία για το μεγάλο ράλι του κλάδου με φόντο την τεχνητή νοημοσύνη.

Η κυκλοφορία του DeepSeek εγείρει νέες αμφιβολίες, αμφισβητώντας την άποψη ότι η τεχνολογία Τεχνητής Νοημοσύνης της Κίνας βρίσκεται χρόνια πίσω από τις αντίστοιχες των ΗΠΑ. Οι εμπορικοί περιορισμοί της Ουάσινγκτον είχαν κρατήσει τα πιο πρωτοποριακά τσιπ μακριά από τα χέρια της Κίνας, αλλά το μοντέλο της DeepSeek κατασκευάστηκε χρησιμοποιώντας τεχνολογία ανοιχτού κώδικα που είναι εύκολα προσβάσιμη.

«Ενώ οι σημερινοί ηγέτες του χώρου, όπως η Nvidia, έχουν ισχυρή παρουσία στον χώρο, το γεγονός αυτό αποτελεί μια υπενθύμιση ότι η κυριαρχία της τεχνητής νοημοσύνης δεν μπορεί να θεωρηθεί δεδομένη», δήλωσε ο Charu Chanana, επικεφαλής επενδυτικός στρατηγικός αναλυτής της Saxo Markets. «Η εμφάνιση της κινεζικής DeepSeek δείχνει ότι ο ανταγωνισμός εντείνεται, και παρόλο που μπορεί να μην αποτελεί σημαντική απειλή τώρα, οι μελλοντικοί ανταγωνιστές θα εξελίσσονται ταχύτερα και θα αμφισβητούν πιο γρήγορα τις καθιερωμένες εταιρείες. Τα κέρδη αυτής της εβδομάδας θα αποτελέσουν μια τεράστια δοκιμασία».

Σε ένα σύνολο δοκιμών, το μοντέλο της DeepSeek ξεπέρασε το Llama 3.1 της Meta, το GPT-4o της OpenAI και το Claude Sonnet 3.5 της Anthropic σε ακρίβεια από την επίλυση σύνθετων προβλημάτων έως τα μαθηματικά και την κωδικοποίηση, σύμφωνα με το CNBC.

Η DeepSeek κυκλοφόρησε τη Δευτέρα και το r1, ένα μοντέλο συλλογισμού που επίσης ξεπέρασε το τελευταίο o1 της OpenAI σε πολλές από τις δοκιμές τρίτων.

«Βλέποντας το νέο μοντέλο DeepSeek, είναι εξαιρετικά εντυπωσιακό», δήλωσε ο διευθύνων σύμβουλος της Microsoft Satya Nadella στο Παγκόσμιο Οικονομικό Φόρουμ στο Νταβός της Ελβετίας την Τετάρτη. «Θα πρέπει να λάβουμε πολύ, πολύ σοβαρά στα υπόψη μας τις εξελίξεις από την Κίνα».

Η DeepSeek έπρεπε επίσης να ξεπεράσει τους αυστηρούς περιορισμούς στους ημιαγωγούς που έχει επιβάλει η κυβέρνηση των ΗΠΑ στην Κίνα, αποκόπτοντας τη χώρα από την πρόσβαση στα πιο ισχυρά τσιπ, όπως τα H100 της Nvidia. Οι τελευταίες εξελίξεις υποδηλώνουν ότι η DeepSeek είτε βρήκε τρόπο να παρακάμψει τους κανόνες, είτε ότι οι έλεγχοι εξαγωγών δεν ήταν ο ασφυκτικός κλοιός που επεδίωκε η Ουάσινγκτον.

Λίγα είναι γνωστά για το εργαστήριο και τον ιδρυτή του, Liang WenFeng. Το DeepSeek γεννήθηκε από ένα κινεζικό hedge fund με την ονομασία High-Flyer Quant που διαχειρίζεται περιουσιακά στοιχεία ύψους περίπου 8 δισ. δολαρίων, σύμφωνα με αναφορές των διεθνών μέσων ενημέρωσης.

Αλλά η DeepSeek δεν είναι η μόνη κινεζική εταιρεία που ξεχωρίζει στον κλάδο τεχνητής νοημοσύνης.

Ο κορυφαίος ερευνητής τεχνητής νοημοσύνης Kai-Fu Lee δήλωσε ότι η νεοσύστατη επιχείρησή του 01.ai εκπαιδεύτηκε χρησιμοποιώντας μόνο 3 εκατ. δολάρια. Η μητρική εταιρεία ByteDance της TikTok κυκλοφόρησε την Τετάρτη μια ενημερωμένη έκδοση του μοντέλου της που ισχυρίζεται ότι ξεπερνά το o1 της OpenAI σε μια βασική δοκιμή.

«Η ανάγκη είναι η μητέρα της εφεύρεσης», δήλωσε ο διευθύνων σύμβουλος της Perplexity Aravind Srinivas. «Επειδή έπρεπε να βρουν λύσεις, κατέληξαν να κατασκευάσουν κάτι πολύ πιο αποτελεσματικό».

H κινεζική DeepSeek φέρνει τα πάνω-κάτω στον κόσμο της Τεχνητής Νοημοσύνης

Γιατί ταράζει τα νερά η DeepSeek

Τι είναι η DeepSeek και πως λειτουργεί;

Πώς λειτουργεί;

Παραδείγματα χρήσης της DeepSeek:

Τελευταία άρθρα

Το Φιλί του Θανάτου