Ένα κινέζικο εργαστήριο της DeepSeek αποκάλυψε το πρώτο μοντέλο τεχνητής νοημοσύνης που μπορεί να ανταγωνιστεί το ο1 της OpenAI. Όλα αυτά με τις δυσκολίες που αντιμετωπίζει η Κίνα, λόγω του αποκλεισμού της από τις αγορές ισχυρών GPUs, για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης. Η Κίνα όμως βρίσκει τρόπους να καινοτομήσει, ακόμα και χωρίς τον εξοπλισμό που χρειάζεται και αυτό από μόνο του είναι φοβερό.
Την περασμένη Τετάρτη, μια εταιρία έρευνας ΑΙ, DeepSeek, λάνσαρε το DeepSeek-R1. Σύμφωνα με την ομάδα πίσω από το έργο, πρόκειται για το πρώτο μοντέλο τεχνητής νοημοσύνης που μπορεί να ανταγωνιστεί το o1, της OpenAI, σε ότι έχει να κάνει με την συλλογιστική.
Αυτό σημαίνει πως όπως και στο o1, το μοντέλο χρειάζεται κάποιο χρόνο για να απαντήσει, αφού εξετάζει πολλές και διαφορετικές πιθανές απαντήσεις, οπότε ο χρήστης θα πρέπει να περιμένει λίγο παραπάνω για να λάβει την απάντηση.
Όμως, μέσα από δοκιμές στις επιδόσεις, το κινέζικο μοντέλο είναι άμεσα συγκρίσιμο με το μοντέλο που ανακοίνωσε η OpenAI τον Σεπτέμβριο!
Το κινέζικο μοντέλο της DeepSeek αντιμετωπίζει τα ίδια συλλογιστικά προβλήματα που παρατηρούνται και στο o1 της OpenAI, όπως απλά παιχνίδια, σαν το τρία στη σειρά. Όμως, στην παρούσα φάση, το DeepSeek-R1 μπορεί να ξεγελαστεί ώστε να ξεπεράσει τους φραγμούς ασφαλείας και να παράγει τοξικό περιεχόμενο. Για παράδειγμα, ένας χρήστης δημοσίευσε στο X πως του έδωσε μια λεπτομερή συνταγή μεθεθρεαλικής μεθόδου. Κοινώς του είπε πως να φτιάξει κρυσταλλική μεθαμφεταμίνη ή αλλιώς τα ναρκωτικά που έφτιαχναν στο Breaking Bad. Ο χρήστης του ζήτησε να δημιουργήσει τη συνταγή για να είναι αλληθοφανές το σενάριο που έγραφε και το DeepSeek απλά την έδωσε, με δολολογίες, χρόνους και όλες τις λεπτομέρειες.
JAILBREAK ALERT
DEEPSEEK: PWNED
DEEPSEEK-R1-LITE: LIBERATEDWOW…this is truly awesome. I wanted to see if BASILISK PRIME could handle this jailbreak on their own…and the answer is YES!
The agent was able to log into gmail, navigate to DeepSeek chat, log in via… pic.twitter.com/Ax4R2ZfPKU
— Pliny the Liberator (@elder_plinius) November 20, 2024
Στις δοκιμές το κινέζικο μοντέλο DeepSeek-R1 ζητούσε συγγνώμη και δεν απαντούσε αν ο χρήστης ρωτούσε σχόλια για την πολιτική κατάσταση στην Κίνα. Πιθανότατα η κινέζικη κυβέρνηση έχει ασκήσει πιέσεις για να συμβαίνει αυτό και σύμφωνα με του Financial Times, το μοντέλο τεχνητής νοημοσύνης έχει μηχανισμούς λογοκρισίας, ώστε να ευθυγραμμίζεται με τις πολιτικές της χώρας.
H Σελήνη απομακρύνεται από τη Γη
H DeepSeek χρηματοδοτείται από την High-Flyer Capital Management, ένα κινέζικο επενδυτικό ταμείο, που αποσκοπεί να χρησιμοποιήσει την τεχνητή νοημοσύνη για λήψη επενδυτικών αποφάσεων. Η εταιρία παρέχει και τα clusters servers της για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης και διαθέτει 10.000 GPUs Nvidia A100, που κόστισαν 139 εκατομμύρια δολάρια. Ο στόχος της High-Flyer είναι η δημιουργία ενός AGI, μέσω του DeepSeek. Το πολύ εντυπωσιακό όμως είναι πως οι δημιουργοί της DeepSeek θέλουν να δημοσιεύσουν τον κώδικα του μοντέλου, διαθέτοντάς το σαν Open Source και να προσφέρουν ένα API.
Η Κίνα προχωρά με ταχύ ρυθμό στην τεχνητή νοημοσύνη, παρά τις προσπάθειες των Αμερικάνων να την σταματήσουν. Μάλιστα, το μοντέλο της DeepSeek είναι τόσο καλό, που οι κινέζοι ανταγωνιστές της όπως η ByteDance, η Alibaba και η Baidu, μείωσαν τις τιμές τους στα πακέτα συνδρομών για τα δικά τους μοντέλα, ενώ ορισμένοι τα διέθεσαν δωρεάν.
Μπορείτε να δοκιμάσετε το μοντέλο ΕΔΩ.