back to top
Πέμπτη, 21 Νοεμβρίου, 2024
ΑρχικήNewsΤο DeepSeek αμφισβητεί το ChatGPT O1

Το DeepSeek αμφισβητεί το ChatGPT O1


Το κινεζικό εργαστήριο τεχνητής νοημοσύνης DeepSeek ανακοίνωσε την κυκλοφορία του μοντέλου DeepSeek-R1-Lite-Preview, το οποίο ισχυρίζεται ότι ανταγωνίζεται το μοντέλο o1 του OpenAI. Το νέο μοντέλο προσφέρει ένα μοναδικό χαρακτηριστικό: τη διαφάνεια στη διαδικασία συλλογισμού του, που επιτρέπει στους χρήστες να βλέπουν τις μεθόδους επίλυσης προβλημάτων βήμα προς βήμα. Αυτή η ανακοίνωση έρχεται δύο μήνες αφότου το OpenAI παρουσίασε το μοντέλο ο1-προεπισκόπησης, υπογραμμίζοντας έναν αυξανόμενο ανταγωνισμό στον συλλογιστικό χώρο της τεχνητής νοημοσύνης.

Το DeepSeek λανσάρει το συλλογιστικό μοντέλο για να ανταγωνιστεί το OpenAI

Το DeepSeek-R1-Lite-Preview είναι προσβάσιμο μέσω ενός web chatbot, DeepSeek Chatόπου οι χρήστες μπορούν να αλληλεπιδρούν με το μοντέλο, περιορίζεται σε 50 μηνύματα την ημέρα. Ενώ δεν έχουν ακόμη κυκλοφορήσει λεπτομερή σημεία αναφοράς και κάρτα μοντέλου, οι πρώτες εκτιμήσεις δείχνουν ότι το μοντέλο συλλογιστικής παρουσιάζει επιδόσεις συγκρίσιμες με τα σημεία αναφοράς του OpenAI για εργασίες AIME και MATH. Η DeepSeek βεβαιώνει ότι επιτυγχάνει υπερσύγχρονη ακρίβεια 91,6% στο σημείο αναφοράς MATH.

Η εισαγωγή του DeepSeek-R1 έρχεται καθώς οι παραδοσιακοί νόμοι κλιμάκωσης στην τεχνητή νοημοσύνη, οι οποίοι υποδηλώνουν ότι η αύξηση των δεδομένων και η υπολογιστική ισχύς θα βελτιώσουν την απόδοση, αρχίζουν να παρουσιάζουν φθίνουσες αποδόσεις. Σε απάντηση, οι εταιρείες αναζητούν νέες προσεγγίσεις, όπως αυτές που βασίζονται σε μοντέλα λογικής όπως το DeepSeek-R1. Σε αντίθεση με τα παραδοσιακά μοντέλα, τα συλλογιστικά μοντέλα επεκτείνουν την υπολογιστική τους επεξεργασία κατά τη διάρκεια της εξαγωγής συμπερασμάτων για να ενισχύσουν τις δυνατότητες λήψης αποφάσεων.

Παρά τα πολλά υποσχόμενα χαρακτηριστικά του, το νέο μοντέλο τηρεί επίσης αυστηρά πρωτόκολλα λογοκρισίας που είναι κοινά στην κινεζική τεχνολογία AI. Οι παρατηρήσεις επιβεβαίωσαν ότι το DeepSeek-R1 αποφεύγει ευαίσθητα πολιτικά θέματα, όπως έρευνες σχετικά με τον Xi Jinping ή την Ταϊβάν. Οι χρήστες έχουν αναφέρει επιτυχημένες προσπάθειες παράκαμψης αυτών των περιορισμών, επιτρέποντας στο μοντέλο να παρέχει αφιλτράριστο περιεχόμενο σε ορισμένα σενάρια. Αυτή η πτυχή εγείρει συνεχή ερωτήματα σχετικά με την ισορροπία μεταξύ λειτουργικότητας και κανονιστικής συμμόρφωσης για μοντέλα τεχνητής νοημοσύνης που αναπτύχθηκαν σε περιοχές με αυστηρή κυβερνητική εποπτεία.

Η DeepSeek ισχυρίζεται ότι το μοντέλο DeepSeek-R1 —ή πιο συγκεκριμένα, το DeepSeek-R1-Lite-Preview— ταιριάζει με το μοντέλο o1-preview του OpenAI σε δύο εξέχοντα σημεία αναφοράς AI, το AIME και το MATH. Το AIME αξιολογεί την απόδοση ενός μοντέλου χρησιμοποιώντας άλλα μοντέλα τεχνητής νοημοσύνης, ενώ τα ΜΑΘ δοκιμάζουν την επίλυση προβλημάτων με μια συλλογή προβλημάτων λέξεων. Ωστόσο, το μοντέλο έχει τα μειονεκτήματά του. Μερικοί χρήστες στο X επισήμανε ότι το DeepSeek-R1, όπως και το o1, αντιμετωπίζει προκλήσεις με tic-tac-toe και άλλες εργασίες που βασίζονται στη λογική.

Κοιτάζοντας το μέλλον, η DeepSeek σχεδιάζει να κυκλοφορήσει εκδόσεις ανοιχτού κώδικα των μοντέλων R1 της και να επεκτείνει την πρόσβαση μέσω API, συνεχίζοντας τη δέσμευσή της στην κοινότητα τεχνητής νοημοσύνης ανοιχτού κώδικα. Η εταιρεία υποστηρίζεται από την High-Flyer Capital Management, η οποία ακολουθεί μια στρατηγική ενσωμάτωσης της τεχνητής νοημοσύνης στις εμπορικές αποφάσεις. Οι λειτουργίες της High-Flyer περιλαμβάνουν σημαντικές επενδύσεις σε υποδομές υλικού, με συμπλέγματα GPU της Nvidia A100 για εκπαίδευση μοντέλων.


Πίστωση επιλεγμένης εικόνας: DeepSeek



VIA: DataConomy.com

Dimitris Marizas
Dimitris Marizashttps://techfreak.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Δημοφιλείς Άρθρα

Τελευταία Νέα