Το DeepSeek αμφισβητεί το ChatGPT O1

21 Νοεμβρίου, 2024

2

Το κινεζικό εργαστήριο τεχνητής νοημοσύνης DeepSeek ανακοίνωσε την κυκλοφορία του μοντέλου DeepSeek-R1-Lite-Preview, το οποίο ισχυρίζεται ότι ανταγωνίζεται το μοντέλο o1 του OpenAI. Το νέο μοντέλο προσφέρει ένα μοναδικό χαρακτηριστικό: τη διαφάνεια στη διαδικασία συλλογισμού του, που επιτρέπει στους χρήστες να βλέπουν τις μεθόδους επίλυσης προβλημάτων βήμα προς βήμα. Αυτή η ανακοίνωση έρχεται δύο μήνες αφότου το OpenAI παρουσίασε το μοντέλο ο1-προεπισκόπησης, υπογραμμίζοντας έναν αυξανόμενο ανταγωνισμό στον συλλογιστικό χώρο της τεχνητής νοημοσύνης.

Το DeepSeek λανσάρει το συλλογιστικό μοντέλο για να ανταγωνιστεί το OpenAI

Το DeepSeek-R1-Lite-Preview είναι προσβάσιμο μέσω ενός web chatbot, DeepSeek Chatόπου οι χρήστες μπορούν να αλληλεπιδρούν με το μοντέλο, περιορίζεται σε 50 μηνύματα την ημέρα. Ενώ δεν έχουν ακόμη κυκλοφορήσει λεπτομερή σημεία αναφοράς και κάρτα μοντέλου, οι πρώτες εκτιμήσεις δείχνουν ότι το μοντέλο συλλογιστικής παρουσιάζει επιδόσεις συγκρίσιμες με τα σημεία αναφοράς του OpenAI για εργασίες AIME και MATH. Η DeepSeek βεβαιώνει ότι επιτυγχάνει υπερσύγχρονη ακρίβεια 91,6% στο σημείο αναφοράς MATH.

Η εισαγωγή του DeepSeek-R1 έρχεται καθώς οι παραδοσιακοί νόμοι κλιμάκωσης στην τεχνητή νοημοσύνη, οι οποίοι υποδηλώνουν ότι η αύξηση των δεδομένων και η υπολογιστική ισχύς θα βελτιώσουν την απόδοση, αρχίζουν να παρουσιάζουν φθίνουσες αποδόσεις. Σε απάντηση, οι εταιρείες αναζητούν νέες προσεγγίσεις, όπως αυτές που βασίζονται σε μοντέλα λογικής όπως το DeepSeek-R1. Σε αντίθεση με τα παραδοσιακά μοντέλα, τα συλλογιστικά μοντέλα επεκτείνουν την υπολογιστική τους επεξεργασία κατά τη διάρκεια της εξαγωγής συμπερασμάτων για να ενισχύσουν τις δυνατότητες λήψης αποφάσεων.

Παρά τα πολλά υποσχόμενα χαρακτηριστικά του, το νέο μοντέλο τηρεί επίσης αυστηρά πρωτόκολλα λογοκρισίας που είναι κοινά στην κινεζική τεχνολογία AI. Οι παρατηρήσεις επιβεβαίωσαν ότι το DeepSeek-R1 αποφεύγει ευαίσθητα πολιτικά θέματα, όπως έρευνες σχετικά με τον Xi Jinping ή την Ταϊβάν. Οι χρήστες έχουν αναφέρει επιτυχημένες προσπάθειες παράκαμψης αυτών των περιορισμών, επιτρέποντας στο μοντέλο να παρέχει αφιλτράριστο περιεχόμενο σε ορισμένα σενάρια. Αυτή η πτυχή εγείρει συνεχή ερωτήματα σχετικά με την ισορροπία μεταξύ λειτουργικότητας και κανονιστικής συμμόρφωσης για μοντέλα τεχνητής νοημοσύνης που αναπτύχθηκαν σε περιοχές με αυστηρή κυβερνητική εποπτεία.

Η DeepSeek ισχυρίζεται ότι το μοντέλο DeepSeek-R1 —ή πιο συγκεκριμένα, το DeepSeek-R1-Lite-Preview— ταιριάζει με το μοντέλο o1-preview του OpenAI σε δύο εξέχοντα σημεία αναφοράς AI, το AIME και το MATH. Το AIME αξιολογεί την απόδοση ενός μοντέλου χρησιμοποιώντας άλλα μοντέλα τεχνητής νοημοσύνης, ενώ τα ΜΑΘ δοκιμάζουν την επίλυση προβλημάτων με μια συλλογή προβλημάτων λέξεων. Ωστόσο, το μοντέλο έχει τα μειονεκτήματά του. Μερικοί χρήστες στο X επισήμανε ότι το DeepSeek-R1, όπως και το o1, αντιμετωπίζει προκλήσεις με tic-tac-toe και άλλες εργασίες που βασίζονται στη λογική.

Κοιτάζοντας το μέλλον, η DeepSeek σχεδιάζει να κυκλοφορήσει εκδόσεις ανοιχτού κώδικα των μοντέλων R1 της και να επεκτείνει την πρόσβαση μέσω API, συνεχίζοντας τη δέσμευσή της στην κοινότητα τεχνητής νοημοσύνης ανοιχτού κώδικα. Η εταιρεία υποστηρίζεται από την High-Flyer Capital Management, η οποία ακολουθεί μια στρατηγική ενσωμάτωσης της τεχνητής νοημοσύνης στις εμπορικές αποφάσεις. Οι λειτουργίες της High-Flyer περιλαμβάνουν σημαντικές επενδύσεις σε υποδομές υλικού, με συμπλέγματα GPU της Nvidia A100 για εκπαίδευση μοντέλων.

Πίστωση επιλεγμένης εικόνας: DeepSeek

VIA: DataConomy.com

Προηγούμενο άρθρο

Προσφορά Μαύρης Παρασκευής: Έως -50% σε SSD Samsung στο Amazon

Επόμενο άρθρο

Η Microsoft ανακοινώνει διακοπή υπηρεσίας phishing με ONNX

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Το DeepSeek αμφισβητεί το ChatGPT O1

Το DeepSeek λανσάρει το συλλογιστικό μοντέλο για να ανταγωνιστεί το OpenAI

Η Microsoft ανακοινώνει διακοπή υπηρεσίας phishing με ONNX

Κατάρρευση Paypal: Η ανάλυση των Techmaniacs

Top Tech Deals from Amazon, Walmart, Apple & More: Black Friday Specials

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Δημοφιλείς Άρθρα

ΟΛΥΜΠΙΑΚΟΣ – ΜΠΑΣΚΟΝΙΑ Live Streaming | Δες το Εδώ Ζωντανά

Greek Live Channels και Live Streaming

HUAWEI MatePad Pro 12.2 PaperMatte Edition: Ένας ανεξάντλητος καμβάς δυνατοτήτων…

Οι Χάρτες Google μετατρέπονται σε γαλαζοπράσινο χρώμα

Τελευταία Νέα

Η Microsoft ανακοινώνει διακοπή υπηρεσίας phishing με ONNX

Προσφορά Μαύρης Παρασκευής: Έως -50% σε SSD Samsung στο Amazon

Αντιμετωπίζοντας το InfoCom: Οι Έλληνες προετοιμάζονται για τις εκπτώσεις.

Ακύρωση του F1 Manager 2025

Επιλογές Συντακτών

Θάνατος του Thomas Kurtz, Συνιδρυτή της BASIC: Ένας Πρωτοπόρος που Άλλαξε τον Κόσμο της Πληροφορικής

Roblox Ενισχύει τα Μέτρα Ασφάλειας: Πώς οι Γονείς θα Μπορούν να Ελέγχουν τη Δραστηριότητα των Παιδιών τους

Xiaomi vs Apple: Η Κινεζική Εταιρεία Κατακτά τη Δεύτερη Θέση στην Παγκόσμια Αγορά Smartphones

Τυχαία Άρθρα

Το 10ο Συνέδριο EsoDiMeSO

Εκπτωτική τιμή για τη φριτέζα φούρνου Breville από Black Friday

Ανακοίνωση απολύσεων και εστίαση σε παιχνίδια τρίτων από τους δημιουργούς του SteamWorld

POPULAR CATEGORY

ABOUT US

FOLLOW US