Κινεζική Deepseek R1: Ταρακουνά την AI - TechFreak.GR
Κινεζική Deepseek R1: Ταρακουνά την AI - TechFreak.GR


Το κινεζικό εργαστήριο τεχνητής νοημοσύνης DeepSeek προκάλεσε παγκόσμια έκπληξη αποκαλύπτοντας την τεχνική συνταγή πίσω από το προηγμένο μοντέλο του R1.

Η DeepSeek, ένα μικρό κινεζικό εργαστήριο τεχνητής νοημοσύνης, προκάλεσε παγκόσμια αίσθηση αποκαλύπτοντας τις τεχνικές προδιαγραφές του προηγμένου μοντέλου R1. Η εταιρεία, που ιδρύθηκε από τον διαχειριστή επενδυτικών κεφαλαίων Liang Wenfeng, παρουσίασε αναλυτικά τη μεθοδολογία κατασκευής ενός LLM με περιορισμένο προϋπολογισμό.

Το R1 έχει την ικανότητα αυτόματης μάθησης και βελτίωσης χωρίς ανθρώπινη επίβλεψη. Χρησιμοποιώντας μόλις 2.048 επεξεργαστές Nvidia H800 και επένδυση 5,6 εκατομμυρίων δολαρίων, η DeepSeek δημιούργησε ένα μοντέλο 671 δισεκατομμυρίων παραμέτρων, με κλάσμα του κόστους που απαιτείται από την OpenAI και τη Google.

Ο Liang ξεκίνησε το 2021 αγοράζοντας χιλιάδες μονάδες επεξεργασίας γραφικών Nvidia παράλληλα με τη διαχείριση του επενδυτικού του ταμείου High-Flyer. Η εμπειρία της ομάδας του στη βελτιστοποίηση της χρήσης των επεξεργαστών για συναλλαγές μετοχών αποδείχθηκε πολύτιμη για την ανάπτυξη του AI.

Η εταιρεία λειτουργεί με πρότυπο πανεπιστημιακού ερευνητικού κέντρου, προσελκύοντας κορυφαίους μηχανικούς AI από τα καλύτερα κινεζικά πανεπιστήμια. Η DeepSeek προσφέρει, μαζί με την ByteDance, τις υψηλότερες αμοιβές για μηχανικούς AI στην Κίνα.

Η αποκάλυψη του R1 πυροδότησε έντονες συζητήσεις στη Silicon Valley σχετικά με την ικανότητα των αμερικανικών εταιρειών να διατηρήσουν το τεχνολογικό τους προβάδισμα. Ο Ritwik Gupta, ερευνητής πολιτικής AI στο Πανεπιστήμιο Berkeley, επισημαίνει ότι “δεν υπάρχουν στεγανά στις δυνατότητες AI”.

Αναλυτές υποστηρίζουν ότι η Κίνα διαθέτει μεγαλύτερη δεξαμενή μηχανικών συστημάτων που κατανοούν πώς να βελτιστοποιούν τους υπολογιστικούς πόρους για την εκπαίδευση μοντέλων με χαμηλότερο κόστος. Ωστόσο, οι αμερικανικές εταιρίες δεν μένουν στάσιμες. Η OpenAI ανακοίνωσε κοινοπραξία με τη SoftBank για επένδυση 100 δισεκατομμυρίων δολαρίων σε AI υποδομές, ενώ η xAI του Elon Musk επεκτείνει τον υπερυπολογιστή Colossus με πάνω από 1 εκατομμύριο GPUs.

Η απαγόρευση εξαγωγής προηγμένων επεξεργαστών Nvidia στην Κίνα από τις ΗΠΑ ανάγκασε τις κινεζικές εταιρείες να αναπτύξουν καινοτόμους τρόπους μεγιστοποίησης της υπολογιστικής ισχύος των διαθέσιμων επεξεργαστών – ένα πρόβλημα που η ομάδα του Liang είχε ήδη λύσει.

Η στρατηγική της DeepSeek να μοιράζεται τις τεχνολογικές της ανακαλύψεις αντί να τις προστατεύει για εμπορικά οφέλη την καθιστά επικίνδυνο ανταγωνιστή. Η εταιρεία δεν έχει αναζητήσει εξωτερική χρηματοδότηση ούτε έχει κάνει σημαντικές κινήσεις για εμπορική αξιοποίηση των μοντέλων της.

Σύμφωνα με πρόσφατα στοιχεία, η DeepSeek απασχολεί πλέον περισσότερους από 200 ερευνητές και μηχανικούς στα γραφεία της σε Πεκίνο και Hangzhou.



VIA: Πηγή Άρθρου


Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ


Ακολουθήστε το TechFreak.gr στο Google News

Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.


ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ