Έλλειψη δεδομένων στην εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης, υποστηρίζει ο Μασκ - TechFreak.GR
Έλλειψη δεδομένων στην εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης, υποστηρίζει ο Μασκ - TechFreak.GR


Οι εταιρείες που δραστηριοποιούνται στην τεχνητή νοημοσύνη έχουν ξεμείνει από δεδομένα για την εκπαίδευση των μοντέλων τους και έχουν «εξαντλήσει» το άθροισμα της ανθρώπινης γνώσης, δήλωσε ο Έλον Μασκ.

Ο πλουσιότερος άνθρωπος στον κόσμο πρότεινε ότι οι εταιρείες τεχνολογίας θα πρέπει να στραφούν σε «συνθετικά» δεδομένα – ή υλικό που δημιουργείται από μοντέλα τεχνητής νοημοσύνης – για να κατασκευάσουν και να τελειοποιήσουν νέα συστήματα, μια διαδικασία που ήδη λαμβάνει χώρα με την ταχέως αναπτυσσόμενη τεχνολογία.

Ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «παραισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων

«Το σωρευτικό άθροισμα της ανθρώπινης γνώσης έχει εξαντληθεί στην εκπαίδευση AI. Αυτό συνέβη βασικά πέρυσι», είπε ο Μασκ σε μια συνέντευξη που μεταδόθηκε ζωντανά στην πλατφόρμα κοινωνικής δικτύωσης X.

Μοντέλα τεχνητής νοημοσύνης όπως το μοντέλο GPT-4o που τροφοδοτεί το chatbot ChatGPT «εκπαιδεύονται» σε μια τεράστια γκάμα δεδομένων που λαμβάνονται από το διαδίκτυο, όπου στην πραγματικότητα μαθαίνουν να εντοπίζουν μοτίβα σε αυτές τις πληροφορίες – επιτρέποντάς τους να προβλέψουν, για παράδειγμα, την επόμενη λέξη σε μια πρόταση.

Συνθετικά δεδομένα για την τεχνητή νοημοσύνη

Ο Μασκ είπε ότι ο «μόνος τρόπος» για να αντιμετωπιστεί η έλλειψη υλικού από πηγές για την εκπαίδευση νέων μοντέλων ήταν να προχωρήσουμε σε συνθετικά δεδομένα που δημιουργούνται από την τεχνητή νοημοσύνη.

Αναφερόμενος στην εξάντληση των πηγών δεδομένων, είπε: «Ο μόνος τρόπος για να το συμπληρώσεις είναι με συνθετικά δεδομένα όπου… θα γράψει ένα δοκίμιο ή θα καταλήξει σε μια διατριβή και μετά θα βαθμολογήσει τον εαυτό του και… θα περάσει από αυτή τη διαδικασία αυτομάθησης».

Η Meta, η ιδιοκτήτρια του Facebook και του Instagram, έχει χρησιμοποιήσει συνθετικά δεδομένα για να τελειοποιήσει το μεγαλύτερο μοντέλο τεχνητής νοημοσύνης Llama, ενώ η Microsoft χρησιμοποίησε επίσης περιεχόμενο κατασκευασμένο από AI για το μοντέλο Phi-4. Η Google και η OpenAI, η εταιρεία πίσω από το ChatGPT, έχουν επίσης χρησιμοποιήσει συνθετικά δεδομένα στην εργασία τους με τεχνητή νοημοσύνη.

Ωστόσο, ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «ψευδαισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων.

Τα δεδομένα υψηλής ποιότητας και ο έλεγχός τους είναι ένα από τα νομικά πεδία μάχης στην έκρηξη της τεχνητής νοημοσύνης. Η OpenAI παραδέχτηκε πέρυσι ότι θα ήταν αδύνατο να δημιουργηθούν εργαλεία όπως το ChatGPT χωρίς πρόσβαση σε υλικό που προστατεύεται από πνευματικά δικαιώματα, ενώ οι βιομηχανίες περιεχομένου και οι εκδότες απαιτούν αποζημίωση για τη χρήση του προϊόντος τους στη διαδικασία εκπαίδευσης των μοντέλων.

Πηγή: OT.gr



VIA: Πηγή Άρθρου


Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ


Ακολουθήστε το TechFreak.gr στο Google News

Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.


ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ