Εντυπωσιακά ευρήματα από μελέτη που δημοσιεύθηκε στο BMJ δείχνουν ότι τα κορυφαία μοντέλα που χρησιμοποιούν Τεχνητή Νοημοσύνη (ΤΝ), γνωστά και ως μεγάλα γλωσσικά μοντέλα (Large Language Models – LLMs), εμφανίζουν γνωστική εξασθένηση που θυμίζει πρώιμα συμπτώματα άνοιας.
Η μελέτη αυτή αμφισβητεί την κοινή παραδοχή ότι η ΤΝ θα αντικαταστήσει σύντομα τους ανθρώπινους γιατρούς, τονίζοντας τους περιορισμούς της σε κλινικές εφαρμογές που απαιτούν οπτικές και εκτελεστικές δεξιότητες, σύμφωνα με πληροφορίες.
Άνοια – Γνωστική εξασθένηση στα Μεγάλα Γλωσσικά Μοντέλα
Σύμφωνα με τη μελέτη, σχεδόν όλα τα κορυφαία γλωσσικά μοντέλα παρουσίασαν σημάδια ήπιας γνωστικής εξασθένησης όταν εξετάστηκαν με τεστ που χρησιμοποιούνται ευρέως για τη διάγνωση πρώιμων συμπτωμάτων άνοιας σε ανθρώπους.
Προηγούμενα μοντέλα, όπως και οι γηραιότεροι άνθρωποι, σημείωσαν χειρότερες επιδόσεις. Οι συγγραφείς της μελέτης επισημαίνουν: «Τα ευρήματα προκαλούν την παραδοχή ότι η Τεχνητή Νοημοσύνη θα αντικαταστήσει σύντομα τους ανθρώπινους γιατρούς».
Τεχνητή νοημοσύνη: Η δοκιμή της γνωστικής ικανότητάς της
Οι ερευνητές χρησιμοποίησαν το τεστ Montreal Cognitive Assessment (MoCA), το οποίο αξιολογεί γνωστικές δεξιότητες όπως η προσοχή, η μνήμη, η γλώσσα, οι οπτικοχωρικές δεξιότητες και οι εκτελεστικές λειτουργίες.
Το τεστ αποτελείται από σύντομες δοκιμασίες και ερωτήσεις, με μέγιστη βαθμολογία 30. Μια βαθμολογία 26 ή υψηλότερη θεωρείται φυσιολογική.
Τα αποτελέσματα για τα κορυφαία γλωσσικά μοντέλα ήταν τα εξής:
- ChatGPT 4o (OpenAI): 26/30 (η υψηλότερη βαθμολογία).
- ChatGPT 4 (OpenAI) και Claude (Anthropic): 25/30.
- Gemini 1.0 (Alphabet): 16/30.
Αδυναμίες σε οπτικές και εκτελεστικές δεξιότητες της AI
Όλα τα μοντέλα ΤΝ σημείωσαν χαμηλές επιδόσεις σε δοκιμασίες που απαιτούν οπτικοχωρικές δεξιότητες και εκτελεστική λειτουργία, όπως:
- Η δοκιμασία σύνδεσης (όπου πρέπει να συνδέσουν αριθμούς και γράμματα με συγκεκριμένη σειρά).
- Η σχεδίαση ενός ρολογιού που δείχνει μια συγκεκριμένη ώρα.
Ειδικότερα, τα μοντέλα Gemini απέτυχαν στο τεστ καθυστερημένης ανάκλησης, το οποίο απαιτεί την απομνημόνευση μιας ακολουθίας πέντε λέξεων.
Ωστόσο, όλα τα μοντέλα απέδωσαν καλά σε τομείς όπως:
- Ονομασία.
- Προσοχή.
- Γλώσσα.
- Αφαίρεση.
Επιπλέον, μόνο το ChatGPT 4o κατάφερε να ολοκληρώσει με επιτυχία το τεστ Stroop στην ασύμφωνη φάση του, που μετρά τον χρόνο αντίδρασης σε καταστάσεις παρεμβολής.
Η σημασία για κλινικές εφαρμογές της ΤΝ
Παρά τα ανθρώπινα χαρακτηριστικά που ενέχει η εξασθένησή τους, οι διαφορές ανάμεσα στον ανθρώπινο εγκέφαλο και στα μεγάλα γλωσσικά μοντέλα παραμένουν ουσιαστικές. Οι ερευνητές τονίζουν ότι οι αποτυχίες της ΤΝ σε οπτικές και εκτελεστικές δοκιμασίες αποτελούν σημαντικό περιορισμό για τη χρήση της σε κλινικές εφαρμογές.
Όπως αναφέρουν χαρακτηριστικά:
«Οι νευρολόγοι δεν πρόκειται να αντικατασταθούν από μεγάλα γλωσσικά μοντέλα σύντομα. Αντιθέτως, τα ευρήματά μας δείχνουν ότι ίσως βρεθούν να αντιμετωπίζουν νέους, εικονικούς ασθενείς – μοντέλα ΤΝ με γνωστικές εξασθενήσεις».
Τα ευρήματα της μελέτης υπογραμμίζουν ότι, παρά την πρόοδο της Τεχνητής Νοημοσύνης, υπάρχουν ακόμη σημαντικοί περιορισμοί που πρέπει να ληφθούν υπόψη. Η ΤΝ μπορεί να είναι πολύτιμη για τη διαχείριση δεδομένων και την υποστήριξη λήψης αποφάσεων, αλλά οι γνωστικές και εκτελεστικές της αδυναμίες καθιστούν αναγκαία την παρουσία ανθρώπινων γιατρών.
Αναφορά Μελέτης
“Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis” by Roy Dayan, Benjamin Uliel and Gal Koplewitz, 20 December 2024, BMJ
VIA: Πηγή Άρθρου
Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.