Περιεχόμενα Άρθρου
Τα ρομπότ του 2024 είναι πολύ πιο περίπλοκα από τους προκατόχους τους που εργάζονταν στο εργοστάσιο με ένα όπλο. Τα σύγχρονα ρομπότ μπορούν να τρέξουν, να πηδήξουν, να κάνουν τα split, ακόμη και να κρατήσουν πατημένη μια βασική συνομιλία. Ταυτόχρονα, παρά τις δεκαετίες τεχνικών προόδων και δισεκατομμυρίων δολαρίων επενδύσεων, ακόμη και τα πιο προηγμένα συστήματα ρομπότ εξακολουθούν να αγωνίζονται να κάνουν πολλές καθημερινές εργασίες που οι άνθρωποι θεωρούν δεδομένες, όπως το δίπλωμα ρούχων ή η στοίβαξη μπλοκ. Κατά ειρωνικό τρόπο, τα ρομπότ είναι πολύ κακά στο να κάνουν πράγματα που θεωρούμε εύκολα. Αυτό ισχύει προς το παρόν τουλάχιστον. Οι νέες εξελίξεις στην εκπαίδευση των ρομπότ εμπνέονται από μαζικά δημοφιλή μοντέλα μεγάλων γλωσσών, όπως το ChatGPT, μπορεί να το αλλάξουν… τελικά.
Τα ρομπότ υπάρχουν παντού, αλλά οι ικανότητές τους είναι περιορισμένες
Τα ρομπότ γίνονται ολοένα και πιο ορατά στην καθημερινή ζωή. Τα εργοστάσια και οι εγκαταστάσεις παραγωγής έχουν χρησιμοποιήσει απλούς ρομποτικούς βραχίονες μίας εργασίας για δεκαετίες για να αυξήσουν γρήγορα την παραγωγή. Στον τομέα της εφοδιαστικής, μεγάλες μάρκες όπως η Amazon και η Walmart έχουν ήδη ελαφρώς πιο προηγμένα ρομπότ που εργάζονται μαζί με ανθρώπους για να μετακινούν βαριά αντικείμενα και να ταξινομούν πακέτα. Χρήσεις της DHL Ρομπότ «Stretch» της Boston Dynamics για να πιάσουν κουτιά και να τα μετακινήσουν σε συστήματα μεταφοράς. Κάποια γρήγορα και χαλαρά εστιατόρια όπως το Denny’s έχουν ακόμη πειραματίστηκε με bot παράδοσης πολλαπλών ραφιών που ανακατεύουν πιάτα με φαγητό σε τραπέζια. Η Chipotle έχει το δικό της πρωτότυπο αβοκάντο καθοδηγούμενο από τεχνητή νοημοσύνη. Μόνο το Amazon φέρεται να έχει ήδη πάνω από 750.000 ρομπότ στις δραστηριότητές τηςκαι αυτός ο αριθμός αυξάνεται.
Όλα αυτά τα συστήματα είναι εντυπωσιακά με τους δικούς τους ιδιαίτερους τρόπους, αλλά κανένα από αυτά δεν μπορεί να ανταγωνιστεί έναν άνθρωπο όταν πρόκειται για πολλές εγκόσμιες εργασίες. Ένα προηγμένο μοντέλο υπολογιστή με το κατάλληλο λογισμικό θα μπορούσε εύκολα να διδάξει ακόμα και τον πιο έμπειρο σκακιστή, αλλά θα χρειαζόταν ένα κατόρθωμα μηχανικής για να διαλέξει αυτό το ίδιο ρομπότ ένα κομμάτι σκακιού από ένα σωριασμένο σωρό. Τα ρομπότ που φτιάχνουν καφέ θα μπορούσαν πιθανότατα να ξεφορτωθούν σε ένα πιο γρήγορο κλιπ από έναν άνθρωπο barista, αλλά θα δυσκολευόταν να βρει ένα παλιό, χλιαρό φλιτζάνι κάπου σε ένα δωμάτιο και να το ξαναζωντανέψει στο φούρνο μικροκυμάτων.
«Τα ρομπότ μπορούν να πάνε μέχρι τον Άρη, αλλά δεν μπορούν να πάρουν τα ψώνια»
Γενικά, τα ρομπότ είναι καλά σε πολλά πράγματα με τα οποία παλεύουν οι άνθρωποι και κακά σε πολλά πράγματα που οι άνθρωποι βρίσκουν εύκολα. Αυτή η γενική παρατήρηση, γνωστή από τους ειδικούς στον κόσμο της ρομποτικής ως «Το παράδοξο του Moravec” χρονολογείται από ένα βιβλίο του 1988 του καθηγητή του Carnegie Mellon, Hans Moravec. Παρέμεινε απογοητευτικά αληθινό σχεδόν σαράντα χρόνια μετά. Τι ακριβώς συμβαίνει λοιπόν εδώ; Ο ρομποτιστής και ο καθηγητής του Πανεπιστημίου της Καλιφόρνια στο Μπέρκλεϋ Κεν Γκόλντμπεργκ προσπάθησαν να αναλύσουν τι εξηγεί αυτά τα «αδέξια ρομπότ» κατά τη διάρκεια μιας ομιλίας TED πέρυσι.
Ο Goldberg είπε ότι τρεις κύριες προκλήσεις για τα ρομπότ είναι θέματα αντίληψης, ελέγχου και φυσικής. Από την πλευρά της αντίληψης, τα ρομπότ βασίζονται σε κάμερες και άλλους αισθητήρες όπως το lidar για να «δουν» τον κόσμο γύρω τους. Αν και αυτά τα εργαλεία βελτιώνονται συνεχώς, εξακολουθούν να μην είναι τόσο αξιόπιστα όσο τα ανθρώπινα μάτια. Γι’ αυτό τα λεγόμενα αυτοοδηγούμενα αυτοκίνητα είναι γνωστό ότι κάνουν λάθη εάν εκτεθούν σε φωτεινά φώτα που αναβοσβήνουν ή, όπως συνέβη στο Σαν Φρανσίσκο πέρυσι, άλλα αυτοκίνητα με πορτοκαλί κώνους κυκλοφορίας στο καπό τους. Σύγχρονα ρομπότ διαλογής αποθήκης όπως Το Σπουργίτι του Αμαζονίουεν τω μεταξύ, είναι αρκετά ικανοί όταν περιορίζονται στις στενές παραμέτρους τους, σύμφωνα με πρόσφατο New York Times ιστορίααλλά σύμφωνα με πληροφορίες αγωνίζονται με πιο «στοχευμένες επιλογές».
[Related: Researchers tortured robots to test the limits of human empathy]
«Μια παραγγελία από την Amazon θα μπορούσε να είναι οτιδήποτε, από ένα μαξιλάρι, ένα βιβλίο, ένα καπέλο, ένα ποδήλατο», δήλωσε η καθηγήτρια ρομποτικής στο Πανεπιστήμιο του Κέμπριτζ, Fumiya Iida. είπε σε δήλωση. «Για έναν άνθρωπο, είναι γενικά εύκολο να σηκώσει ένα αντικείμενο χωρίς να το πέσει ή να το συνθλίψει – γνωρίζουμε ενστικτωδώς πόση δύναμη πρέπει να χρησιμοποιήσουμε. Αλλά αυτό είναι πραγματικά δύσκολο για ένα ρομπότ».
Αυτό οδηγεί στο δεύτερο πρόβλημα που επισημαίνει ο Goldberg: τον έλεγχο. Αν και οι άνθρωποι και πολλά ζώα όπως οι σκύλοι έχουν επωφεληθεί από εκατομμύρια χρόνια εξέλιξης για να συγχρονίσουν την όρασή μας με τα άκρα μας, τα ρομπότ δεν έχουν την ίδια πολυτέλεια. Οι κάμερες και οι αισθητήρες σε ένα μέρος ενός ρομπότ μπορεί συχνά να μην συγχρονίζονται με τους μηχανικούς βραχίονες ή τις λαβές που επιφορτίζονται με το χειρισμό και τα αντικείμενα. Αυτή η αναντιστοιχία μπορεί να οδηγήσει τα ρομπότ να ρίχνουν ξαφνικά αντικείμενα. Αυτός είναι μέρος του λόγου για τον οποίο το ρομπότ που σφεντάει πιάτα με αυγά και μπέικον στους πελάτες του Ντένι φέρνει μόνο το πιάτο στο τραπέζι. Ένας άνθρωπος σερβιτόρος πρέπει ακόμα να πιάσει τα πιάτα και να τα παραδώσει στο εστιατόριο.
Αυτό δεν εμπόδισε κάποιους να προσπαθούν να φανταστούν αυτές τις δυνατότητες να υπάρχουν. Κατά τη διάρκεια μιας δημοσιογραφικής εκδήλωσης που παρακολουθήθηκε ευρέως στο Warner Brothers Studios νωρίτερα φέτοςτα πολυδιαφημισμένα ανθρωποειδή ρομπότ «Optimus» του Tesla κυκλοφόρησαν σε όλο τον χώρο των εκδηλώσεων ελέγχοντας ταυτότητες, φτιάχνοντας κοκτέιλ και εντυπωσιακές συζητήσεις με τους καλεσμένους. Στην πραγματικότητα, αυτές οι «αυτόνομες» μηχανές ήταν σχεδόν εξίσου αληθινές με τις ψεύτικες σκηνές του Χόλιγουντ που τις περιέβαλλαν. Η αναφορά μετά το συμβάν αποκάλυψε ότι τα ρομπότ ήταν στην πραγματικότητα τηλεχειρίζεται από κοντινούς εργάτες της Tesla. Αλλά ενώ αυτή η υπερβολική τέχνη της παράστασης είναι par για το μάθημα για έργα Muskεπισημαίνει επίσης ένα μεγαλύτερο πρόβλημα που αντιμετωπίζει η ρομποτική. Ο τύπος των εργασιών που απέτυχε να εκτελέσει το Optimus στην εκδήλωση – ο ελιγμός αντικειμένων και η έκχυση απλών μικτών ποτών – είναι στην πραγματικότητα πολύ δύσκολοι για τα ρομπότ γενικά.
Ο Optimus φτιάξε μου ένα ποτό, σε παρακαλώ.
Αυτό δεν είναι εξ ολοκλήρου AI. Ένας άνθρωπος βοηθά εξ αποστάσεως.
Πράγμα που σημαίνει ημέρα τεχνητής νοημοσύνης του χρόνου, όπου θα δούμε πόσο γρήγορα μαθαίνει το Optimus. pic.twitter.com/CE2bEA2uQD
— Ρόμπερτ Σκόμπλ (@Scobleizer) 11 Οκτωβρίου 2024
Το τελευταίο ζήτημα, η φυσική, είναι αυτό που ούτε οι άνθρωποι ούτε τα ρομπότ μπορούν πραγματικά να ελέγξουν. Στη διάλεξή του, ο Goldberg δίνει το παράδειγμα ενός ρομπότ που σπρώχνει ένα μπουκάλι πάνω από ένα τραπέζι. Το ρομπότ χρησιμοποίησε την ίδια δύναμη και έσπρωχνε το μπουκάλι, με τον ίδιο τρόπο, κάθε φορά, αλλά πάντα κατέληγε σε ελαφρώς διαφορετική θέση. Αυτή η διακύμανση εξαρτάται εν μέρει από τη μικροσκοπική τοπογραφία επιφάνειας του τραπεζιού καθώς το μπουκάλι γλιστράει κατά μήκος του. Οι άνθρωποι αντιμετωπίζουν αυτές τις μικρές παραλλαγές πολλές φορές κάθε μέρα, αλλά ενστικτωδώς καταλαβαίνουμε πώς να τις διορθώσουμε μέσω της εμπειρίας.
Ως επί το πλείστον, τα ρομπότ αρχίζουν επίσης να δυσκολεύονται μόλις τους ανατεθεί να κάνουν οτιδήποτε έξω από το στενό σύνολο δοκιμαστικών περιβαλλόντων για τα οποία δημιουργήθηκε. Αν και ένας άνθρωπος πιθανότατα θα μπορούσε να καταλάβει πώς να δραπετεύσει από ένα τυχαίο δωμάτιο, ακόμη και ένα πολύ κινητό ρομπότ θα μπερδευτεί και θα έχανε χρόνο ψάχνοντας για πόρτες σε παράλογα μέρη όπως τα δάπεδα και η οροφή. Κατά ειρωνικό τρόπο, οι μικρές αποχρώσεις του σαν αυτές που αποδεικνύονται πιο δύσκολο για τα ρομπότ να αντιληφθούν από φαινομενικά πολύ πιο εντυπωσιακά κατορθώματα όπως η ανύψωση βαρέων αντικειμένων ή ακόμα και τα διαστημικά ταξίδια.
«Τα ρομπότ μπορούν να πάνε μέχρι τον Άρη, αλλά δεν μπορούν να πάρουν τα παντοπωλεία», πρόσθεσε η Iida.
Διδάσκοντας τα ρομπότ να μαθαίνουν το ένα από το άλλο
Αυτό είναι το γενικό δίλημμα μέχρι τώρα, αλλά οι ερευνητές που εργάζονται επί του παρόντος στο λεγόμενο “εγκεφάλους ρομπότ γενικής χρήσηςΕλπίζουν ότι μπορούν να πάρουν μερικά από τα διδάγματα από τα πρόσφατα μεγάλα μοντέλα γλώσσας και να τα χρησιμοποιήσουν για να φτιάξουν πολύ πιο προσαρμόσιμα ρομπότ. Το πεδίο του Η ρομποτική έχει σταματήσει σε σύγκριση με το λογισμικό και την τεχνητή νοημοσύνη τα τελευταία χρόνια κυρίως λόγω της διαφοράς στα δεδομένα εκπαίδευσης. Οι LLMs όπως το GPT του OpenAI μπόρεσαν να κάνουν τόσο μεγάλα άλματα επειδή είχαν εκπαιδευτεί σε τρισεκατομμύρια παραμέτρους άρθρων, βιβλίων, βίντεο και εικόνων που είχαν αφαιρεθεί από το Διαδίκτυο. Το αν αυτό ήταν νόμιμο ή όχι αμφισβητείται στο δικαστήριο.
Πέρα από τα νομικά ζητήματα, δεν υπάρχει πραγματικό ισοδύναμο με το Διαδίκτυο όταν πρόκειται για δεδομένα εκπαίδευσης ρομπότ. Δεδομένου ότι τα ρομπότ είναι φυσικά αντικείμενα, η συλλογή δεδομένων για το πώς εκτελούν την εργασία συχνά απαιτεί χρόνο και φυλάσσεται σε εργαστήρια ή άλλους περιορισμένους χώρους. Τα ρομπότ είναι επίσης ως επί το πλείστον ειδικά για εργασίες, επομένως τα δεδομένα από μια μηχανή φόρτωσης φορτίου μπορεί να μην βοηθήσουν πραγματικά στη βελτίωση ενός ρομπότ που επιλέγει αντικείμενα από έναν κάδο.
Αλλά αρκετές ομάδες προσπαθούν τώρα να δουν εάν είναι δυνατό να συγκεντρωθούν ουσιαστικά δεδομένα που συλλέγονται από πολλούς διαφορετικούς τύπους ρομπότ σε ένα ενιαίο βαθύ νευρωνικό δίκτυο που μπορεί στη συνέχεια να χρησιμοποιηθεί για την εκπαίδευση νέων ρομπότ γενικής χρήσης. Μία από αυτές τις προσπάθειες, που ονομάζεται έργο RT-Xεπιδιώκεται από ερευνητές στη Google, στο UC Berkeley και σε άλλα 32 εργαστήρια στη Βόρεια Αμερική, την Ευρώπη και την Ασία. Αυτοί οι ερευνητές έχουν ήδη δημιουργήσει αυτό που λένε το “μεγαλύτερο σύνολο δεδομένων ανοιχτού κώδικα με πραγματικές ρομποτικές ενέργειες που υπάρχουν”.
Το σύνολο δεδομένων περιλαμβάνει εμπειρίες πραγματικού κόσμου από ρομπότ που ολοκληρώνουν περίπου 500 διαφορετικούς τύπους εργασιών. Οι ερευνητές μπορούν στη συνέχεια να πάρουν ένα ρομπότ και να χρησιμοποιήσουν τη βαθιά εκμάθηση για να το εκπαιδεύσουν σε αυτό το σύνολο δεδομένων σε ένα προσομοιωμένο περιβάλλον. Ο Goldberg περιέγραψε διαδικασίες όπως αυτή ως παρόμοιες με ένα ρομπότ που «ονειρεύεται». Στην περίπτωση RT-X, τα ρομπότ είναι σε θέση να αναγνωρίζουν δεδομένα εκπαίδευσης που σχετίζονται με τον συγκεκριμένο στόχο τους, όπως βελτιώσεις στους μηχανικούς βραχίονες, και να τα χρησιμοποιούν για να βελτιωθούν. Γράφοντας μέσα IEEE Spectrumο ερευνητής της Google Sergey Levine και ο επιστήμονας της DeepMind, Karol Hausman, συνέκριναν αυτό με έναν άνθρωπο που μαθαίνει να οδηγεί ποδήλατο ή να οδηγεί αυτοκίνητο χρησιμοποιώντας τον ίδιο εγκέφαλο.
«Το μοντέλο που εκπαιδεύεται στο σύνολο δεδομένων RT-X μπορεί απλά να αναγνωρίσει τι είδους ρομπότ ελέγχει από αυτό που βλέπει στην παρατήρηση της κάμερας του ίδιου του ρομπότ», έγραψαν οι ερευνητές.
Τα ρομποτικά ελπίζουμε να είναι οι πιο γενικευμένοι «εγκέφαλοι» που θα μπορούσαν να κλιμακωθούν καθώς συλλέγονται περισσότερα δεδομένα και πιθανώς να κάνουν τα νέα ανθρωποειδή ρομπότ όπως αυτά που παράγονται από τη Figure και την Tesla πιο ικανά να προσαρμοστούν στο περιβάλλον τους. Έχουμε ήδη αρχίσει να παίρνουμε μια γεύση για το πώς θα μπορούσε να μοιάζει. Τον περασμένο μήνα, η Boston Dynamics κυκλοφόρησε ένα βίντεο που δείχνει το ρομπότ Atlas σε σχήμα ανθρώπου να εντοπίζει και να κινεί τα καλύμματα του κινητήρα γύρω από μια αίθουσα επίδειξης.
Η Atlas ήταν σε θέση να ολοκληρώσει αυτές τις εργασίες, ισχυρίζεται η Boston Dynamics, εντελώς αυτόνομα και χωρίς καμία «προδιαγεγραμμένη ή τηλεχειριζόμενη κίνηση». Το κρίσιμο είναι ότι το demo δείχνει ακόμη και τον Atlas να κάνει λάθη, αλλά στη συνέχεια να τα προσαρμόζει και να τα διορθώνει γρήγορα.
Σίγουρα, μπορεί τώρα να φτιάχνει Negronis ή να διπλώνει ρούχα, αλλά παρέχει μια γεύση για το πού μπορεί να κατευθύνεται η βιομηχανία.
VIA: popsci.com