Joe Hindy / Android Authority
TL;DR
- Η Niantic κατασκευάζει έναν νέο τύπο μοντέλου τεχνητής νοημοσύνης που μπορεί να κατανοήσει και να περιηγηθεί στον φυσικό κόσμο.
- Η εταιρεία εκπαιδεύει το AI της σε δεδομένα που συλλέγονται από τις εφαρμογές της για κινητά, όπως το Pokemon Go και το Scaniverse.
- Προτείνεται ότι αυτό το AI θα μπορούσε να χρησιμοποιηθεί για την υποστήριξη AR, ρομποτικής, δημιουργίας περιεχομένου και πολλά άλλα.
Η εταιρεία κατασκευής παιχνιδιών AR για κινητά Niantic εργάζεται επί του παρόντος σε έναν νέο τύπο μοντέλου τεχνητής νοημοσύνης που προορίζεται να βοηθήσει τους υπολογιστές να κατανοήσουν καλύτερα και να πλοηγηθούν σε φυσικούς χώρους. Όπως με κάθε AI, αυτό το μοντέλο απαιτεί δεδομένα για να εκπαιδευτεί. Φαίνεται ότι η εταιρεία βασίζεται στις άφθονες ποσότητες δεδομένων που παρέχουν οι παίκτες της για αυτήν την εργασία.
Εάν έχετε έστω και παροδικό ενδιαφέρον για το Pokemon, ίσως αναγνωρίσετε τη Niantic ως την εταιρεία πίσω από το δημοφιλές παιχνίδι AR Pokemon Go. Έχει επίσης δημιουργήσει μια σειρά από άλλα παιχνίδια και εφαρμογές AR, όπως η εφαρμογή σάρωσης 3D Scaniverse. Αυτά τα παιχνίδια και οι εφαρμογές λαμβάνουν σαρώσεις του περιβάλλοντος περιβάλλοντος για να λειτουργήσουν οι λειτουργίες AR τους.
Σε μια ανάρτηση ιστολογίου, που εντοπίστηκε για πρώτη φορά από 404 Μέσαη Niantic έχει ανακοινώθηκε ότι αναπτύσσει αυτό που αποκαλεί μεγάλο γεωχωρικό μοντέλο (LGM). Κάνοντας συγκρίσεις με μεγάλα γλωσσικά μοντέλα (LLM) – όπως το Gemini και το ChatGPT – που εκπαιδεύονται σε συλλογές κειμένου για να δημιουργήσουν γραπτή γλώσσα, η εταιρεία εξηγεί τα τρένα LGM της σε «δισεκατομμύρια εικόνες του κόσμου, όλες αγκυροβολημένες σε ακριβείς τοποθεσίες στον κόσμο». επιτρέποντας στους υπολογιστές να «αντιλαμβάνονται, να κατανοούν και να περιηγούνται στον φυσικό κόσμο». Η εταιρεία προτείνει ότι η τεχνολογία θα μπορούσε να χρησιμοποιηθεί για την υποστήριξη AR, ρομποτικής, δημιουργίας περιεχομένου και πολλά άλλα.
Όσον αφορά τα δεδομένα στα οποία εκπαιδεύεται αυτή η LGM, η Niantic αποκαλύπτει ότι χρησιμοποιεί τις σαρώσεις που συλλέγονται μέσω των παιχνιδιών για κινητά και του Scaniverse:
Τα τελευταία πέντε χρόνια, η Niantic έχει επικεντρωθεί στην κατασκευή του Visual Positioning System (VPS), το οποίο χρησιμοποιεί μια εικόνα από ένα τηλέφωνο για να προσδιορίσει τη θέση και τον προσανατολισμό του χρησιμοποιώντας έναν τρισδιάστατο χάρτη που δημιουργήθηκε από άτομα που σαρώνουν ενδιαφέρουσες τοποθεσίες στα παιχνίδια και στο Scaniverse μας.
Εάν έχετε παίξει Pokemon Go, πιθανότατα έχετε βιώσει αυτό το VPS μέσω της λειτουργίας Pokémon Playgrounds. Το Pokemon Playgrounds επιτρέπει σε έναν χρήστη να τοποθετήσει ένα Pokemon σε μια συγκεκριμένη τοποθεσία. Αυτά τα δεδομένα μπορούν να παραμείνουν σε αυτήν την τοποθεσία, επιτρέποντας σε άλλους παίκτες να αλληλεπιδρούν με το ψηφιακό πλάσμα όταν εισέρχονται σε αυτήν την περιοχή.
Σύμφωνα με την εταιρεία, έχει εκπαιδεύσει πάνω από 50 εκατομμύρια νευρωνικά δίκτυα, καθένα από τα οποία αντιπροσωπεύει μια συγκεκριμένη τοποθεσία ή γωνία θέασης. Αυτά τα δίκτυα είναι σε θέση να συμπιέσουν χιλιάδες εικόνες χαρτογράφησης, δημιουργώντας μια αναπαράσταση ενός φυσικού χώρου. Αυτή η αναπαράσταση μπορεί να προσφέρει ακριβή τοποθέτηση για μια τοποθεσία με “ακρίβεια σε επίπεδο εκατοστών” όταν δίνεται μια εικόνα ερωτήματος. Πολλαπλά δίκτυα θα μπορούσαν να συνδυάσουν αυτή τη γνώση για να χαρτογραφήσουν μια περιοχή και να κατανοήσουν οποιαδήποτε τοποθεσία, ακόμη και σε άγνωστες γωνίες.
Ένα παράδειγμα που παρέχει η εταιρεία είναι η στάση κοντά σε μια εκκλησία όπου έχει δει μόνο μια γωνία. Το LGM θα επέτρεπε σε ένα AI να συμπληρώσει τα κενά για το πώς θα μπορούσε να φαίνεται αυτό το κτίριο με βάση άλλες παρόμοιες εικόνες:
Φανταστείτε τον εαυτό σας να στέκεται πίσω από μια εκκλησία. Ας υποθέσουμε ότι το πλησιέστερο τοπικό μοντέλο έχει δει μόνο την μπροστινή είσοδο αυτής της εκκλησίας, και έτσι, δεν θα μπορεί να σας πει πού βρίσκεστε. Το μοντέλο δεν έχει δει ποτέ το πίσω μέρος αυτού του κτιρίου. Αλλά σε παγκόσμια κλίμακα, έχουμε δει πολλές εκκλησίες, χιλιάδες από αυτές, όλες απαθανατισμένες από τα αντίστοιχα τοπικά τους μοντέλα σε άλλα μέρη σε όλο τον κόσμο. Καμία εκκλησία δεν είναι ίδια, αλλά πολλές μοιράζονται κοινά χαρακτηριστικά. Το LGM είναι ένας τρόπος πρόσβασης σε αυτή τη διανεμημένη γνώση.
Η κλίμακα της λειτουργίας της Niantic είναι, τουλάχιστον, εντυπωσιακή. Ισχυρίζεται ότι λαμβάνει πάνω από ένα εκατομμύριο νέες σαρώσεις τοποθεσιών του πραγματικού κόσμου που συνεισφέρουν οι χρήστες την εβδομάδα.
Πώς νιώθετε που η Niantic χρησιμοποιεί τα δεδομένα σας για να εκπαιδεύσει το LGM της; Ενημερώστε μας στα σχόλια παρακάτω.