Calvin Wankhede / Android Authority
TL;DR
- Το OpenAI είχε παρουσιάσει δυνατότητες ζωντανής όρασης στην Προηγμένη λειτουργία φωνής στο ChatGPT, αλλά δεν είχε κοινοποιήσει ένα χρονοδιάγραμμα κυκλοφορίας πέρα από την έκδοση alpha.
- Εντοπίσαμε συμβολοσειρές που υποδηλώνουν ότι η δυνατότητα, η οποία θα μπορούσε να ονομάζεται “Ζωντανή κάμερα”, θα μπορούσε σύντομα να κυκλοφορήσει στην beta έκδοση του ChatGPT.
Πολλοί άνθρωποι βασίζονται σε μεγάλο βαθμό στο ChatGPT για τις καθημερινές επαγγελματικές και προσωπικές τους ανάγκες. Το OpenAI πρόσθεσε ένα επίπεδο φιλικότητας στο ChatGPT με λειτουργίες όπως η Advanced Voice Mode για φυσικές συνομιλίες, αλλά οι χρήστες περίμεναν να κυκλοφορήσουν και οι υποσχεμένες δυνατότητες όρασης. Υπάρχουν καλά νέα σε αυτό το μέτωπο, καθώς οι λειτουργίες Live Video του ChatGPT στη σύνθετη λειτουργία φωνής θα μπορούσαν σύντομα να κυκλοφορήσουν σε περισσότερους χρήστες.
Όταν OpenAI ανακοινώθηκε Το GPT-4o τον Μάιο του 2024, διέθετε προηγμένες δυνατότητες ζωντανής όρασης που έρχονται στην Προηγμένη λειτουργία φωνής του ChatGPT. Η εταιρεία έδειξε περίφημα αυτό το demo όπου η νέα Advanced Voice Mode αναγνώριζε εύκολα και απρόσκοπτα το θέμα στη ροή της κάμερας ως σκύλο, θυμόταν το όνομά του, αναγνώρισε τη μπάλα και συνέδεσε τη μπάλα και τον σκύλο μέσω μιας δραστηριότητας όπως το fetch.
Η επίδειξη ήταν αρκετά εντυπωσιακή, λαμβάνοντας υπόψη πόσο λίγες πληροφορίες έπρεπε να εισάγει ο χρήστης ειδικά και χειροκίνητα και πόσο γρήγορα ο βοηθός AI ανταποκρίθηκε στη ζωντανή ροή της κάμερας. Ήταν σχεδόν σαν ο χρήστης να τηλεφωνούσε σε έναν άνθρωπο.
Μερικοί χρήστες είχαν την ευκαιρία να δοκιμάσουν τη δυνατότητα Live Video (όραμα) στο alpha και έφυγαν εξίσου εντυπωσιασμένοι.
Δύσκολος #ChatGPTτης νέας Advanced Voice Mode που μόλις κυκλοφόρησε στον Alpha. Αισθάνεται σαν να αντιμετωπίζουμε έναν φίλο που έχει πολύ γνώση, κάτι που σε αυτή την περίπτωση ήταν εξαιρετικά χρήσιμο – καθησυχάζοντάς μας με το νέο μας γατάκι. Μπορεί να απαντήσει σε ερωτήσεις σε πραγματικό χρόνο και να χρησιμοποιήσει την κάμερα ως είσοδο επίσης! pic.twitter.com/Xx0HCAc4To
Ωστόσο, οι χρήστες περίμεναν μάλλον υπομονετικά για να φτάσει η δυνατότητα στην εφαρμογή εκτός του alpha. Από όσο γνωρίζουμε, το OpenAI δεν υποσχέθηκε ένα χρονοδιάγραμμα κυκλοφορίας για τις δυνατότητες όρασης στη λειτουργία Advanced Voice Mode πέρα από την κυκλοφορία alpha.
Το OpenAI φαίνεται τώρα να ετοιμάζεται για μια έκδοση beta, καθώς εντοπίσαμε συμβολοσειρές που σχετίζονται με τις δυνατότητες όρασης στη λειτουργία Advanced Voice Mode στην τελευταία έκδοση ChatGPT v1.2024.317 beta.
Κώδικας
Beta
Tap the camera icon to let ChatGPT view and chat about your surroundings.
Live camera
Don't use for live navigation or decisions that may impact your health or safety.
Οι παραπάνω συμβολοσειρές υποδεικνύουν ότι η δυνατότητα θα μπορούσε να ονομάζεται “Ζωντανή κάμερα” όταν κυκλοφορήσει σε έκδοση beta. Εντοπίσαμε προειδοποιήσεις για χρήστες που τους συμβουλεύουν να μην χρησιμοποιούν τη λειτουργία Live camera για ζωντανή πλοήγηση ή άλλες αποφάσεις που επηρεάζουν την υγεία ή την ασφάλειά τους.
Δεδομένου ότι οι συμβολοσειρές εντοπίστηκαν στην έκδοση beta της εφαρμογής, αυτό θα μπορούσε να σημαίνει ότι η εταιρεία προετοιμάζεται τώρα για μια ευρύτερη κυκλοφορία beta, πιθανώς στο εγγύς μέλλον. Εάν επιτρέπεται να κάνουμε υποθέσεις, υποθέτουμε ότι η δυνατότητα θα μπορούσε σύντομα να γίνει διαθέσιμη στους συνδρομητές του ChatGPT Plus και πιθανώς σε άλλα επίπεδα επί πληρωμή του βοηθού AI.
Απευθυνθήκαμε στο OpenAI για σχόλια σχετικά με το χρονοδιάγραμμα κυκλοφορίας για τις δυνατότητες όρασης σε πραγματικό χρόνο εντός της Advanced Voice Mode του ChatGPT. Θα ενημερώσουμε αυτό το άρθρο όταν λάβουμε απάντηση από την εταιρεία.