Rita El Khoury / Android Authority
TL;DR
- Η Google εργάζεται σε ένα νέο API για το Android 16 που επιτρέπει στις εφαρμογές συστήματος να εκτελούν ενέργειες για λογαριασμό των χρηστών εντός εφαρμογών.
- Αυτό το νέο API προστατεύεται από μια άδεια που θα εκχωρηθεί στην προεπιλεγμένη εφαρμογή βοηθού, π.χ. Gemini σε νέες συσκευές Android.
- Αυτό θα μπορούσε να επιτρέψει στο Gemini να ενεργήσει ως πράκτορας τεχνητής νοημοσύνης στο τηλέφωνό σας, κάτι που η Google είχε αρχικά υποσχεθεί ότι θα έκανε ο νέος Βοηθός Google του Pixel 4.
Η Google δίνει ό,τι έχει για να κάνει πιο επιτυχημένο το chatbot Gemini και το μοντέλο της μεγάλης γλώσσας, συμπεριλαμβανομένης της ενσωμάτωσής του σε ολόκληρη τη σουίτα προϊόντων της. Στο Android, το Gemini έχει γίνει η προεπιλεγμένη υπηρεσία βοηθού σε πολλές συσκευές και ο αριθμός των πραγμάτων που μπορεί να κάνει συνεχίζει να αυξάνεται με κάθε ενημέρωση. Ενώ το Gemini μπορεί να αλληλεπιδράσει με ορισμένες εξωτερικές υπηρεσίες, η ικανότητά του να ελέγχει τις εφαρμογές Android είναι πολύ περιορισμένη αυτή τη στιγμή. Ωστόσο, αυτό θα μπορούσε να αλλάξει σε μεγάλο βαθμό με την κυκλοφορία του Android 16 του επόμενου έτους, το οποίο πρόκειται να περιλαμβάνει ένα νέο API που επιτρέπει σε υπηρεσίες όπως το Gemini να εκτελούν ενέργειες για λογαριασμό των χρηστών εντός εφαρμογών.
Διαβάζεις ένα Authority Insights ιστορία. Ανακαλύψτε το Authority Insights για πιο αποκλειστικές αναφορές, ρήξεις εφαρμογών, διαρροές και σε βάθος κάλυψη τεχνολογίας που δεν θα βρείτε πουθενά αλλού.
Οι επεκτάσεις Gemini είναι ο τρόπος με τον οποίο το chatbot της Google αλληλεπιδρά αυτήν τη στιγμή με εξωτερικές υπηρεσίες. Οι επεκτάσεις δίνουν στο Gemini πρόσβαση σε υπηρεσίες ιστού όπως το Google Flights, τα Google Hotels, το OpenStax και άλλα, επιτρέποντάς του να αντλεί δεδομένα από αυτές τις υπηρεσίες όταν του κάνετε σχετικές ερωτήσεις. Υπάρχουν επίσης επεκτάσεις για πράγματα όπως οι Χάρτες Google, το Google Home, το YouTube και το Google Workspace, τα οποία είναι όλα διαθέσιμα ως εφαρμογές στο Android. Ωστόσο, αυτές οι επεκτάσεις επιτρέπουν στο chatbot να χρησιμοποιεί τα δεδομένα του λογαριασμού σας όταν καλεί τα backend API για αυτές τις υπηρεσίες αντί να ελέγχει απευθείας τις αντίστοιχες εφαρμογές Android. Τέλος, υπάρχουν ορισμένες επεκτάσεις όπως τα Utilities που επιτρέπουν στο Gemini να ελέγχει απευθείας τις εφαρμογές Android, αλλά επιτρέπουν μόνο στο chatbot να εκτελεί βασικές ενέργειες χρησιμοποιώντας καλά καθορισμένες προθέσεις.
Το πρόβλημα με τα Gemini Extensions είναι ότι δεν είναι επεκτάσιμα. Υπάρχουν πάρα πολλές εφαρμογές Android για τις οποίες η Google μπορεί να κάνει επεκτάσεις, για να μην αναφέρουμε το γεγονός ότι πολλές εφαρμογές δεν παρέχουν δημόσια API στα οποία μπορεί ακόμη και να χρησιμοποιήσει το Gemini. Χρησιμοποιώντας έναν συνδυασμό τεχνολογιών όπως η ανάγνωση οθόνης, η πολυτροπική τεχνητή νοημοσύνη και η είσοδος προσβασιμότητας, το Gemini θα μπορούσε θεωρητικά να επιτρέψει στους χρήστες να ελέγχουν οποιαδήποτε εφαρμογή Android μέσω φυσικής γλώσσας, αλλά τα αποτελέσματα πιθανότατα δεν θα ήταν πολύ καλά δεδομένης της έλλειψης πλαισίου. Μια καλύτερη λύση είναι η Google να παρέχει ένα API που επιτρέπει στις εφαρμογές να συνεργάζονται απευθείας με το Gemini για την εκτέλεση ορισμένων λειτουργιών εφαρμογής, κάτι που είναι ακριβώς αυτό που φαίνεται να κάνει η Google στο Android 16.
Όταν η Google κυκλοφόρησε το Android 16 DP1 νωρίτερα αυτή την εβδομάδα, εντοπίσαμε ένα μυστηριώδες σύνολο νέων API στα έγγραφα προγραμματιστών της Google που σχετίζονται με μια νέα δυνατότητα που ονομάζεται “λειτουργίες εφαρμογής”. Σύμφωνα με την τεκμηρίωση της Google, μια λειτουργία εφαρμογής «είναι ένα συγκεκριμένο κομμάτι λειτουργικότητας που προσφέρει μια εφαρμογή στο σύστημα». Αυτές οι λειτουργίες μπορούν να «ενσωματωθούν σε διάφορα χαρακτηριστικά του συστήματος».
Η περιγραφή της Google για τις λειτουργίες της εφαρμογής είναι ασαφής, πιθανότατα εσκεμμένα, αλλά ευτυχώς, η περιγραφή μιας από τις νέες μεθόδους προσφέρει ένα παράδειγμα λειτουργίας εφαρμογής. Η περιγραφή της μεθόδου μιλά για το πώς τα αναγνωριστικά συναρτήσεων πρέπει να είναι μοναδικά εντός των εφαρμογών και ότι, «για παράδειγμα, μια συνάρτηση για παραγγελία φαγητού θα μπορούσε να αναγνωριστεί ως «παραγγελία φαγητού». Έτσι, για παράδειγμα, μια εφαρμογή εστιατορίου θα μπορούσε να εφαρμόσει μια λειτουργία εφαρμογής σε να παραγγείλετε φαγητό ή μια εφαρμογή ξενοδοχείου θα μπορούσε να εφαρμόσει μια λειτουργία εφαρμογής για κράτηση δωματίου.
Mishaal Rahman / Αρχή Android
Οι λεπτομέρειες είναι περιορισμένες, αλλά φαίνεται ότι οι εφαρμογές δημιουργούν λειτουργίες ορίζοντας μια υπηρεσία που μπορεί να δεσμευτεί μόνο από μια διαδικασία συστήματος. Αυτές οι λειτουργίες εφαρμογής εκτίθενται στο πλαίσιο αναζήτησης εφαρμογών του Android, το οποίο είναι το πλαίσιο που τροφοδοτεί την καθολική εμπειρία αναζήτησης στο Pixel Launcher, μεταξύ άλλων. Οι λειτουργίες εφαρμογών μπορούν να εκτελεστούν από εφαρμογές που κρατούν είτε το EXECUTE_APP_FUNCTIONS
ή το EXECUTE_APP_FUNCTIONS_TRUSTED
άδεια στο Android 16.
Ενώ και τα δύο δικαιώματα μπορούν να παραχωρηθούν μόνο σε εφαρμογές συστήματος, τα πρώτα χορηγούνται προς το παρόν μόνο σε εφαρμογές συστήματος που διαθέτουν ASSISTANT
ρόλο (δηλαδή την εφαρμογή Google), ενώ η τελευταία παραχωρείται προς το παρόν μόνο σε εφαρμογές συστήματος που διαθέτουν το SYSTEM_UI_INTELLIGENCE
ρόλο (δηλαδή Android System Intelligence). Και τα δύο δικαιώματα επιτρέπουν στις εφαρμογές να “εκτελούν ενέργειες για λογαριασμό των χρηστών εντός των εφαρμογών”, αλλά “οι εφαρμογές που συνεισφέρουν λειτουργίες εφαρμογών μπορούν να επιλέξουν να απαγορεύουν τους καλούντες με το” EXECUTE_APP_FUNCTIONS
άδεια, αντί να επιτρέπονται μόνο οι καλούντες με το EXECUTE_APP_FUNCTIONS_TRUSTED
άδεια για την εκτέλεσή τους.
Αν και λείπουν πολλές λεπτομέρειες, μου φαίνεται ότι η νέα λειτουργία λειτουργιών εφαρμογών του Android 16 θα επιτρέψει στο Gemini να ελέγχει τις εφαρμογές με τρόπο που ο Βοηθός Google δεν κατάφερε ποτέ να κάνει. Το 2019, η Google πείραξε πώς ο «νέος Βοηθός Google» της θα μπορούσε να ενορχηστρώσει εργασίες σε όλες τις εφαρμογές. Θα μπορούσατε να χρησιμοποιήσετε τη φωνή σας για πολλαπλές εργασίες σε όλες τις εφαρμογές και να εκτελέσετε σύνθετες ενέργειες, όπως να απαντήσετε σε ένα εισερχόμενο κείμενο μέσω φωνής και στη συνέχεια να στείλετε μια φωτογραφία.
Αυτό που αποκάλυψε η Google το 2019 έμοιαζε πολύ με αυτό που υπόσχονται σήμερα να κάνουν οι πράκτορες της τεχνητής νοημοσύνης και δεδομένων όλων όσων εργάστηκε η Google τον περασμένο χρόνο, δεν θα έπρεπε να είναι σοκαριστικό να ακούς την Google να επανεξετάζει αυτήν την ιδέα. Ας ελπίσουμε ότι οι λειτουργίες της εφαρμογής στο Android 16 επιτρέπουν στο Gemini να γίνει ένας πραγματικός πράκτορας τεχνητής νοημοσύνης για το τηλέφωνό σας Android, αλλά από ό,τι μπορούμε να δούμε, αυτό θα εξαρτηθεί από το εάν οι προγραμματιστές εφαρμογών θα συμμετάσχουν ή όχι στην ιδέα.