Η Google έχει εκτοξεύτηκε ένα νέο εργαλείο δημιουργίας εικόνων AI που ονομάζεται Whisk, το οποίο επιτρέπει στους χρήστες να δημιουργούν οπτικές εξόδους από υπάρχουσες εικόνες. Ανακοινώθηκε μέσω μιας ενημέρωσης στα Εργαστήρια Google, το Whisk χρησιμοποιεί το μοντέλο γλώσσας Gemini για την κατανόηση εικόνων και τη δημιουργία εικόνων Imagen 3. Προς το παρόν, είναι διαθέσιμο μόνο στις ΗΠΑ
Η Google λανσάρει το Whisk: εργαλείο AI για δημιουργία δημιουργικών εικόνων
Το Whisk λειτουργεί καταγράφοντας την «ουσία» της παρεχόμενης εικόνας αντί να την αναπαράγει απευθείας. Οι χρήστες εισάγουν μια εικόνα μαζί με προκαθορισμένα στυλ, όπως αυτοκόλλητο, καρφίτσα σμάλτου και βελούδο, για να λάβουν ένα δημιουργικά τροποποιημένο αποτέλεσμα. Αυτό το εργαλείο εστιάζει στον καταιγισμό ιδεών και τις γρήγορες οπτικοποιήσεις, παρά στο τελικό περιεχόμενο παραγωγής. Η απλοϊκή διεπαφή βοηθά τους χρήστες να δημιουργήσουν προκαταρκτικές έννοιες.
Η προηγμένη λειτουργία επεξεργασίας, προσβάσιμη μέσω της επιλογής «Έναρξη από το μηδέν», παρέχει επιλογές στους χρήστες να προσδιορίζουν λεπτομέρειες σε κατηγορίες θέματος, σκηνής και στυλ. Οι χρήστες μπορούν επίσης να προσθέσουν κείμενο για βελτίωση. Ωστόσο, ορισμένα αποτελέσματα δεν έχουν ευθυγραμμιστεί στενά με τις προσδοκίες των χρηστών, όπως παρατηρήθηκε κατά τη διάρκεια της δοκιμής. Η Google προειδοποιεί ότι το Whisk θα διαφοροποιήσει τα χαρακτηριστικά των εικόνων εξόδου, όπως το ύψος, το βάρος και το χτένισμα, από την αρχική εισαγωγή.
Κάτω από την κουκούλα, η λειτουργικότητα του Whisk βασίζεται στην ικανότητα του μοντέλου Gemini να δημιουργεί λεπτομερείς λεζάντες για τη μεταφορτωμένη εικόνα. Στη συνέχεια, αυτές οι λεζάντες χρησιμοποιούνται από τη γεννήτρια Imagen 3 για τη δημιουργία νέων γραφικών. Η διαδικασία υπογραμμίζει τον στόχο του Whisk να προωθήσει τη δημιουργική ελευθερία, επιτρέποντας στους χρήστες να αναμιγνύουν στοιχεία σε διαφορετικές οπτικές μορφές.
Παράλληλα με την κυκλοφορία του Whisk, η Google παρουσίασε το Veo 2, μια νέα επανάληψη του μοντέλου παραγωγής βίντεο. Αυτή η τελευταία ενημέρωση επιδεικνύει βελτιωμένες δυνατότητες δημιουργίας βίντεο, παράγοντας περιεχόμενο υψηλής ποιότητας με εξελιγμένη κατανόηση της φυσικής του πραγματικού κόσμου και των ανθρώπινων κινήσεων. Σε δοκιμές, το Veo 2 έδειξε μειωμένη συχνότητα «παραισθήσεων», οι οποίες συνήθως περιλαμβάνουν λανθασμένες ή απροσδόκητες λεπτομέρειες στο παραγόμενο περιεχόμενο.
Οι χρήστες μπορούν να ζητήσουν συγκεκριμένα στυλ λήψης ή χαρακτηριστικά στα μηνύματα προτροπής βίντεο, βελτιώνοντας το επίπεδο λεπτομέρειας στις εξόδους που δημιουργούνται, συμπεριλαμβανομένης της αίτησης βίντεο ανάλυσης 4K. Τα βίντεο που παράγονται από την Veo 2 αποτελούν παράδειγμα των κινηματογραφικών αποτελεσμάτων υψηλής ποιότητας που είναι πλέον επιτεύξιμα, καλύπτοντας αποτελεσματικά τις διάφορες ανάγκες των χρηστών.
Το μοντέλο Imagen 3 έχει επίσης αναβαθμιστεί, ικανό να παράγει εικόνες πολύ φωτεινότερες και καλύτερης σύνθεσης σε ποικίλα στυλ. Αυτό το βελτιωμένο μοντέλο ακολουθεί με μεγαλύτερη ακρίβεια τις υποδείξεις των χρηστών και δημιουργεί περίπλοκες υφές. Μέσω δοκιμών χρήστη έναντι ανταγωνιστικών μοντέλων παραγωγής εικόνας, το Imagen 3 πέτυχε αποτελέσματα τελευταίας τεχνολογίας.
Ως μέρος της δέσμευσης της Google για υπεύθυνη ανάπτυξη τεχνητής νοημοσύνης, τα αποτελέσματα τόσο από το Whisk όσο και από τα πιο πρόσφατα μοντέλα περιλαμβάνουν ένα αόρατο υδατογράφημα SynthID, το οποίο βοηθά στην πρόληψη της παραπληροφόρησης. Αυτή η εστίαση στην ασφάλεια συνοδεύει μια προσεκτική διαδικασία διάθεσης. Οι χρήστες μπορούν να έχουν πρόσβαση σε αυτές τις νέες δυνατότητες μέσω του Google Labs, όπου μπορούν να εγγραφούν για ενημερώσεις και βελτιώσεις λειτουργιών.
Πιστώσεις εικόνας: Google
VIA: Πηγή Άρθρου
Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.