Περιεχόμενα Άρθρου
- Η Amazon αποκαλύπτει νέα εργαλεία τεχνητής νοημοσύνης για τη δημιουργία εικόνων και βίντεο
- Το Amazon Nova Canvas και το Nova Reel προσπαθούν να βοηθήσουν τους πωλητές ηλεκτρονικού εμπορίου
- Και τα δύο νέα μοντέλα Nova πρόκειται να κυκλοφορήσουν το 2025
Η Amazon ανακοίνωσε νέα μοντέλα δημιουργίας εικόνων και βίντεο καθώς εντείνει τον αγώνα της για να γίνει τεχνητής νοημοσύνης βαρέων βαρών.
Η εταιρεία αποκάλυψε το Amazon Nova Canvas και το Nova Reel στην εκδήλωση AWS re:Invent 2024 στο Λας Βέγκας, με τον CEO Andy Jassy να αποκαλύπτει την κυκλοφορία ως μέρος μιας νέας σειράς μοντέλων AI Nova.
Και τα δύο νέα μοντέλα θα είναι διαθέσιμα στα μέσα του 2025, με τα λανσαρίσματα να φέρνουν την Amazon σε άμεσο ανταγωνισμό με τα OpenAI και Grok όσον αφορά τη δημιουργία εικόνας και βίντεο.
Καμβάς και καρούλι Amazon Nova
Τα νέα μοντέλα στοχεύουν αρχικά σε πωλητές και άλλους χρήστες στην πλατφόρμα ηλεκτρονικού εμπορίου της Amazon, επιτρέποντάς τους να δημιουργούν γρήγορα και φθηνά περιεχόμενο πολυμέσων για να εμπλουτίσουν τις σελίδες τους.
Η Amazon δεν αποκάλυψε πάρα πολλά όσον αφορά τις λεπτομέρειες όταν επρόκειτο για τις νέες προσφορές, αλλά αποκάλυψε ότι το Nova Canvas θα επιτρέπει στους χρήστες να δημιουργούν και να επεξεργάζονται εικόνες χρησιμοποιώντας εισαγωγές κειμένου σε φυσική γλώσσα και το Nova Reel μπορεί να παρέχει βίντεο “ποιότητας στούντιο” , με λειτουργίες όπως έλεγχος κίνησης κάμερας, περιστροφή 360 μοιρών και ζουμ.
Σε μια ανάρτηση ιστολογίου που ανακοινώνει τα νέα, η εταιρεία σημείωσε ότι οι πελάτες στην πλατφόρμα διαφημίσεων Amazon που χρησιμοποιούν τα νέα μοντέλα διαφήμιζαν πέντε φορές περισσότερα προϊόντα και διπλάσιες εικόνες ανά διαφημιζόμενο προϊόν, διευρύνοντας την απήχησή τους σε αγοραστές σε όλο τον κόσμο.
Ανυπομονώντας, ο Jassy αποκάλυψε επίσης ότι η Amazon θα κυκλοφορήσει ένα μοντέλο γενιάς Speech-to-Speech στις αρχές του 2025, ακολουθούμενο από ένα μοντέλο “Any-to-Any” στα μέσα του 2025.
Ο πρώτος θα μπορεί να αναλύει και να κατανοεί τη ροή εισόδου ομιλίας σε φυσική γλώσσα, με την ικανότητα να ερμηνεύει λεκτικές και μη λεκτικές ενδείξεις όπως ο τόνος και ο ρυθμός, να απαντά με φυσικό τρόπο, που μοιάζει με τον άνθρωπο.
Το τελευταίο, το οποίο ο Jassy περιέγραψε ως ένα πραγματικό πολυτροπικό έως πολυτροπικό μοντέλο, θα μπορεί να λάβει κείμενο, εικόνες, ήχο και βίντεο, πριν από την έξοδο σε όποια λειτουργία απαιτείται.
Μπορεί επίσης να σας αρέσει
Greek Live Channels Όλα τα Ελληνικά κανάλια:
Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση;
Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο.
Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια
Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.