Περιεχόμενα Άρθρου
- Η Nvidia ανακοίνωσε το νέο της εργαλείο ήχου τεχνητής νοημοσύνης Fugatto
- Μπορεί να δημιουργήσει και να αναμίξει ήχο με όλους τους τρόπους, αλλά δεν έχει κυκλοφορήσει ακόμα
- Το Fugatto υπόσχεται να δημιουργήσει μοναδικούς ήχους, μίξεις ήχου, ομιλία και πολλά άλλα
Nvidia έχει ανακοινώσει ένα νέο εργαλείο παραγωγής ήχου AI που ονομάζεται Fugatto, το οποίο περιγράφει ως την «πιο ευέλικτη ηχητική μηχανή του κόσμου» – ικανή να παράγει όλα τα είδη μουσικής, ομιλίας και άλλου ήχου, ακόμη και μοναδικούς ήχους που δεν έχουν ακουστεί ποτέ πριν.
Το Fugatto, το οποίο είναι συντομογραφία του Foundational Generative Audio Transformer Opus 1, μπορεί να λειτουργήσει με προτροπές κειμένου και δείγματα ήχου. Μπορείτε απλά να περιγράψετε αυτό που θέλετε να ακούσετε ή να ζητήσετε από το μοντέλο AI να τροποποιήσει ή να συνδυάσει υπάρχοντα ηχητικά κλιπ.
Για παράδειγμα, μπορείτε να μεταμορφώσετε τον ήχο ενός τρένου σε μια πλούσια ορχηστρική σύνθεση ή να αναμίξετε μια μελωδία μπάντζο με τους ήχους της βροχόπτωσης. Μπορείτε να ακούσετε τον ήχο ενός γαυγίσματος σαξόφωνου ή ενός νιαουρίσματος φλάουτου, απλώς πληκτρολογώντας μια προτροπή.
Το Fugatto μπορεί επίσης να απομονώσει τα φωνητικά από τα κομμάτια και να αλλάξει το στυλ απόδοσης της φωνής, καθώς και να δημιουργήσει ομιλία από την αρχή. Τροφοδοτήστε μια υπάρχουσα μελωδία και μπορείτε να την παίξετε σε όποιο όργανο θέλετε, σε οποιοδήποτε στυλ.
Τα κακά νέα – δεν είναι ακόμη διαθέσιμα
Πώς μπορείτε λοιπόν να δοκιμάσετε αυτήν την εντυπωσιακή νέα τεχνολογία AI; Δεν μπορείτε, προς το παρόν: θα πρέπει να αρκεστείτε στη Nvidia βίντεο προώθησης και α ιστοσελίδα δειγμάτων. Δεν υπάρχει ακόμα καμία πληροφορία για το πότε το Fugatto θα είναι διαθέσιμο για δημόσιες δοκιμές.
Μερικά από τα δείγματα που δημοσίευσε η Nvidia περιλαμβάνουν τον ήχο μιας γυναικείας φωνής που γαβγίζει, μια εργοστασιακή μηχανή που ουρλιάζει, μια γραφομηχανή που ψιθυρίζει και ένα βιολοντσέλο που φωνάζει με θυμό. Μπορείτε να δείτε τη μεγάλη ποικιλία εφέ ήχου που είναι δυνατά.
Η Nvidia έχει επίσης δείξει πώς ο κινητήρας AI είναι σε θέση να παράγει κλιπ προφορικού λόγου, τα οποία στη συνέχεια μπορούν να παραδοθούν με μια σειρά διαφορετικών συναισθημάτων (από θυμό έως χαρούμενο) και ακόμη και με διαφορετικές προφορές.
«Θέλαμε να δημιουργήσουμε ένα μοντέλο που να κατανοεί και να παράγει ήχο όπως οι άνθρωποι» λέει ο Rafael Valle της Nvidiaένας από την ομάδα Fugatto. “Το Fugatto είναι το πρώτο μας βήμα προς ένα μέλλον όπου η μη εποπτευόμενη μάθηση πολλαπλών εργασιών στη σύνθεση και τη μετατροπή ήχου προκύπτει από την κλίμακα δεδομένων και μοντέλου.”
Μπορεί επίσης να σας αρέσει