Περιεχόμενα Άρθρου
Ένα νέο μοντέλο βίντεο AI φαίνεται να έρχεται κάθε εβδομάδα και το πιο πρόσφατο, από τον κινεζικό τεχνολογικό γίγαντα Tencent, είναι μεγάλη υπόθεση. Το Hunyuan προσφέρει κορυφαία ποιότητα βίντεο και κίνηση, ενώ είναι επίσης πλήρως ανοιχτού κώδικα.
Βίντεο Hunyuan είναι ένα μοντέλο μετασχηματιστή διάχυσης παραμέτρων 13 δισεκατομμυρίων που μπορεί να λάβει ένα απλό μήνυμα κειμένου και να το μετατρέψει σε βίντεο υψηλής ανάλυσης 5 δευτερολέπτων. Επί του παρόντος, δεν υπάρχουν πολλά μέρη για να το δοκιμάσετε εκτός Κίνας, αλλά καθώς είναι ανοιχτού κώδικα αυτό θα αλλάξει. Μία υπηρεσία, ΦΑΛ.αιέχει ήδη δημιουργήσει μια έκδοση με την οποία μπορείτε να παίξετε.
Το βίντεο επίδειξης φαίνεται εντυπωσιακό, με σύντομες ακολουθίες που η καθεμία προσφέρει μια ματιά στη φυσική κίνηση ανθρώπων και ζώων σε φωτορεαλιστικό στυλ. Υπάρχουν επίσης κλιπ που δείχνουν διαφορετικά στυλ κινουμένων σχεδίων.
Οι τρέχουσες υλοποιήσεις που έχω δοκιμάσει χρειάζονται έως και 15 λεπτά για τη δημιουργία 5 δευτερολέπτων βίντεο, επομένως δεν είχα πολύ χρόνο για ένα πείραμα, αλλά οι δοκιμές μου δείχνουν ότι είναι περίπου ισοδύναμες με το Runway Gen-3 και το Luma Labs Dream Machine στο εξόδου, αλλά η άμεση συμμόρφωση (τουλάχιστον στα αγγλικά) δεν είναι τόσο καλή.
Πώς λειτουργεί το Hunyuan
Το Hunyuan είναι ένα μοντέλο βίντεο ανοιχτού κώδικα AI με 13 δισεκατομμύρια παραμέτρους. Αυτό το καθιστά πολύ μεγαλύτερο από παρόμοια μοντέλα ανοιχτού κώδικα, συμπεριλαμβανομένου του εντυπωσιακού Mochi-1 από την Genmo. Ωστόσο, δεν δημιουργούνται όλες οι παράμετροι εξίσου, επομένως αυτό θα μπορούσε να είναι περισσότερο φουσκωτό παρά απόδοση – θα απαιτήσει περισσότερες δοκιμές για να το διαπιστώσετε.
Λειτουργεί όπως κάθε άλλο μοντέλο βίντεο τεχνητής νοημοσύνης, καθώς του δίνετε κείμενο ή μια εικόνα, σας δίνει ένα βίντεο με βάση τη συμβολή σας. Είναι διαθέσιμο ως λήψη, αλλά η τρέχουσα έκδοση απαιτεί τουλάχιστον 60 GB μνήμης GPU — επομένως αναζητάτε τουλάχιστον ένα Nvidia H800/H20.
Αυτό είναι ανοιχτού κώδικα και, όπως και με το Mochi-1, πιθανότατα θα υπάρξει κάποια λεπτή ρύθμιση για να μειωθούν οι απαιτήσεις, ώστε να μπορείτε να το εκτελέσετε σε κάτι σαν RTX4090.
Η Tencent λέει ότι κατά τη διάρκεια των δοκιμών ήταν σε θέση να επιτύχει υψηλή οπτική ποιότητα, ποικιλομορφία κίνησης και σταθερότητα παραγωγής, με τις ανθρώπινες αξιολογήσεις να το τοποθετούν στο ίδιο επίπεδο με όλα τα μεγάλα εμπορικά μοντέλα. Το ότι είναι ανοιχτού κώδικα του δίνει ένα πλεονέκτημα, καθώς ολόκληρη η κοινότητα μπορεί να προσθέσει λειτουργίες και να βελτιώσει το μοντέλο.
Η εταιρεία είπε στην τεκμηρίωση ότι «αυτό θα δώσει τη δυνατότητα σε όλους στην κοινότητα να πειραματιστούν με τις ιδέες τους, προωθώντας ένα πιο δυναμικό και ζωντανό οικοσύστημα παραγωγής βίντεο».
Πόσο καλά λειτουργεί το Hunyuan;
Το δοκίμασα στο FAL.ai και διαπίστωσα ότι η άμεση τήρηση και η κατανόηση της φυσικής με βάση τα συμφραζόμενα δεν ήταν τόσο καλές όσο υποσχέθηκαν στην τεκμηρίωση ούτε τόσο καλές όσο οι Runway, Kling ή Hailuo.
Για παράδειγμα, του έδωσα την παραδοσιακή μου προτροπή δοκιμής: “Ένας σκύλος στο τρένο”. Αυτό δοκιμάζει πώς χειρίζεται μια λιγότερο περιγραφική προτροπή και αυτή που απαιτεί κατανόηση της κίνησης και της ταχύτητας.
Ήταν εντάξει, αλλά ήταν υπερβολικά απλοϊκό στην απόδοσή του. Όταν δοκιμάζω την ίδια προτροπή με άλλα μοντέλα, έχω γρήγορη κίνηση έξω, ένα καθαρό εσωτερικό τρένο και ένα χαριτωμένο σκυλί που κάθεται στο κάθισμα. Ο Hunyuan μου έδωσε ένα σκυλί αλλά έμοιαζε με αίθουσα αναμονής γιατρού.
Το Mochi-1 πέτυχε αποτέλεσμα συγκρίσιμο με το Runway και το Kling από την ίδια προτροπή. Είναι πιθανό ότι ήταν απλώς μια κακή γενιά από την Hunyuan και η προσπάθεια ξανά θα είχε καλύτερη απόδοση, αλλά στα 15 λεπτά ανά προσπάθεια δεν είχα χρόνο.
Περισσότερα από το Tom’s Guide
Greek Live Channels Όλα τα Ελληνικά κανάλια:
Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση;
Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο.
Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια
Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.