Οι GPU Blackwell της Nvidia αντιμετωπίζουν προκλήσεις υπερθέρμανσης που επηρεάζουν σημαντικούς πελάτες τεχνολογίας. Οι επεξεργαστές επόμενης γενιάς δυσκολεύονται να αποδώσουν αποτελεσματικά σε rack server που φιλοξενούν 72 GPU, εγείροντας ανησυχίες για εταιρείες όπως η Google, η Meta και η Microsoft σχετικά με την έγκαιρη ανάπτυξη. Οι αναφορές δείχνουν ότι η Nvidia επαναξιολογεί τα σχέδια rack της πολλές φορές λόγω αυτών των προβλημάτων υπερθέρμανσης, τα οποία κινδυνεύουν να καταστρέψουν τα εξαρτήματα και να περιορίσουν την απόδοση της GPU. Η αναμενόμενη κατανάλωση ισχύος για αυτές τις διαμορφώσεις είναι έως και 120 kW ανά rack.
Ενημερώθηκαν οι μυημένοι Οι Πληροφορίες ότι οι GPU Blackwell της Nvidia για AI και υπολογιστές υψηλής απόδοσης (HPC) έχουν υπερθερμανθεί σε διακομιστές υψηλής χωρητικότητας, επηρεάζοντας τα χρονοδιαγράμματα εκκίνησης για πελάτες που βασίζονται σε αυτές τις τεχνολογίες. Σε μια προσπάθεια να αντιμετωπίσει τις επιπλοκές που προκύπτουν από αυτά τα προβλήματα υπερθέρμανσης, η Nvidia ζήτησε από τους προμηθευτές της να τροποποιήσουν επανειλημμένα τα σχέδια των rack. Ένας εκπρόσωπος της Nvidia τόνισε τη συνεργατική τους προσέγγιση με τις υπηρεσίες cloud, περιγράφοντας τις αλλαγές σχεδιασμού ως συνηθισμένο μέρος της διαδικασίας ανάπτυξης.
Προσαρμογές στο σχεδιασμό για την αντιμετώπιση προβλημάτων υπερθέρμανσης
Προηγουμένως, οι καθυστερήσεις στη ράμπα παραγωγής του Blackwell αποδίδονταν σε ένα ελάττωμα σχεδιασμού που «σκοτώνει την απόδοση». Οι GPU Blackwell B100 και B200 χρησιμοποιούν την τεχνολογία συσκευασίας CoWoS-L της TSMC, η οποία ενσωματώνει δύο chiplet για βελτιωμένες ταχύτητες μεταφοράς δεδομένων έως και 10 TB/s. Ωστόσο, μια αναντιστοιχία στα χαρακτηριστικά θερμικής επέκτασης μεταξύ των chiplet GPU και άλλων στοιχείων οδήγησε σε στρέβλωση και αστοχίες του συστήματος. Για να επιλύσει αυτό το πρόβλημα, η Nvidia έκανε τροποποιήσεις στα μεταλλικά στρώματα και τις δομές του πυριτίου της GPU.
Το αποτέλεσμα αυτών των βελτιώσεων εισήλθε στη μαζική παραγωγή μόλις στα τέλη Οκτωβρίου, με τις αναμενόμενες ημερομηνίες αποστολής να μετατοπίζονται στα τέλη Ιανουαρίου. Αυτή η καθυστέρηση είναι κρίσιμη για τους πελάτες της Nvidia, όπως η Google, η Meta και η Microsoft, οι οποίοι εξαρτώνται από αυτές τις GPU για να βελτιώσουν τα πιο ισχυρά μοντέλα τεχνητής νοημοσύνης τους. Η Nvidia είχε προηγουμένως διαφημίσει τα τσιπ Blackwell ως 30 φορές πιο γρήγορα για εργασίες όπως η απάντηση σε ερωτήματα chatbot σε σύγκριση με προηγούμενα μοντέλα.
Τα έσοδα από τσιπ Blackwell της Nvidia προβλέπεται να φτάσουν τα 6 δισεκατομμύρια δολάρια το επόμενο τρίμηνο, υπογραμμίζοντας την υψηλή ζήτηση παρά τους συνεχιζόμενους περιορισμούς προσφοράς. Η Nvidia, που πρόσφατα ξεπέρασε την Apple, είναι πλέον η πιο πολύτιμη εταιρεία στον κόσμο με κεφαλαιοποίηση που εκτινάσσεται στα 3,482 τρισεκατομμύρια δολάρια. Ωστόσο, οι συνεχείς αποτυχίες σχετικά με τους επεξεργαστές Blackwell απειλούν να διαταράξουν τις προγραμματισμένες εξελίξεις στις δυνατότητες τεχνητής νοημοσύνης που είναι απαραίτητες για τους μεγάλους τεχνολογικούς παίκτες.
Πίστωση επιλεγμένης εικόνας: Nvidia
VIA: DataConomy.com