Quando Nvidia ha rivelato la serie Geforce RTX 3000 con architettura “Ampere”, il numero di core CUDA è aumentato vertiginosamente, il che è stato anche sorprendente durante l’evento, per non dire altro. redattori di swisslockers. Si scopre che il grande aumento è dovuto al fatto che Nvidia ha cambiato il modo in cui viene calcolato il numero di core, poiché la capacità delle unità di calcolo (SM) della nuova scheda grafica non corrispondeva a quella dei modelli precedenti con l’architettura “Turing”.
Con la prossima generazione di schede grafiche, che dovrebbe essere la serie Geforce RTX 4000 e l’architettura “Ada Lovelace”, il numero di core CUDA potrebbe aumentare di nuovo. In precedenza Alla fine del 2020 Dati in circolazione che il modello di punta AD102 può ottenere fino a 18.432 bit, dati che sono emersi in merito a perdite di dati dopo che Nvidia è stata sottoposta a un attacco informatico.
grafica circolare |
M 102 |
GA102 |
M 103 |
GA103 |
---|---|---|---|---|
Tecnica |
5nm TSMC |
Samsung a 8 nm |
5nm TSMC |
Samsung a 8 nm |
Blocco SM |
144 st. |
84° |
84° |
60° |
Nuclei CUDA |
18 432 st. |
10 752 st. |
10 752 st. |
7680 st. |
Cache L2 |
96 MB |
6 MB |
64 MB |
4 MB |
Bus di memoria |
384 bit |
384 bit |
256 bit |
320 bit |
Questa volta, non sono solo le specifiche del circuito superiore dell’AD102 a cui prestare attenzione. in un tavolo come circola su Twitter Specifica il numero di gruppi SM per un set completo di circuiti. A condizione che Nvidia non modifichi nuovamente il modo in cui viene calcolato il numero di core CUDA, fornisce quasi il doppio del numero per il circuito superiore nel progetto completo.
grafica circolare |
M 104 |
GA104 |
M 106 |
GA106 |
M 107 |
GA107 |
---|---|---|---|---|---|---|
Tecnica |
5nm TSMC |
Samsung a 8 nm |
5nm TSMC |
Samsung a 8 nm |
5nm TSMC |
Samsung a 8 nm |
Blocco SM |
60° |
48 st. |
36 st. |
30° |
24 st. |
24 st. |
Nuclei CUDA |
7 680. |
Via 6 144 |
4 S. 608 |
Via 3 840. |
3072 S. |
3072 S. |
Cache L2 |
48 MB |
4 MB |
32 MB |
3 MB |
32 MB |
2 MB |
Bus di memoria |
192 bit |
256 bit |
128 bit |
192 bit |
128 bit |
128 bit |
Per la parte centrale e cerchi più semplici, l’aumento non è significativo. D’altra parte, qualcosa di notevole è un aumento significativo della cache L2, qualcosa che si è fatto strada nella stessa perdita. Afferma che Nvidia lo aumenterà da 6 MB e 4 MB, rispettivamente, a 96 MB e 64 MB, con gli incrementi corrispondenti per il segmento centrale.
Contemporaneamente all’aumento della quantità di cache L2, la dimensione del bus di memoria viene leggermente ridotta per tutti tranne che per l’AD102, che ricorda in qualche modo il modo in cui AMD lavora con l’Infinity Cache. Certo, la cache estesa non è grande quanto l’Infinity Cache di AMD, ma in cambio Nvidia sta investendo in una grande cache L2 invece di L3. Di solito hanno una latenza inferiore e una larghezza di banda maggiore rispetto a L3 Come con tutti i tipi di archiviazione, le velocità di trasferimento non possono sostituire completamente la quantità di memoria o viceversa.
Dal momento che Nvidia non ha ancora tolto la carta dalla bocca per quanto riguarda nessuna delle specifiche, dovrebbe essere presa con le pinze. Nonostante le molteplici perdite che sono state scoperte negli ultimi giorni, non ci sono nemmeno prove affidabili e se i dati provengano effettivamente dai server del gigante delle schede grafiche.