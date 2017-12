Ben ritrovati. Ecco a voi la seconda parte dell’analisi di Nessuno sui nuovi processi produttivi GPU. Qui la prima. Come sempre grazie della pazienza e soprattutto grazie a Nessuno per il suo contributo.

#2. I fatti storici

## 2.1 Annunci, silenzi e sorprese

Abbiamo già raccontato i fatti fino all’arrivo di Fiji sul mercato a metà Giugno 2015.

Ricordiamo solo che nel Marzo dello stesso anno NVIDIA comincia a parlare di Pascal, la nuova architettura che è destinata a rimpiazzare Maxwell.

Non viene specificato il periodo di rilascio, ma solo poche informazioni riguardanti il chip più grande che verrà prodotto, chip che a detta del CEO di NVIDIA avrà 2x le Performance/Watt, 2x la quantità di memoria e 3x la banda di memoria passante rispetto a Maxwell. In conclusione il CEO di NVIDIA afferma che Pascal è 10x quello che è Maxwell, risultato approssimativo che viene moltiplicando insieme tutti i vantaggi di Pascal rispetto a Maxwell, a quanto pare un nuovo modo di calcolare gli avanzamenti tecnologici forgiato in casa NVIDIA.

Poco dopo, per non restare indietro negli annunci, anche AMD parla della sua futura architettura, denominata Polaris (passando così dagli alberi di Terascale, alle isole di GCN 1.x alle stelle di GCN 2.x) successore di GCN 1.2 con la quale sono stati realizzati Fiji e Tonga, due GPU risultate non proprio esaltanti nonostante le premesse. Per non sfigurare rispetto ai semplici numeri dichiarati da NVIDIA, AMD afferma che Polaris sarà 2.5x più efficiente di GCN. Nulla ancora si sa di quale memoria verrà usata, alcuni ipotizzano HBM1 per la versione di fascia media, quella che dovrebbe andare a prendere il posto di Fiji e GM200.

Annunci a parte, dove ovviamente ogni oste esalta a parole e slide il proprio vino (pratica che costa poco), dal rilascio di Fiji da parte di AMD non succede nulla di interessante fino a quando a Dicembre 2015, ancora AMD, è la prima a mostrare una GPU funzionante realizzata a 14nm in un evento pubblico. Niente bench ma solo la conferma che il chip c’è. La dimostrazione, quasi inattesa, è quella della nuova architettura Polaris (evoluzione di GCN) nella sua incarnazione più piccola.

A inizio Gennaio 2016 compaiono le prime slide che parlano della nuova architettura. Una scheda con Polaris 11 (quello più piccolo) è messa a confronto con la GTX 950 (che monta un GM206 non completamente attivo) della concorrente NVIDIA. I numeri che AMD mostra nella slide sono relativi ad un bench di un gioco (Star Wars Battlefront) con Vsync attivo dove si vedono entrambe le soluzioni raggiungere i 60FPS ma con la nuova GPU di AMD che consuma 85W contro i 140W della concorrente e dove compare una affermazione che dice che la nuova architettura permette di risparmiare fino al 60% di energia.

La presentazione della nuova architettura, come è inevitabile riguardo a qualcosa di nuovo che viene presentato dopo anni di mercato stabilizzato, riesce a risvegliare le anime (e gli animi) degli appassionati che sui forum si lanciano in commenti molto entusiastici e perfino descrizioni di scenari fantascientifici con estrapolazione di risultati che in realtà il semplice test non mostra. Diciamo quasi una sorta di delirio collettivo in cui ognuno aggiunge del proprio per tentare di colmare con la fantasia le lacune informative offerte da un test molto limitato. Dal punto di vista del marketing si può dire che le slide sono state un successo e hanno ottenuto quello che AMD si era prefissata: far parlare della nuova architettura, far vedere che AMD c’è e sta costruendo nuove soluzioni più avanzate e contemporaneamente cercare di frenare le vendite fiume che NVIDIA in questo periodo sta facendo.

Durante questo show di AMD, abbastanza in anticipo sui veri tempi di rilascio, NVIDIA è stata silente apparentemente presa alla sprovvista senza avere alcuna soluzione da mostrare pubblicamente. E sappiamo quanto NVIDIA ci tenga a non restare neanche un passo indietro alla concorrenza anche in tema di immagine. Approfondiremo più avanti questa apparentemente inadeguata risposta da parte di NVIDIA.

Inoltre appaiono rumors sempre più numerosi, forse dovuti ad un eco mediatico che rimbalza amplificando tutte le mezze notizie che trapelano, o che qualcuno si inventa di sana pianta, che indicano per AMD un lancio delle sue soluzioni Polaris in Aprile, partendo dal mercato dei notebook, quel mercato che è in casa AMD andato a risecchirsi per colpa di Kepler fin quasi a scomparire del tutto a causa di Maxwell che tanto vantaggio di efficienza energetica poteva godere (e l’efficienza energetica è importante per tutto quello che funziona con una batteria).

Decisione che nel mio piccolo trovo più che corretta: se Polaris è davvero così efficiente come è stato mostrato non c’è dubbio che possa riprendere un bel pezzo del mercato mobile, che vale praticamente la metà del mercato delle GPU discrete, sbaragliando NVIDIA con Maxwell ancora sul vecchio PP e suggerito dal silenzio che mantiene, senza una risposta pronta.

Passano le settimane senza che vi sia alcun altra nuova notizia.

Arriva Aprile, ma i rumors sul rilascio di Polaris mobile che era previsti per questo periodo non si sentono più. AMD tace. Al suo posto però parla NVIDIA.

A inizio Aprile NVIDIA sembra concludere il periodo di silenzio stampa e annuncia pubblicamente che la sua GPU più grande basata su Pascal, il GP100 da oltre 600mmq, è ora disponibile a partner selezionati. Dopo quasi un anno dai primi annunci riguardanti Pascal, l’annuncio di NVIDIA mostra che non se ne è stata con le mani in mano (e come potrebbe con l’obiettivo dell’exaflop nel 2020 insieme a IBM), e lo fa in modo perentorio come ai tempi migliori ovvero con il ritorno alla produzione del chip più grande come prima GPU su un nuovo processo produttivo, strategia abbandonata dopo la catastrofe di Fermi con il GF100. Le premesse per una stagione più che interessante ci sono tutte.

Le specifiche del nuovo GP100 lo dipingono come un chip particolare, con nuove funzionalità (HBM2, nvlink, unità dedicate a FP64 e FP16, organizzazione degli SM diversa rispetto a Maxwell) frequenza altissima a oltre 1500Mhz e prezzo, che non ha nulla a che vedere con le GPU destinate al mondo consumer. È leggermente più piccolo del GM200 che equipaggia le GeForce Titan X e le GTX980Ti, ma grazie alla maggiore densità permessa dal nuovo PP NVIDIA è riuscita a costruire un chip completamente diverso e di ben altra caratura, destinato ad un diverso mercato per costi e margini decisamente differenti.

Nonostante le note differenze tra il chip destinato al mercato professionale e le soluzioni per il mercato consumer che distinguono le GPU NVIDIA, le discussioni su quelle che saranno le caratteristiche della nuova architettura si moltiplicano. Alcuni sottolineano come NVIDIA abbia diviso nettamente i due mercati, e quindi è quasi ovvio che non si troverà nulla di estremamente costoso nel mercato consumer, come l’HBM (v1 o v2 che sia), per esempio. Anche se c’è chi ci spera ancora.

Nonostante tutto il parlare, gli annunci e rumors, neanche ad Aprile si vedono bench di nuove GPU.

##2.2 Finalmente le nuove schede!!!

Dopo tanto parlare di rumors, di nuove architetture minuscole in preview e di giganti in produzione, di numeri sulla carta, date di rilascio presunte, di mirabolanti caratteristiche avanzate, mentre tutti aspettano l’ormai più che sicura mossa di anticipo di AMD sulla rivale di sempre, mossa che le permetterebbe di avere qualche settimana di vantaggio (o mese… NVIDIA potrebbe aver usato tutta la capacità produttiva a 16nm per il nuovo GP100 a seconda delle rese del nuovo PP) con dei buoni margini, a inizio Maggio a sorpresa è NVIDIA ad annunciare l’imminente lancio di soluzioni post 28nm sul mercato consumer. E lo farà partendo da GPU che sulla carta vanno a competere con (e forse superare) il suo mostro sul mercato, la GTX980Ti basata sull’enorme (e sotto certi versi fortunato) GM200 da 601mmq.

Continua la riffa delle presunte caratteristiche di questa nuova GPU, tanto potente da superare secondo le parole stesse di NVIDIA già il massimo presente sul mercato. Sarà piccola, no sarà grande, forse più grande, consumerà uno sproposito, anzi no poco visto che è 2X Maxwell in efficienza, le frequenze (altissime indicate e già suggerite da quelle del GP100 che è una CPU per server destinata ad un mercato dove l’efficienza energetica è quasi più importante delle prestazioni assolute) sono troppo alte, il PP non è maturo per quelle specifiche, sono in OC massimo, servirà il raffreddamento a liquido, faranno come con il GF100 e creeranno un forno… insomma da una parte una esaltazione delle caratteristiche positive, dall’altra la solita caccia alle streghe prima di verificare i fatti. Normale amministrazione come per ogni periodo di pre lancio dove le informazioni sono dei bocconi da afferrare più con i neuroni che contenderli con i denti (e sempre più spesso fiumi di articoli e relativi commenti che tirano ad indovinare più che essere basati su cose certe).

A inizio Giugno vengono rilasciate le reali specifiche delle nuove schede NVIDIA basate sul GP104, ovvero la GTX1080 e GTX1070: dimensione di 330mmq, consumo massimo di 180W, 2560 shader, 160 TMU, 64 ROP, bus da 256bit, debutto della nuova memoria GDDR5X sulla 1080 che garantisce una banda di 320GB/s (contro i 336GB/s della 980Ti ottenuti però tramite l’uso di un più costoso ed energivoro bus a 384bit).

A stupire è sopratutto la frequenza di boost di oltre 1800MHz laddove le migliori performance del GM200 si fermavano intorno ai 1500MHz per gli esemplari più fortunati e raffreddati a liquido. Addirittura in una presentazione pubblica NVIDIA mostra una scheda GTX1080 funzionare oltre i 2Ghz con il solo raffreddamento ad aria con ventole al 100%. I dubbi sorgono come funghi. Se ciò non bastasse, si aggiunge la nuova strategia di NVIDIA di presentare le schede Founder Edition, che sono delle reference con la solita soluzione di raffreddamento a centrifuga, schede decenti ma non certo il massimo possibile, che saranno le uniche disponibili per le prime settimane a prezzo maggiorato. Cioè, per la prima volta NVIDIA vuole vendere schede reference ad un prezzo superiore a quelle custom, riservandosi qualche settimana di esclusiva.

Ne esce uno scenario un po’ bizzarro dove i prezzi per un chip di serie x04 sono altissimi. Abbiamo già detto che NVIDIA con Kepler aveva promosso a fascia superiore chip che prima erano destinati a fasce inferiori, ma qui si arriva a far pagare un chip da 330mmq qualcosa come 700 euro e alcune custom che in teoria sarebbero dovute costare meno della reference, addirittura ben oltre. A pensare che il GF104 del 2010 era grande esattamente come il GP104 ma era montato su una scheda di fascia x60 che era più lenta della 5850 della concorrenza sul mercato già da diversi mesi, e costava $200 al lancio, si capisce subito che qualcosa nel mercato non è andato come avrebbe dovuto negli ultimi 6 anni.

Ci si aspetta dunque che AMD risponda con il nuovo Polaris dalle nuove potenzialità in prestazioni e consumi e metta fine ai prezzi assurdi a cui NVIDIA sta proponendo le nuove soluzioni.

#2.3 Aspettando chi insegue

E dunque AMD a che punto è del suo sviluppo di Polaris presentato mesi addietro? Il discorso riguardo ad AMD è abbastanza interessante, sia prima che dopo la presentazione della propria nuova architettura.

Il debutto inaspettato dopo mesi di silenzio delle soluzioni NVIDIA nel mercato consumer e molto probabilmente anticipato rispetto alla propria roadmap deve aver scombussolato un po’ AMD. Il chip presentato dalla concorrenza sembra essere decisamente un passo avanti (o anche due) rispetto alla propria soluzione, quindi appartenente sì ad una fascia diversa, ma che si presenta al pubblico con ben altri numeri, che sappiamo poi tirare il mercato anche a soluzioni di fascia inferiore. Serve correre ai ripari come meglio possibile.

Lo smarrimento è evidente dalle immediate successive presentazioni (il giorno dopo, quindi ovvio super rush e lavoro notturno) della casa di Sunnyvale: dopo 5 mesi di zero informazioni tecniche riguardanti Polaris, improvvisamente vengono annunciate le caratteristiche base di Polaris 10. Si sa il numero di shader, la dimensione del bus e un generico valore di consumo inferiore a 150W. Viene ribadito che l’efficienza è migliorata di 2.5x rispetto a GCN. Viene quindi data anche una generica roadmap di Polaris, con il ritorno della strategia “piccolo è bello”, visto che AMD annuncia di non aver in programma alcun chip più grande di Polaris 10 (di soli 232mmq) prima del 2017.

Subito prima del Computex le schede 1080 e 1070 sono pubblicamente testate e i risultati mostrano prestazioni “monster”, superiori e non di poco della GTX980Ti, il massimo per ora sul mercato (tralasciando le Titan che sono di altra categoria, costi e destinazioni d’uso).

Tali specifiche rispettano le dichiarazioni di NVIDIA sul fatto che la 1080 sarebbe stata più veloce della Titan X (basata sul GM200 completo) e all’incirca equivalente ad uno SLI di 980. La 1070 si pone esattamente allo stesso livello di prestazioni di una 980Ti leggermente OC. Il tutto per un consumo che è di 180W per la 1080 e 160W per la 1070.

Al Computex a fine Maggio AMD annuncia finalmente il nome della scheda su cui monterà Polaris 10, la RX-480 (i rumor parlavano di 480X o 490) insieme ad una serie di slide che sono abbastanza “liberamente interpretabili” rispetto ai numeri certi che le schede NVIDIA hanno già dimostrato.

Viene mostrata una slide in cui si evidenzia che una configurazione CF di 480 batte una 1080 (con un gioco che è basato sulle DX12 molto ottimizzato per l’architettura AMD che precede tutto il mercato con l’uso di feature messe a disposizione dalla nuova libreria grafica finora mai viste in altre produzioni) con specificato un 50% di carico di lavoro che crea parecchio hype.

La slide lascia intendere che Polaris 10 è quasi a livello delle prestazioni della 1080 a singola scheda, al netto del bench ad hoc super favorevole probabilmente molto vicino a quella 1070 che usa il GP104 castrato. Ma la cosa non è chiara e AMD non spiega (e non spiegherà mai) in maniera esaustiva qual è il senso di quella slide.

Comunque sia, è sufficiente aspettare poche settimane per avere il confronto reale tra i prodotti delle due aziende concorrenti. Ovviamente durante queste poche settimane si è scatenata la gara al “tira ad indovinare” più grande (e delirante, seppur divertente) possibile, sia sulle probabili prestazioni di Polaris, sia per quanto riguarda tutti i possibili scenari che sarebbero cominciati dal lancio di Polaris vs Pascal (considerando efficienza e prestazioni comunicate da AMD vs quelle misurate dai test su Pascal).

Quest’ultimo effettivamente non sembra discostarsi da Maxwell in un confronto clock vs clock (sebbene il clock di Pascal sia salito enormemente) e guadagna qualcosa solo con i giochi che sfruttano le DX12 per via di miglioramenti sulla gestione dei thread che in Maxwell mancavano (piccolo approfondimento in futuro). Ci sono quindi tutte le premesse perché AMD possa colmare il gap di efficienza e prestazioni rispetto alla rivale, che sembra si sia limitata ad uno shrink di Maxwell con pochi miglioramenti e sfruttando solo il vantaggio dato dal nuovo PP, ovvero le maggiori frequenze e minori consumi. AMD con il nuovo PP può fare almeno uguale e secondo quanto già annunciato anche meglio, se si tiene conto delle slide che descrivono tutte le migliorie che Polaris ha rispetto all’ormai vecchio GCN 1.2.

Potrebbe essere davvero la volta buona.