Piledriver: Architettura
Le nuove CPU Piledriver non vanno a rivoluzionare ciò che era stato fatto con l’architettura Bulldozer, ma è stata seguita la strada dell’evoluzione mantenendo tutto ciò che c’era di buono e migliorando per quanto possibile l’architettura. La rivoluzione dell’architettura avverrà più avanti con Streamroller, attesa nel corso del 2013.
All’interno del die troviamo un design del tutto simile a quanto avvenuto con la precedente architettura FX; abbiamo nuovamente la struttura a moduli già vista in Bulldozer. All’interno di ogni modulo vi sono due unità di calcolo Integer affiancate da una in Floating Point condivisa con precisione a 128bit. Ogni modulo include una memoria cache L2 dedicata, che è pari a 2 MB; troviamo altresì un’altra memoria cache L3 condivisa tra tutti i moduli che è pari a 8 Mbytes. Questo approccio consente di avere a disposizione 8 core Integer nei modelli FX-8300 series ed un numero di unità di calcolo Float Point pari a 4.
Come abbiamo avuto modo di appurare con Bulldozer l’ingegnerizzazione di questo tipo a moduli, dal punto di vista prestazionale può essere controproducente in alcuni scenari; tali casi possono essere realizzarsi nelle applicazioni che sono particolarmente dipendenti da particolari elaborazioni in virgola mobile. Gli ingegneri AMD hanno però ritenuto che elaborazioni come queste siano piuttosto rare in ambito consumer e desktop, privilegiando la parallelizzazione dei dati ma peggiorando gli scenari in cui si prevedono anche l’uso massiccio di istruzioni che richiedono la potenza di calcolo di un singolo core. I risultati anche da noi evidenziati nella recensione di Bulldozer ha messo in rilievo proprio questo fattore in contrapposizione alla grande potenza di elaborazione vista sulle CPU Intel che con la propria architettura hanno evidenziato un IPC molto elevato per singolo core. Le elevate frequenze di funzionamento, adesso ancora più evidenti con la CPU FX-8350, e il numero elevato di core fisici ha permesso comunque di bilanciare questo aspetto carente della CPU FX di AMD.
AMD ben consapevole di questo limite appena esposto nella propria architettura, ha cercato di migliorare con Piledriver di incrementare l'IPC della propria CPU con una serie di ottimizzazioni architetturali interne; figurano tra queste un miglioramento della logica di hardware prefetcher, un incremento della L1 Translation Look-aside Buffer, miglioramenti vari nel branch prediction e nella load queue.
Questi miglioramenti hanno reso Vishera più efficiente sia in termini di potenza elaborativa sia in termini di assorbimento di corrente TDP; purtroppo il maggior freno per AMD è dovuto a GlobalFoundries e a un processo produttivo che a oggi è in ritardo di 18 / 24 mesi sulla tabella di marcia. Intel dal canto suo grazie alle molte fabbriche che possiede, nonché al know-out ed a notevoli investimenti nel campo della ricerca, riesce ad oggi a sfornare sul mercato processori molto più efficienti dal punti di vista della forza bruta di calcolo ma che come vedremo più avanti ben più costosi e quindi con un rapporto prestazioni/prezzo più alto e meno conveniente.
Come si evince dalla tabella di confronto con i processori Intel un processo produttivo più avanzato permette di produrre un Die più compatto e nello stesso tempo a farci stare un numero maggiore di transistor e poiché sono più piccoli la produzione di calore sarà inferiore come anche la quantità di corrente richiesta sarà inferiore.