Pascal (architecture de carte graphique)

L'architecture Pascal est une architecture de processeur graphique développée par NVidia pour ses cartes graphiques, qui a succédé au cours de l'année 2016 à l'architecture Maxwell annoncé en mars 2014[1]. Elle est nommée en l'honneur du mathématicien, physicien et philosophe français du XVII^e siècle Blaise Pascal[2].

Logo de la série GeForce 10, caractérisée par l'arrivée de l'architecture Pascal

Carte graphique GeForce GTX 1070.

Architecture

L'architecture Pascal inaugure une nouvelle technique de fabrication appelée FinFET (Fin Field Effect Transistor), afin de passer à une finesse de gravure de 16 nm[3]. Le nombre de transistors par unité de surface sera donc plus élevé.

Elle devrait aussi à terme supporter la mémoire HBM 2.

Améliorations

Les améliorations prévues sont :

Le multiprocesseur en continu (SM, streaming multiprocessor) qui se compose de 64 cœurs CUDA, un nombre identique à celui d'AMD GCN UC (unité de calcul). Maxwell en comptait 128, Kepler 192, Fermi 32 et Tesla ne comportait que seulement 8 cœurs CUDA dans une SM ; le GP100 SM est partitionné en deux blocs de traitement, ayant chacun 32 cœurs CUDA simple-précision (single-precision), un tampon d'instruction, un programmateur de chaîne, et deux unités d'expédition.

16 Go HBM 2 en quatre piles avec un bus de 4096 bits et une bande passante mémoire de 720 Go/s.

Mémoire unifiée - architecture mémoire unifiée afin que le CPU et le GPU puissent accéder à la fois à la mémoire principale du système et à la mémoire de la carte graphique à l'aide d'une technologie appelée Page Migration Engine.

NVLink - un bus à haute vitesse de puissance efficace entre le CPU et le GPU, et entre plusieurs GPU. Il permet des vitesses de transfert beaucoup plus élevées que celles pouvant être atteintes en utilisant PCI Express ; estimée à fournir entre 80 et 200 Go/s[4] - [5].

Les opérations en virgule flottante 16 bits (half precision) peuvent être exécutées deux fois plus vite que celles en virgule flottante 32 bits (single precision)[6] et les opérations en virgule flottante 64 bits (double precision) exécutées en moitié moins de temps que les opérations en virgule flottante 32 bits (Maxwell taux 1/32)[7].

Modèles

Sous la marque GeForce

Modèles	GeForce GT 1030	GeForce GTX 1050 [8] - [9] - [10]	GeForce GTX 1050 Ti [8] - [9] - [10]	GeForce GTX 1060 3Go [11] - [12] - [13]	GeForce GTX 1060 6Go [11] - [12] - [13]	GeForce GTX 1070 [11] - [12] - [14]	GeForce GTX 1070 Ti	GeForce GTX 1080 [11] - [12] - [15]	GeForce GTX 1080 Ti	Titan X (Pascal)[16] - [17]	Titan Xp
Finesse de gravure	14 nm			16 nm
Code de la puce	GP108-300	GP107-300	GP107-400	GP106-300	GP106-400	GP104-200	GP104-300	GP104-400	GP102-350	GP102-400	GP102-450
Surface de la puce	74 mm²	135 mm²		200 mm²		314 mm² [18]			471 mm² [19]
Nombre de transistors	~1.8 G	3,3 G		4,4 G		7,2 G			12 G
Fréquence	1228 MHz	1354 MHz	1290 MHz	1506 MHz	1506 MHz	1506 MHz	1607 MHz	1607 MHz	1480 MHz	1417 MHz	1405 MHz
Fréquence Turbo	1468 MHz	1455 MHz	1392 MHz	1708 MHz	1708 MHz	1683 MHz	1683 MHz	1733 MHz	1584 MHz	1531 MHz	1582 MHz
Cœurs CUDA	384	640	768	1152	1280	1920	2432	2560	3584	3584	3840
Unités de texture	24	40	48	72	80	120	152	160	224	224	240
ROP	16	32	32	48	48	64	64	64	88	96	96
Cache L2		1024 Ko		1536 Ko		2048 Ko			2816 Ko	3072 Ko
Type de mémoire	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5X	GDDR5X	GDDR5X	GDDR5X
Capacité mémoire	2 Go	2 Go	4 Go	3 Go	6 Go	8 Go	8 Go	8 Go	11 Go	12 Go	12 Go
Vitesse mémoire	6 Gbits/s	7 Gbits/s	7 Gbits/s	8 Gbit/s	8 Gbit/s	8 Gbit/s	8 Gbit/s	10 Gbit/s	11 Gbits/s	10 Gbits/s	11 Gbits/s
Largeur du bus mémoire	64 bits	128 bits	128 bits	192 bits	192 bits	256 bits	256 bits	256 bits	352 bits	384 bits	384 bits
Débit mémoire	48 Go/s	112 Go/s	112 Go/s	192 Go/s	192 Go/s	256 Go/s	256 Go/s	320 Go/s	484 Go/s	480 Go/s	547 Go/s
Fréquence mémoire	1502 MHz	1752 MHz	1752 MHz	2000 MHz	2000 MHz	2000 MHz	2000 MHz	1251 MHz	1375 MHz	1251 MHz	1425 MHz
Enveloppe thermique (TDP)	30 W	75 W	75 W	120 W	120 W	150 W	180 W	180 W	220 W	250 W	250 W
Calcul FP16	17 GFLOPs
Calcul FP32	1.1 TFLOPs	1,9 TFLOPS	2,1 TFLOPS	3,9 TFLOPS	4,4 TFLOPS	6,5 TFLOPS	8.2 TFLOPS	8,9 TFLOPS	11 TFLOPS	11 TFLOPS	12 TFLOPS
Calcul FP64	35 GFLOPS
Date de sortie	17 mai 2017	8 novembre 2016	25 octobre 2016	19 juillet 2016	19 juillet 2016	10 juin 2016	2 novembre 2017	27 mai 2016	10 mars 2017	2 août 2016	6 avril 2017

Sous la marque Quadro

Modèles	Quadro P400	Quadro P600	Quadro P1000	Quadro P2000	Quadro P4000	Quadro P5000[20] - [21]	Quadro P6000[20] - [21]	Quadro GP100
Finesse de gravure	14 nm			16 nm
Code de la puce	GP107			GP106	GP104		GP102	GP100
Surface de la puce	132 mm²			200 mm²	314 mm²		471 mm²	610 mm²
Nombre de transistors	3.3 G			4.4 G	7.2 G		12 G	15.3 G
Fréquence	1228 MHz	1354 MHz	1266 MHz	1370 MHz	1202 MHz	1607 MHz	1506 MHz	1380 MHz
Fréquence Turbo	1328 MHz	1455 MHz	1354 MHz	1470 MHz	1480 MHz	1733 MHz	1645 MHz	1441 MHz
Cœurs CUDA	256	384	640	1024	1792	2560	3840	3584
Unités de texture	16	24	40	64	112	160	240	224
ROP	16	16	32	40	64	64	96	96
Cache L2	512 Ko	1024 Ko		1280 Ko	2048 Ko		3072 Ko	4096 Ko
Type de mémoire	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5X	GDDR5X	HBM2
Capacité mémoire	2 Go	2 Go	4 Go	5 Go	8 Go	16 Go	24 Go	16 Go
Vitesse mémoire	1000 MHz	1000 MHz	1250 MHz	2000 MHz	1900 MHz	1127 MHz	1127 MHz	900 MHz
Largeur du bus mémoire	64 bits	128 bits	128 bits	160 bits	256 bits	256 bits	384 bits	4096 bits
Débit mémoire	32 Go/s	64 Go/s	80 Go/s	160 Go/s	243 Go/s	288 Go/s	432 Go/s	921 Go/s
Enveloppe thermique (TDP)	30 W	40 W	47 W	75 W	105 W	180 W	250 W	250 W
Calcul INT8	2.7 TIOPS	4.4 TIOPS	6.9 TIOPS	12 TIOPS	21.2 TIOPS	35.5 TIOPS	50.5 TIOPS
Calcul FP16	10 GFLOPS	17 GFLOPS	27 GFLOPS	47 GFLOPS	83 GFLOPS	138 GFLOPS	187 GFLOPS	20 TFLOPS
Calcul FP32	680 GFLOPS	1.1 TFLOPS	1.7 TFLOPS	3 TFLOPS	5.3 TFLOPS	8.9 TFLOPS	12 TFLOPS	10 TFLOPS
Calcul FP64	21 GFLOPS	35 GFLOPS	54 GFLOPS	94 GFLOPS	166 GFLOPS	277 GFLOPS	395 GFLOPS	5 TFLOPS
Date de sortie	février 2017	février 2017	février 2017	février 2017	février 2017	octobre 2016	octobre 2016	octobre 2016

Sous la marque Tesla

Modèles	Tesla P4	Tesla P40	Tesla P100 PCIe 12GB	Tesla P100 PCIe 16GB	Tesla P100 SXM2
Finesse de gravure	16 nm
Code de la puce	GP104-995-A1	GP102	GP100		GP100-893-A1
Surface de la puce	314 mm²	471 mm²	610 mm²
Nombre de transistors	7.2 G	12 G	15.3 G
Fréquence	810 MHz	1303 MHz	1328 MHz	1328 MHz	1328 MHz
Fréquence Turbo	1063 MHz	1531 MHz	1480 MHz	1480 MHz	1480 MHz
Cœurs CUDA	2560	3840	3584	3584	3584
Unités de texture	160	240	224	224	224
ROP	64	96	96	96	96
Cache L2	2048 Ko	3072 Ko	3072 Ko	4096 Ko
Type de mémoire	GDDR5	GDDR5	HBM2	HBM2	HBM2
Capacité mémoire	8 Go	24 Go	12 Go	16 Go	16 Go
Vitesse mémoire	1500 MHz	1250 MHz	704 MHz	704 MHz	704 MHz
Largeur du bus mémoire	256 bits	384 bits	3072 bits	4096 bits	4096 bits
Débit mémoire	192 Go/s	480 Go/s	540 Go/s	721 Go/s	721 Go/s
Enveloppe thermique (TDP)	75 W	250 W	300 W	300 W	300 W
Calcul INT8	21.7 TIOPS	47 TIOPS
Calcul FP16	85 GFLOPS	183 GFLOPS	21.2 TFLOPS	21.2 TFLOPS	21.2 TFLOPS
Calcul FP32	5.4 TFLOPS	11.7 TFLOPS	10.6 TFLOPS	10.6 TFLOPS	10.6 TFLOPS
Calcul FP64	170 GFLOPS	367 GFLOPS	5.3 TFLOPS	5.3 TFLOPS	5.3 TFLOPS
Date de sortie	septembre 2016	septembre 2016	juin 2016	juin 2016	avril 2016

Notes et références

(en) « NVIDIA Developer Blog / Technical content : For developers, by developers », sur NVIDIA Developer Blog (consulté le 3 septembre 2020).
(en) « NVIDIA Updates GPU Roadmap; Announces Pascal / The Official NVIDIA Blog », sur The Official NVIDIA Blog, 25 mars 2014 (consulté le 3 septembre 2020).
« Architecture de GPU | NVIDIA », sur www.nvidia.fr
(en) « Inside Pascal : NVIDIA’s Newest Computing Platform / NVIDIA Developer Blog », sur NVIDIA Developer Blog, 5 avril 2016 (consulté le 3 septembre 2020).
(en) « NVLink, Pascal and Stacked Memory : Feeding the Appetite for Big Data / NVIDIA Developer Blog », sur NVIDIA Developer Blog, 25 mars 2014 (consulté le 3 septembre 2020).
(en) « NVIDIA Pascal GPU Architecture to Provide 10X Speedup for Deep Learning Apps / NVIDIA Blog », sur The Official NVIDIA Blog, 17 mars 2015 (consulté le 3 septembre 2020).
« The NVIDIA GeForce GTX Titan X Review », sur anandtech.com (consulté le 3 septembre 2020).
« The New GeForce GTX 1050 graphics card », sur www.geforce.com (consulté le 20 octobre 2016)
« Les GTX 1050 et 1050Ti sont officielles ! », Le Comptoir du Hardware,‎ 18 octobre 2016 (lire en ligne, consulté le 20 octobre 2016)
« Jour J pour les cartes Nvidia GeForce GTX 1050 Ti et GTX 1050 », sur www.lesnumeriques.com (consulté le 20 octobre 2016)
(en) Ryan Smith, « NVIDIA Announces GeForce GTX 1060: Starting at $249, Available July 19th » (consulté le 8 juillet 2016)
« Test NVIDIA GeForce GTX 1060 : le milieu de gamme mieux qu'une GTX 980 ? », sur clubic.com, 19 juillet 2016
(en) « The New GeForce GTX 1060 graphics card », sur www.geforce.com (consulté le 8 juillet 2016)
(en) « The New GeForce GTX 1070 Graphics Card », sur www.geforce.com (consulté le 2 juin 2016)
(en) « GeForce GTX 1080 Graphics Card », sur www.geforce.com (consulté le 2 juin 2016)
Damien Triolet, « Nouvelle Nvidia Titan X: GP102, 11 Tflops, 480 Go/s - Cartes Graphiques - HardWare.fr », sur hardware.fr, 22 juillet 2016
(en) « NVIDIA TITAN X Graphics Card with Pascal | GeForce », sur www.geforce.com (consulté le 22 juillet 2016)
« Nvidia Pascal : premiers clichés du GPU GP104 avec GDDR5X », sur www.lesnumeriques.com (consulté le 26 avril 2016)
(en-US) Usman Pirzada, « Nvidia's 'GTX 1080 Ti' Pascal Flagship Will Be Based On The GP102 GPU - Reports Indicate 'Halfway' Point Between a GP104 and the GP100 », sur wccftech.com, 24 mai 2016
David Civera, « NVIDIA Quadro P6000 et P5000 : 3840 cœurs, 24 Go de RAM, de la 4K à 240 Hz ! », sur tomshardware.fr, 26 juillet 2016
(en) « NVIDIA Quadro P6000 and P5000 pictured | VideoCardz.com », sur videocardz.com, 25 juillet 2016