Les États-Unis brandissent le marteau contre le Nvidia RTX 4090D « Dragon » conforme aux sanctions – la loi mise à jour interdit l'exportation de GPU de 70 téraflops ou plus vers la Chine

Le gouvernement américain a révisé ses restrictions chinoises à l’exportation de semi-conducteurs pour englober du matériel plus performant. Plus précisément, toute puce semi-conductrice offrant plus de 70 « TéraFLOPS pondérés » de performances est désormais interdite d'exportation vers la Chine sans licence. Cette limite abaissée inclut désormais la carte graphique RTX 4090D “Dragon” exclusive à la Chine de Nvidia.

Le RTX 4090D a été spécialement conçu pour se conformer aux interdictions d’exportation imposées par les États-Unis et la Chine il y a plusieurs mois. Le RTX 4090 a dépassé de 10 % la limite de 4 800 puissance totale de traitement (TPP), et Nvidia a donc créé le 4090D pour qu'il se situe en dessous de cette limite (il atterrit à 4 707 TPP). Étonnamment, la nouvelle limite de 70 TFLOPS n’est que 5 % inférieure aux performances de 73,5 TFLOPS du RTX 4090D.

Même si ce changement semblait inévitable, nous devons nous demander s’il est réellement significatif. Après le lancement du RTX 4090D, le gouvernement américain a averti Nvidia que ses tactiques ne passeraient pas inaperçues, et il a maintenant décidé d'interdire le GPU exclusif de Nvidia en Chine. Mais une réduction de 5 % de la « limite de vitesse » du GPU est-elle importante, et si oui, que se passe-t-il lorsque Nvidia fabrique un nouveau GPU inférieur à cette limite ?

Le RTX 4090D est une variante réduite du RTX 4090, doté de 14 592 cœurs CUDA et d'un TBP de 425 W. Par rapport au RTX 4090 sortant, le RTX 4090D possède 12,8 % de cœurs CUDA en moins et un TDP de 5,9 % inférieur. Toutes les autres spécifications de base restent les mêmes entre les deux. La seule exception est l'horloge de base, qui a été légèrement augmentée de 2,23 GHz à 2,28 GHz.

Faites glisser pour faire défiler horizontalement
Spécifications RTX 4090D contre 4090
Ligne 0 – Cellule 0 RTX4090DRTX4090
SMS114128
Couleurs CUDA14 59216 384
Noyaux tenseurs456512
Cœurs RT114128
Augmenter l'horloge2 520 MHz2 520 MHz
Horloge de base2 280 MHz2 235 MHz
Vitesse de la VRAM21 Gbit/s21 Gbit/s
Capacité VRAM24 Go GDDR6X24 Go GDDR6X
Largeur du bus VRAM384 bits384 bits
Bande passante VRAM1 008 Go/s1 008 Go/s
Cache L272 Mo72 Mo
ROP176176
TMU456512
TGP425W450W
Puissance de traitement totale47075285

Selon d'autres sites Web qui ont testé la carte, le RTX 4090D est environ 10 % plus lent que le RTX 4090 dans les charges de travail d'IA et seulement 5 % plus lent dans les jeux. Ironiquement, Nvidia n'a jamais complètement « verrouillé » le RTX 4090D, permettant aux joueurs et professionnels chinois d'overclocker le RTX 4090D aux niveaux de performances du RTX 4090.

Le RTX 4090D a été expressément conçu dans le but de se conformer aux restrictions américaines à l’exportation vers la Chine. Ces lois ont été mises en place pour empêcher la Chine et les pays non membres de l’OTAN d’acquérir trop de puissance de calcul – en particulier la puissance de traitement de l’IA – pour des raisons de sécurité. Ces sanctions ont été modifiées à plusieurs reprises au cours des dernières années, ciblant d'abord les puces des centres de données comme les Nvidia A100 et Nvidia H100, mais plus tard, le RTX 4090 a été victime des restrictions car il était 10 % « trop rapide ».

La métrique actuelle utilisée pour calculer les performances maximales autorisées est connue sous le nom de TPP ou Total Processing Power. Ceci est calculé par le calcul maximum pour une profondeur de bits donnée, en utilisant TFLOPS (ou TOPS pour le travail entier) multiplié par le nombre de bits. Pour le RTX 4090, le TPP est de 660,8 * 8 = 5 286 pour le travail FP8 exécuté sur les cœurs Tensor (la rareté ne compte pas).

Les nouvelles réglementations modifient apparemment la limite définie pour inclure les « TeraFLOPS pondérés », mais négligent de définir clairement ce que cela signifie. Cependant, sur la base du langage, nous supposons qu'il s'agit du FP32 TFLOPS. Le RTX 4090 pour référence offre 82,6 TFLOPS de calcul, tandis que le RTX 4090D le réduit à 73,5 TFLOPS – et la prochaine étape vers le bas pour les GPU grand public de Nvidia est le RTX 4080 Super à « seulement » 52,2 TFLOPS. Notez également que ces limites abaissées à plusieurs reprises commencent à empiéter sur le RX 7900 XTX d'AMD, qui offre 61,4 TFLOPS de calcul.

Bien que le gouvernement ne désigne pas spécifiquement le RTX 4090D comme raison des nouvelles restrictions, il y a fort à parier que la carte sera abandonnée dans un avenir proche. Nvidia pourrait conserver le 4090D et le rebaptiser pour un public occidental… ou il pourrait simplement sortir un nouveau GPU qui se conforme une fois de plus aux manigances des sanctions. Appelons-le le RTX 4090 DD « Double Dragon » et donnons-lui 108 multiprocesseurs de streaming et 13 824 cœurs CUDA, et peut-être un TGP de 400 W – et surtout, 69,7 TFLOPS de calcul. Ensuite, cela redeviendrait conforme, déplacerait des dizaines de milliers d’unités vers la Chine et entraînerait probablement une nouvelle réduction des performances d’exportation autorisées.

Les nouvelles restrictions entreraient en vigueur le 4 avril 2024. Nvidia n’a annoncé aucune réponse aux limites inférieures, même si elle les respectera bien entendu. Mais fondamentalement, si 80 TFLOPS étaient trop rapides, et maintenant 70 TFLOPS sont également trop rapides, les États-Unis devront à un moment donné fixer une limite stricte et s'y tenir – sinon ils finiront par « interdire » les GPU qui ont été abandonnés depuis longtemps. . Il est peu probable que les restrictions soient pleinement efficaces, car de nombreux clients chinois ont encore faim de GPU.

Laisser un commentaire