Note de l'éditeur : Marvell a annoncé la nouvelle génération de Thunderx3 et Tonnerre x4. Espérons qu'ils feront plus de bruit que le x2.
Tout le monde aime l'histoire d'un outsider.
Avec la domination de longue date des puces Xeon d'Intel sur le marché de l'électronique grand public, le marché de l'électronique grand public est en pleine expansion. serveur tout candidat potentiel ne peut que susciter un réel intérêt de la part du marché.
Le nouveau processeur ARM de Cavium, le Thunderx2, a certainement suscité de l'intérêt.
Comme pour Mémoire 3D XpointIl a été présenté dans divers articles de relations publiques, revues techniques et blogs comme la prochaine grande nouveauté.
Comme pour beaucoup de choses, le battage médiatique est justifié à certains endroits et moins à d'autres.
Le prix de la Cavium ThunderX2 est très compétitif.
Elle dispose d'un nombre suffisant d'UGS pour offrir une gamme flexible, et ses plates-formes semblent certainement rivaliser avec les standards.
Même des vendeurs comme HPE et Cray sont en train de prendre le relais.
Cependant, comme dans toute histoire d'outsider, la Cavium ThunderX2 doit encore surmonter de nombreux obstacles.
Il faudra peut-être attendre un certain temps avant qu'il ne puisse prétendre à une véritable présence sur le marché après sa sortie officielle.
Dans cet article, nous allons passer en revue ce que nous savons jusqu'à présent et les paramètres importants à prendre en compte lors de l'évaluation de la ThunderX2.
Prix du Cavium ThunderX2
Cavium est certainement impressionnant du point de vue du prix, avec des puces allant de $800 à $1795.
Cavium's noyau le 9980, offre des performances comparables à celles de l'Intel Xeon Gold 6148 pour un prix inférieur de 70%.
En ce qui concerne les performances par dollar, Cavium est tout aussi performant sur l'ensemble de la gamme SKU.
Ceci étant dit, Intel fixe le prix de son produit en tant que leader incontesté du marché.
Ils pourraient très facilement baisser les prix pour rivaliser avec la gamme Thunder X2 en termes de performance par dollar si jamais la part de marché diminuait.
Consommation électrique de Cavium Thunderx2
Bien qu'il n'y ait pas eu de tests officiels de consommation d'énergie comme le TDP, les premiers tests de la communauté Cavium ThunderX2 ont montré que la consommation d'énergie à vide et le TDP étaient supérieurs à ceux de la technologie Processeurs Intel.
Dans certains cas, cet excédent est très important.
Un testeur a noté une consommation d'énergie de 300 W au repos, et un autre a annoncé plus de 800 W en charge maximale.
Bien que cela ait suscité des critiques, c'est une pratique très courante dans les phases de préversion des produits de l'UE. matériel d'avoir des problèmes d'efficacité ou de fonctionnalités à résoudre.
Il reste à voir à quoi ressembleront les repères officiels une fois que les puces seront devenues courantes.
Ceci étant dit, il est peu probable que les changements de microprogrammes produisent plus que des améliorations marginales de l'efficacité énergétique.
Performance informatique de ThunderX2
Informatique générale
Pour un usage général informatique la ThunderX2 a des limites.
Il obtient de bons résultats dans les tests multithreads, mais se laisse distancer par l'E5-2699 V3 dans les tests plus simples, comme l'UnixBench Whetstone.
Comme le Thunder original avant lui, le ThunderX2 est plus adapté aux serveurs web, aux bases de données ou à d'autres applications à faible niveau de parallélisme d'instructions (ILP).
Contrairement à la plateforme EPYC d'AMD à 8 nœuds, la ThunderX2 utilise deux nœuds NUMA comme Intel, ce qui est probablement plus intéressant si vous espérez éviter les sauts de tissu avec des applications non compatibles NUMA.
Cependant, hormis le prix, il n'y a rien ici pour les charges de travail standard qui auraient démantèlement des centres de données tous serveur pour monter dans le train de l'ARM.
Calcul à haute performance
En ce qui concerne le calcul à haute performance (HPC), ThunderX2 est impressionnant.
Le ThunderX2 de Cavium obtient d'excellents résultats dans les tests de corrélation avec les normes de sécurité. mémoire-Les applications de bande passante liée pour la performance, telles que OpenFOAM, Stream, CloverLeaf et TeaLeaf.
Cependant, il n'est pas à la hauteur pour les tests de code liés au calcul, tels que GROMACS et VASP.
En fait, tous les tests qui s'appuient sur le cache s'avèrent moins prometteurs.
La ThunderX2 présente une bande passante de cache L1 et L2 inférieure, ainsi qu'un débit en virgule flottante (FLOPS) inférieur.
Ces limitations pourront être résolues à l'avenir avec les ARM équipés de la technologie SVE (Scalable Vector Extension) qui contiennent des unités vectorielles plus larges.
Un obstacle souvent présumé est que les codes HPC sont déjà très optimisés pour x86, de sorte que les nouvelles implémentations ARM n'ont qu'une efficacité médiocre en comparaison.
Cependant, il est surprenant de constater que peu de codes sont hyper optimisés pour le calcul intensif.
Certains, comme GROMACS, présentent un avantage, mais pas autant que d'aucuns pourraient le supposer.
De nombreuses applications ne se prêtent pas à des performances optimales avec une utilisation efficace des vecteurs les plus larges.
Dans l'ensemble, la gamme ThunderX2 s'avère prometteuse pour le HPC et plus particulièrement pour les conceptions très parallèles de sociétés telles que Cray.
Compatibilité de ThunderX2 avec les applications existantes
La plupart des éditeurs de logiciels ne prennent pas en charge les architectures non-x86.
Un grand nombre de plates-formes en nuage sont basées sur linux et pourraient donc être recompilées pour ARM.
Cependant, de nombreuses applications sont optimisées pour des lignes de processeurs spécifiques.
Il est possible que Thunderx2 gagne des parts de marché grâce à son prix attractif.
Dans ce cas, il est possible que les suspects habituels apportent un soutien plus important pour favoriser son adoption.
Un domaine qui constituera certainement un obstacle est le déploiement dans des environnements virtualisés.
Vous ne pouvez pas arrêter une VM basée sur Xeon et redémarrer sur un système ARM comme vous pouvez le faire sur un autre système Xeon.
Ce n'est pas une mince affaire, car la virtualisation est désormais la norme : plus de 75% des organisations utilisent des systèmes virtualisés. serveurs.
Le ThunderX2 dispose-t-il d'options de plate-forme serveur efficaces ?
Plusieurs OEM et vendeurs ODM de boîtes blanches se sont engouffrés dans la brèche, avec HPECray, Inventec et bien d'autres fournissent maintenant des plates-formes X2.
Le matériel est comparable et ne présente pas d'obstacle à la mise en œuvre de la politique de l'UE. matériel compatibilité avec systèmes de stockage ou de l'équipement de mise en réseau.
Des caractéristiques standard telles qu'une interface graphique web comparable et une gestion IPMI hors bande rendent le ThunderX2 plus viable avec de meilleures performances. gestion des stocks que les offres précédentes.
Le ThunderX2 est-il vulnérable à Spectre ?
Spectre est un problème inhérent à l'exécution hors ordre, donc oui, thunderx2 devrait être tout aussi vulnérable à spectre que les autres puces.
Vous devrez appliquer les mêmes mesures de protection, mais heureusement, les derniers correctifs Linux n'altèrent pas les performances de manière significative.
Réflexions finales
Le Thunderx2 de Cavium et l'ARM en général ne vont pas remplacer le x86 de sitôt.
Théoriquement, il n'y a aucune raison de ne pas faire quelque chose d'équivalent à x86 avec ARM. Il n'y a aucune raison de ne pas investir de l'argent dans la fabrication de cœurs ARM plus grands, avec un prétraitement et une SIMD équivalents.
Mais Intel a investi des milliards de dollars dans ce concept, et l'histoire nous apprend que battre un géant à son propre jeu n'est généralement pas une proposition gagnante.
ThunderX2 est à la traîne pour les charges de travail plus générales.
Il y en a certainement assez dans le monde moderne. serveur afin d'empêcher son adoption de facto.
Les premières estimations du TDP et de la consommation d'énergie n'aident pas non plus.
Toutefois, cette architecture est très efficace pour gérer des types spécifiques de charges de travail.
Grâce à sa bande passante mémoire, il peut constituer une solution unique pour les environnements d'applications à mémoire limitée.
Dans le passé, nous avons vu GPU Les produits de ce type sont de plus en plus utilisés au fur et à mesure qu'ils s'adaptent à leur créneau grâce à des algorithmes itératifs.
Peut-être qu'ARM peut, de la même manière, jouer son propre rôle dans le domaine du calcul intensif et dans d'autres cas d'utilisation de niche.
La loi de Moore est morte depuis longtemps, UNITÉ CENTRALE Les fabricants, grands et petits, se concentreront davantage sur le traitement parallèle que sur l'accélération des cœurs individuels. Le nouveau paradigme a été défini. Les progrès seront intéressants à observer.