Anmerkung der Redaktion: Marvell kündigte die nächste Generation der Thunderx3 und Thunder x4. Hoffentlich machen sie mehr von sich reden als die x2.
Jeder liebt die Geschichte eines Außenseiters.
Angesichts der langjährigen Dominanz von Intels Xeon-Chips im Server Markt, wird jeder potenzielle Bewerber ein echtes Marktinteresse auf sich ziehen.
Der neue ARM-Prozessor von Cavium, der Thunderx2, hat sicherlich Interesse geweckt.
Wie bei 3D-Xpoint-SpeicherEs wurde in verschiedenen PR-Artikeln, Fachzeitschriften und Blogs als das nächste große Ding angepriesen.
Wie bei vielen Dingen ist der Hype an einigen Stellen gerechtfertigt, an anderen weniger.
Der Preis des Cavium ThunderX2 ist sehr wettbewerbsfähig.
Es verfügt über genügend SKUs, um ein flexibles Sortiment zu bieten, und seine Plattformen sehen sicherlich so aus, als könnten sie mit den Standards mithalten.
Auch Anbieter wie HPE und Cray treten auf den Plan.
Wie bei jeder Underdog-Geschichte gibt es jedoch noch viele Hürden, die der Cavium ThunderX2 überwinden muss.
Es kann noch einige Zeit dauern, bis es nach seiner offiziellen Veröffentlichung wirklich auf dem Markt präsent ist.
In diesem Artikel gehen wir darauf ein, was bisher bekannt ist und welche wichtigen Kriterien bei der Bewertung des ThunderX2 zu beachten sind.
Cavium ThunderX2 Preis
Cavium ist sicherlich beeindruckend vom Preis her, mit Chips von $800 bis $1795.
Cavium's Kernstück Der 9980 bietet eine vergleichbare Leistung wie der Intel Xeon Gold 6148 zu einem um 70% niedrigeren Preis.
Was die Leistung pro Dollar angeht, schneidet Cavium über die gesamte SKU-Reihe hinweg ähnlich gut ab.
Dennoch ist Intel mit seinem Produkt unangefochtener Marktführer.
Sie könnten die Preise sehr leicht senken, um mit der Thunder X2-Reihe in Bezug auf die Leistung pro Dollar konkurrieren zu können, falls der Marktanteil jemals sinken sollte.
Cavium Thunderx2 Stromverbrauch
Während offizielle Stromverbrauchs-Benchmarks wie z.B. die TDP nicht veröffentlicht wurden, haben erste Tests der Cavium ThunderX2-Community gezeigt, dass sowohl die Leistungsaufnahme im Leerlauf als auch die TDP über der von Intel-Prozessoren.
In einigen Fällen ist diese Überschreitung beträchtlich.
Ein Tester stellte eine Leistungsaufnahme der Plattform von 300 W im Leerlauf fest, ein anderer gab über 800 W bei Spitzenlast an.
Dies hat zwar Kritik hervorgerufen, ist aber in der Vorveröffentlichungsphase äußerst üblich für Hardware Effizienz- oder Funktionsmängel zu beheben.
Es bleibt abzuwarten, wie die offiziellen Benchmarks aussehen werden, wenn die Chips erst einmal auf dem Markt sind.
Allerdings ist es unwahrscheinlich, dass Firmware-Änderungen mehr als nur marginale Verbesserungen der Energieeffizienz bewirken werden.
ThunderX2-Rechenleistung
Allzweck-Computing
Für allgemeine Zwecke Berechnung hat der ThunderX2 seine Grenzen.
Er schneidet bei Multi-Thread-Tests gut ab, bleibt aber bei Single-Thread-Benchmarks wie dem UnixBench Whetstone sogar hinter dem E5-2699 V3 zurück.
Wie der ursprüngliche Thunder ist auch der ThunderX2 eher für Webserver, Datenbanken oder andere Zwecke mit geringer Parallelität auf Befehlsebene (ILP) geeignet.
Im Gegensatz zur AMD EPYC-Plattform mit 8 Knoten verwendet der ThunderX2 zwei NUMA-Knoten wie Intel, was wahrscheinlich attraktiver ist, wenn Sie hoffen, Fabric Hops mit NUMA-unbewussten Anwendungen zu vermeiden.
Abgesehen vom Preis gibt es hier jedoch nichts, was für Standardarbeitslasten geeignet wäre. Stilllegung von Rechenzentren jede Server um auf den ARM-Zug aufzuspringen.
High Performance Computing
Was das High Performance Computing (HPC) betrifft, ist ThunderX2 beeindruckend.
Cavium's ThunderX2 schneidet in Benchmarks, die mit den folgenden Kriterien korrelieren, sehr gut ab Speicher-gebundene Bandbreitenanwendungen für Leistung, wie OpenFOAM, Stream, CloverLeaf und TeaLeaf.
Bei rechenintensiven Code-Tests wie GROMACS und VASP ist er jedoch unzureichend.
Grundsätzlich sind alle Tests, die sich auf den Cache stützen, weniger vielversprechend.
Der ThunderX2 weist eine geringere L1- und L2-Cache-Bandbreite sowie einen geringeren Fließkommadurchsatz (FLOPS) auf.
Diese Beschränkungen können in Zukunft mit Scalable Vector Extension (SVE)-fähigen ARMs, die breitere Vektoreinheiten enthalten, behoben werden.
Ein oft vermutetes Hindernis ist, dass HPC-Codes bereits sehr stark für x86 optimiert sind, so dass die neueren ARM-Implementierungen im Vergleich dazu wenig effizient sind.
Erstaunlicherweise sind jedoch nur wenige der Codes für HPC hyperoptimiert.
Einige, wie GROMACS, haben einen Vorteil, aber nicht in dem Ausmaß, wie manche vielleicht annehmen.
Viele Anwendungen eignen sich nicht für Spitzenleistungen bei effizienter Nutzung der breiteren Vektoren.
Insgesamt erweist sich die ThunderX2-Reihe als vielversprechend für HPC und insbesondere für die sehr parallelen Designs von Unternehmen wie Cray.
ThunderX2-Kompatibilität mit bestehenden Anwendungen
Die meisten Software-Anbieter unterstützen keine nicht-x86-Architekturen.
Eine beträchtliche Anzahl von Cloud-Plattformen ist linuxbasiert und könnte daher für ARM rekompiliert werden.
Viele Anwendungen sind jedoch für bestimmte Prozessorlinien optimiert.
Es ist möglich, dass Thunderx2 aufgrund seines attraktiven Preises Marktanteile gewinnen kann.
In diesem Fall könnten wir mehr Unterstützung von den üblichen Verdächtigen erhalten, um die Einführung zu fördern.
Ein Bereich, der sicherlich ein Hindernis darstellen wird, ist die Bereitstellung in virtualisierten Umgebungen.
Sie können eine Xeon-basierte VM nicht herunterfahren und auf einem ARM-System wieder hochfahren, wie Sie es auf einem anderen Xeon-System können.
Das ist keine Kleinigkeit, denn Virtualisierung ist heute die Norm, und mehr als 75% der Unternehmen verwenden virtualisierte Server.
Verfügt der ThunderX2 über wirksame Serverplattform-Optionen?
Mehrere OEM und White-Box-ODM-Anbieter sind auf den Zug aufgesprungen, mit HPE, Cray, Inventec und viele andere bieten jetzt X2-Plattformen an.
Die Hardware ist vergleichbar und stellt kein Hindernis für Hardware Kompatibilität mit Speichersysteme oder Netzwerkausrüstung.
Standardfunktionen wie eine vergleichbare Web-GUI und Out-of-Band-IPMI-Management machen den ThunderX2 praktikabler mit besseren Bestandsverwaltung Optionen als bei früheren Angeboten.
Ist der ThunderX2 anfällig für Spectre?
Gespenst ist ein inhärentes Problem von Out-of-Order-Execution, also ja, Thunderx2 sollte genauso anfällig für Spectre sein wie andere Chips.
Sie sollten die gleichen Schutzmaßnahmen ergreifen, aber glücklicherweise beeinträchtigen die neuesten Linux-Patches die Leistung nicht wesentlich.
Abschließende Überlegungen
Thunderx2 von Cavium und ARM im Allgemeinen werden x86 in absehbarer Zeit nicht ersetzen.
Theoretisch gibt es keinen Grund, warum man mit ARM nicht etwas Gleichwertiges wie mit x86 machen könnte. Es gibt keinen Grund, warum man nicht einfach Geld in die Herstellung größerer ARM-Kerne mit gleichwertigem Preteching und SIMD stecken könnte.
Aber Intel hat Milliarden von Dollar in dieses Konzept gesteckt, und die Geschichte zeigt, dass es in der Regel nicht von Vorteil ist, einen Konzernriesen in seinem eigenen Spiel zu schlagen.
ThunderX2 hinkt bei allgemeineren Arbeitslasten hinterher.
Davon gibt es in der modernen Welt sicherlich genug. Server Umwelt, um ihre faktische Einführung zu verhindern.
Auch die frühen TDP- und Stromverbrauchswerte sind nicht hilfreich.
Diese Architektur ist jedoch sehr effektiv bei der Bewältigung bestimmter Arten von Arbeitslasten.
Mit seiner Speicherbandbreite kann er eine einzigartige Lösung für speicherintensive Anwendungsumgebungen bieten.
In der Vergangenheit sahen wir GPUs die mit iterativen Algorithmen in ihre Nische passen.
Vielleicht kann ARM in ähnlicher Weise seine eigene Rolle im HPC und anderen Nischenanwendungen erfüllen.
Das Mooresche Gesetz ist längst tot, CPU Die großen und kleinen Hersteller werden sich mehr auf die Parallelverarbeitung als auf die Beschleunigung einzelner Kerne konzentrieren. Das neue Paradigma ist gesetzt. Die Entwicklung wird interessant zu beobachten sein.