White Paper Performance Report PRIMERGY RX300 S8 White Paper FUJITSU Server PRIMERGY Performance Report PRIMERGY RX300 S8 In diesem Dokument sind alle Benchmarks zusammengefasst, die für den FUJITSU Server PRIMERGY RX300 S8 durchgeführt wurden. Ferner werden die Leistungsdaten der PRIMERGY RX300 S8 mit denen anderer PRIMERGY Modelle verglichen und diskutiert. Neben den Benchmark-Ergebnissen als solchen wird jeder Benchmark und die Umgebung, in der der Benchmark durchgeführt wurde, kurz erläutert. Version 1.3 2015-03-06 http://www.fujitsu.com/de/primergy Seite 1 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Inhalt Dokumenthistorie ................................................................................................................................................ 3 Technische Daten ............................................................................................................................................... 4 SPECcpu2006 .................................................................................................................................................... 7 SPECpower_ssj2008 ........................................................................................................................................ 14 Disk-I/O: Performance von Speichermedien .................................................................................................... 19 Disk-I/O: Performance von RAID-Controllern ................................................................................................... 29 SAP SD ............................................................................................................................................................. 38 OLTP-2 ............................................................................................................................................................. 41 TPC-E ............................................................................................................................................................... 45 STREAM ........................................................................................................................................................... 50 LINPACK .......................................................................................................................................................... 52 Literatur ............................................................................................................................................................. 55 Kontakt .............................................................................................................................................................. 56 Seite 2 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Dokumenthistorie Version 1.0 Neu: Technische Daten SPECcpu2006 ® ® Messungen mit Intel Xeon Processor E5-2600 v2 Product Family SPECpower_ssj2008 Messung mit Xeon E5-2660 v2 Disk-I/O: Performance von RAID-Controllern Messungen mit „LSI SW RAID on Intel C600 (Onboard SATA)“, „LSI SW RAID on Intel C600 (Onboard SAS)“, „RAID Ctrl SAS 6G 0/1 (D2607)“, „RAID Ctrl SAS 5/6 512MB (D2616)“ und „RAID Ctrl SAS 6G 5/6 1GB (D3116C)“ Controllern SAP SD Zertifikationsnummer 2013024 OLTP-2 ® ® Ergebnisse für Intel Xeon Processor E5-2600 v2 Product Family TPC-E Messung mit Xeon E5-2697 v2 STREAM ® ® Messungen mit 2 Prozessoren der Intel Xeon Processor E5-2600 v2 Product Family LINPACK ® ® Messungen mit 2 Prozessoren der Intel Xeon Processor E5-2600 v2 Product Family Version 1.1 Aktualisiert: SPECcpu2006 ® ® Weitere Messungen mit Intel Xeon Processor E5-2600 v2 Product Family LINPACK Messungen mit Xeon E5-2667 v2 Version 1.2 Neu: Disk-I/O: Performance von Speichermedien Ergebnisse für 2.5"- und 3.5"-Speichermedien, PCIe-SSDs und DOM Aktualisiert: Technische Daten Text über Turbomodus aktualisiert 32GB (1x32GB) 4Rx4 DDR3-1866 LR ECC hinzugefügt Modular PSU DC -48V 800W gold hp hinzugefügt Modular PSU 800W titanium hp hinzugefügt Disk-I/O: Performance von RAID-Controllern „PRAID EP400i“ Controller hinzugefügt Version 1.3 Aktualisiert: Disk-I/O: Performance von RAID-Controllern „PRAID EP420i“ Controller hinzugefügt http://www.fujitsu.com/de/primergy Seite 3 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Technische Daten PRIMERGY RX300 S8 PY RX300S8 6x3.5 PRIMERGY RX300 S8 PY RX300S8 2.5" expandable In diesem White Paper werden bei Maßeinheiten Dezimalpräfixe nach SI-Standard verwendet (z.B. 1 GB = 9 10 Byte). Abweichend hiervon sind bei Kapazitäten von Caches und Speichermodulen diese Präfixe als 30 Binärpräfixe (z.B. 1 GB = 2 Byte) zu interpretieren. Im Falle weiterer Ausnahmen wird an entsprechender Stelle gesondert darauf hingewiesen. Modell PRIMERGY RX300 S8 Modellvarianten PY RX300S8 6x3.5 PY RX300S8 2.5" expandable PY RX300S8 8x2.5 PY RX300S8 12x2.5 Formfaktor Rack Server Chipsatz Intel C600 Anzahl Sockel 2 Anzahl bestellbarer Prozessoren 1 oder 2 Prozessortyp Intel Xeon Processor E5-2600 v2 Product Family Anzahl Speichersteckplätze 24 (12 pro Prozessor) Maximaler Speicherausbau 1536 GB Onboard LAN-Controller 2 × 1 Gbit/s Onboard HDD-Controller Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 4 × 2.5" SATA HDDs Optional für PY RX300S8 2.5" expandable: „SAS Enabling Key for Onboard Ports“ für bis zu 4 × 2.5" SAS HDDs PCI-Steckplätze 5 PCI-Express 3.0 x8 2 PCI-Express 3.0 x16 Max. Anzahl interner Festplatten PY RX300S8 6x3.5: 6 PY RX300S8 8x2.5: 8 PY RX300S8 12x2.5: 12 PY RX300S8 2.5" expandable: 16 Seite 4 (56) ® ® ® http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Prozessor Cache Xeon E5-2603 v2 4 4 10 6.40 1.80 entf. 1333 Xeon E5-2609 v2 4 4 10 6.40 2.50 entf. 1333 80 Xeon E5-2637 v2 4 8 15 8.00 3.50 3.80 1866 130 Xeon E5-2620 v2 6 12 15 7.20 2.10 2.60 1600 80 Xeon E5-2630Lv2 6 12 15 7.20 2.40 2.80 1600 60 Xeon E5-2630 v2 6 12 15 7.20 2.60 3.10 1600 80 Xeon E5-2643 v2 6 12 25 8.00 3.50 3.80 1866 130 Xeon E5-2640 v2 8 16 20 7.20 2.00 2.50 1600 95 Xeon E5-2650 v2 8 16 20 8.00 2.60 3.40 1866 95 Xeon E5-2667 v2 8 16 25 8.00 3.30 4.00 1866 130 Xeon E5-2650Lv2 10 20 25 8.00 1.70 2.10 1600 70 Xeon E5-2660 v2 10 20 25 8.00 2.20 3.00 1866 95 Xeon E5-2670 v2 10 20 25 8.00 2.50 3.30 1866 115 Xeon E5-2680 v2 10 20 25 8.00 2.80 3.60 1866 115 Xeon E5-2690 v2 10 20 25 8.00 3.00 3.60 1866 130 Xeon E5-2695 v2 12 24 30 8.00 2.40 3.20 1866 115 Xeon E5-2697 v2 12 24 30 8.00 2.70 3.50 1866 130 Cores Threads Prozessoren (seit System-Release) QPISpeed Nominalfrequenz [Ghz] Max. Turbofrequenz [Ghz] Max. Speicherfrequenz [MHz] [MB] [GT/s] TDP [Watt] 80 Alle mit der PRIMERGY RX300 S8 bestellbaren Prozessoren außer Xeon E5-2603 v2 und Xeon E5-2609 v2 ® unterstützen Intel Turbo Boost Technology 2.0. Diese Technologie ermöglicht den Betrieb des Prozessors mit höheren Frequenzen als der Nominalfrequenz. In der Prozessortabelle steht „Max. Turbofrequenz“ für das theoretische Frequenzmaximum bei nur einem aktiven Core pro Prozessor. Die tatsächlich erreichbare Maximalfrequenz ist abhängig von der Anzahl aktiver Cores, dem Stromverbrauch, der elektrischen Leistungsaufnahme und der Temperatur des Prozessors. Das Erreichen der maximalen Turbofrequenz wird von Intel grundsätzlich nicht garantiert. Dies hängt mit Fertigungstoleranzen zusammen, aus denen eine Varianz bezüglich der Performance verschiedener Exemplare eines Prozessormodells folgt. Das Spektrum der Varianz überdeckt den gesamten Bereich zwischen der Nominalfrequenz und der maximalen Turbofrequenz. Die Turbo-Funktionalität ist per BIOS-Option einstellbar. Grundsätzlich empfiehlt Fujitsu die „Turbo Mode“Option auf der Standardeinstellung „Enabled“ zu belassen, denn durch die höheren Frequenzen wird die Performance deutlich gesteigert. Da die höheren Frequenzen jedoch abhängig von Randbedingungen und nicht immer garantiert sind, kann es für Anwendungsszenarien mit intensiver Verwendung von AVXInstruktionen und hoher Anzahl Instruktionen pro Takteinheit, aber auch solchen, in denen eine konstante Performance oder eine niedrige elektrische Leistungsaufnahme gefordert ist, von Vorteil sein die „Turbo Mode“-Option auszuschalten. http://www.fujitsu.com/de/primergy Seite 5 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 4 1600 8GB (1x8GB) 2Rx8 L DDR3-1600 U ECC 8 2 8 1600 8GB (1x8GB) 1Rx4 L DDR3-1600 R ECC 8 1 4 1600 8GB (1x8GB) 2Rx8 DDR3-1866 R ECC 8 2 8 1866 16GB (1x16GB) 2Rx4 L DDR3-1600 R ECC 16 2 4 1600 16GB (1x16GB) 2Rx4 DDR3-1866 R ECC 16 2 4 1866 32GB (1x32GB) 4Rx4 L DDR3-1600 LR ECC 32 4 4 1600 32GB (1x32GB) 4Rx4 DDR3-1866 LR ECC 32 4 4 1866 64GB (1x64GB) 8Rx4 L DDR3-1333 LR ECC 64 8 4 1333 Netzteile (seit System-Release) ECC Low voltage 1 Registered Frequenz [MHz] 4 Load reduced Ranks 4GB (1x4GB) 1Rx4 L DDR3-1600 R ECC Speichermodul Bitbreite der Speicherchips Kapazität [GB] Speichermodule (seit System-Release) max. Anzahl Modular PSU 450W platinum hp 2 Modular PSU 800W platinum hp 2 Modular PSU DC -48V 800W gold hp 2 Modular PSU 800W titanium hp 2 Einige Komponenten sind möglicherweise nicht in allen Ländern/Vertriebsregionen verfügbar. Detaillierte technische Informationen finden Sie im Datenblatt PRIMERGY RX300 S8. Seite 6 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SPECcpu2006 Benchmark-Beschreibung SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer FließkommaTestsuite (SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht vermessen. SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete Compiler-Version und deren Optimierungseinstellungen das Messergebnis. SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2006 bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt wird. Die zweite Methode (SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele Aufgaben parallel erledigt werden können. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional. Benchmark Arithmetik Typ CompilerOptimierung SPECint2006 Integer peak aggressiv SPECint_base2006 Integer base konservativ SPECint_rate2006 Integer peak aggressiv SPECint_rate_base2006 Integer base konservativ SPECfp2006 Fließkomma peak aggressiv SPECfp_base2006 Fließkomma base konservativ SPECfp_rate2006 Fließkomma peak aggressiv SPECfp_rate_base2006 Fließkomma base konservativ Messergebnis Anwendung Geschwindigkeit Singlethreaded Durchsatz Multithreaded Geschwindigkeit Singlethreaded Durchsatz Multithreaded Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem arithmetischen Mittel dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Der Wert „1“ wurde für die SPECint_base2006-, SPECint_rate_base2006, SPECfp_base2006 und SPECfp_rate_base2006-Ergebnisse des Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base copies] mal so schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele parallele Instanzen des Benchmarks ausgeführt worden sind. Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen. http://www.fujitsu.com/de/primergy Seite 7 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Prozessor Intel Xeon Processor E5-2600 v2 Product Family Speicher 1 Prozessor: 8 × 16GB (1x16GB) 2Rx4 DDR3-1866 R ECC 2 Prozessoren: 16 × 16GB (1x16GB) 2Rx4 DDR3-1866 R ECC ® ® Software BIOS-Einstellungen Energy Performance = Performance SPECint_base2006, SPECint2006, SPECfp_base2006, SPECfp2006: Utilization Profile = Unbalanced Betriebssystem Red Hat Enterprise Linux Server release 6.4 Betriebssystemeinstellungen echo always > /sys/kernel/mm/redhat_transparent_hugepage/enabled Compiler Intel C++/Fortran Compiler 14.0 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 8 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Ergebnisse SPECint_rate_base2006 SPECint_rate2006 Anzahl Prozessoren SPECint_rate_base2006 SPECint2006 Anzahl Prozessoren SPECint_base2006 SPECint_rate2006 Prozessor Anzahl Prozessoren Das Benchmark-Ergebnis hängt prozessorseitig in erster Linie von der Größe des Prozessor-Caches, der Unterstützung von Hyper-Threading, der Anzahl Prozessorkerne und der Prozessorfrequenz ab. Bei Prozessoren mit Turbomodus bestimmt die Anzahl Cores, die durch den Benchmark belastet werden, die maximal erreichbare Prozessorfrequenz. Bei den „singlethreaded“ Benchmarks, die überwiegend nur einen Core belasten, ist die maximal erreichbare Prozessorfrequenz höher als bei den „multithreaded“ Benchmarks. Xeon E5-2603 v2 2 27.8 29.1 1 91.6 95.2 2 179 185 Xeon E5-2609 v2 2 37.9 39.7 1 123 Xeon E5-2637 v2 2 56.3 59.6 1 212 128 2 240 249 220 2 412 428 Xeon E5-2620 v2 2 40.0 42.3 1 Xeon E5-2630Lv2 2 43.0 45.8 1 212 221 2 412 428 228 237 2 442 459 Xeon E5-2630 v2 2 47.4 50.4 1 249 260 2 484 502 Xeon E5-2643 v2 2 59.3 63.6 1 314 326 2 611 636 Xeon E5-2640 v2 2 40.0 42.9 1 268 278 2 519 540 Xeon E5-2650 v2 2 52.6 56.8 1 338 351 2 657 682 Xeon E5-2667 v2 2 62.6 67.4 1 399 413 2 776 805 Xeon E5-2650Lv2 2 34.5 36.9 1 278 289 2 542 563 Xeon E5-2660 v2 2 48.1 51.9 1 368 380 2 716 744 Xeon E5-2670 v2 2 52.7 56.9 1 401 415 2 781 809 Xeon E5-2680 v2 2 56.5 61.1 1 422 436 2 823 852 Xeon E5-2690 v2 2 57.6 61.8 1 442 457 2 863 892 Xeon E5-2695 v2 2 50.8 54.7 1 453 468 2 883 913 Xeon E5-2697 v2 2 55.4 59.9 1 477 493 2 931 962 http://www.fujitsu.com/de/primergy Seite 9 (56) Prozessor SPECfp_base2006 SPECfp2006 Anzahl Prozessoren SPECfp_rate_base2006 SPECfp_rate2006 Anzahl Prozessoren SPECfp_rate_base2006 SPECfp_rate2006 Version: 1.3 2015-03-06 Anzahl Prozessoren White Paper Performance Report PRIMERGY RX300 S8 Xeon E5-2603 v2 2 51.0 52.4 1 103 105 2 199 203 Xeon E5-2609 v2 2 64.9 66.8 1 131 133 2 254 259 Xeon E5-2637 v2 2 94.3 97.6 1 196 201 2 384 394 Xeon E5-2620 v2 2 72.1 74.9 1 193 197 2 377 385 Xeon E5-2630Lv2 2 77.1 80.0 1 202 206 2 396 405 Xeon E5-2630 v2 2 83.4 86.5 1 215 220 2 423 432 Xeon E5-2643 v2 2 1 263 270 2 518 531 Xeon E5-2640 v2 2 74.9 77.8 1 228 233 2 447 458 Xeon E5-2650 v2 2 95.3 99.5 1 276 283 2 542 555 Xeon E5-2667 v2 2 1 302 311 2 595 611 Xeon E5-2650Lv2 2 66.6 69.4 1 234 239 2 458 469 Xeon E5-2660 v2 2 88.4 92.5 1 290 298 2 570 585 Xeon E5-2670 v2 2 99.8 1 306 314 2 602 617 Xeon E5-2680 v2 2 100 105 1 315 324 2 621 638 Xeon E5-2690 v2 2 102 106 1 323 332 2 638 655 Xeon E5-2695 v2 2 91.7 1 333 342 2 657 675 Xeon E5-2697 v2 2 97.4 1 343 353 2 677 696 Seite 10 (56) 102 108 95.5 105 112 96.2 102 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Die folgenden vier Grafiken verdeutlichen den Durchsatz der PRIMERGY RX300 S8 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S7, in jeweils performantester Ausstattung. SPECcpu2006: Integer-Performance PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 67.4 60.5 70 60 62.6 56.3 50 40 30 20 SPECint2006 10 SPECint_base2006 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 x Xeon E5-2690 2 x Xeon E5-2667 v2 SPECcpu2006: Integer-Performance PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 962 1000 900 931 697 800 700 669 600 500 400 300 SPECint_rate2006 200 100 SPECint_rate_base2006 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 x Xeon E5-2690 2 x Xeon E5-2697 v2 http://www.fujitsu.com/de/primergy Seite 11 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SPECcpu2006: Floating-Point-Performance PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 112 120 91.5 100 108 86.8 80 60 40 SPECfp2006 20 SPECfp_base2006 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 x Xeon E5-2690 2 x Xeon E5-2667 v2 SPECcpu2006: Floating-Point-Performance PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 696 677 700 509 600 495 500 400 300 200 SPECfp_rate2006 100 SPECfp_rate_base2006 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 x Xeon E5-2690 2 x Xeon E5-2697 v2 Seite 12 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Die beiden folgenden Grafiken geben wieder, wie die Performance der PRIMERGY RX300 S8 bei Verwendung des Xeon E5-2697 v2 von einem auf zwei Prozessoren skaliert. SPECcpu2006: Integer-Performance PRIMERGY RX300 S8 (2 Sockel vs. 1 Sockel) 962 1000 931 900 800 700 493 600 500 477 400 300 SPECint_rate2006 200 100 SPECint_rate_base2006 0 1 × Xeon E5-2697 v2 2 × Xeon E5-2697 v2 SPECcpu2006: Floating-Point-Performance PRIMERGY RX300 S8 (2 Sockel vs. 1 Sockel) 696 677 700 600 500 400 353 343 300 200 SPECfp_rate2006 100 SPECfp_rate_base2006 0 1 × Xeon E5-2697 v2 2 × Xeon E5-2697 v2 http://www.fujitsu.com/de/primergy Seite 13 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SPECpower_ssj2008 Benchmark-Beschreibung SPECpower_ssj2008 ist der erste Industriestandard-Benchmark von SPEC, der den Stromverbrauch eines Servers im Verhältnis zu dessen Durchsatz beurteilt. Mit SPECpower_ssj2008 hat SPEC in ähnlicher Weise wie auch für Durchsatzmessungen Standards auf dem Gebiet der elektrischen Leistungsmessung definiert. Der Workload des Benchmarks basiert auf typischen serverseitigen Java Business Applikationen. Er ist skalierbar, multi-threaded, auf eine große Anzahl von Plattformen portierbar und leicht auszuführen. Der Benchmark testet CPUs, Caches, die Speicherhierarchie und die Skalierbarkeit von symmetrischen Multiprozessorsystemen (SMPs), wie auch die Implementationen der Java Virtual Machine (JVM), Just In Time (JIT) Compiler, Garbage Collection, Threads und einige weitere Betriebssystemaspekte. SPECpower_ssj2008 zeichnet den Stromverbrauch von Servern bei unterschiedlichen Belastungsstufen — in 10%-Schritten von 100% bis „Active Idle“ — während einer festgesetzten Zeitspanne auf. Der abgestufte Workload ist der Tatsache geschuldet, dass Auslastung und Stromverbrauch von Servern im Verlauf von Tagen oder Wochen deutlich variieren. Zur Berechnung der Power-Performance-Metrik über alle Stufen werden die gemessenen Transaktionsdurchsätze jedes Messintervalls aufsummiert und dann durch die Summe der während jedes Messintervalls durchschnittlich aufgenommenen elektrischen Leistung geteilt. Das Ergebnis ist ein „overall ssj_ops/watt“ genannter Wert. Diese Kennzahl gibt Aufschluss über die Energie-Effizienz des gemessenen Servers. Der definierte Messstandard ermöglicht es einem Kunden Vergleiche anzustellen zwischen verschiedenen Konfigurationen und Servern, die mit SPECpower_ssj2008 vermessen wurden. Das nebenstehende Diagramm zeigt einen typischen Graphen eines SPECpower_ssj2008-Ergebnisses. Der Benchmark läuft auf den unterschiedlichsten Betriebssystemen und HardwareArchitekturen und stellt dabei keine besonderen Anforderungen an die Clientund Storage-Infrastruktur. Die Minimalausstattung für einen SPEC-konformen Test besteht aus zwei vernetzten Computern, sowie einem Strommessgerät und einem Temperatursensor. Der eine Computer ist das System Under Test (SUT), auf dem eines der unterstützten Betriebssysteme und die JVM installiert sind. Die JVM stellt die Umgebung bereit, die für den Ablauf des in Java implementierten SPECpower_ssj2008Workloads benötigt wird. Der zweite Computer ist das sogenannte „Control & Collection System“ (CCS), das die Ausführung des Benchmarks kontrolliert und die elektrische Leistungsaufnahme, sowie die Durchsatzund Temperaturwerte aufnimmt und protokolliert. Das nebenstehende Diagramm gibt Ihnen einen Überblick über die Grundstruktur der Benchmark-Konfiguration mit den dazugehörigen Komponenten. Seite 14 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable Prozessor 2 × Xeon E5-2660 v2 Speicher 6 × 8GB (1x8GB) 2Rx8 L DDR3-1600 U ECC Netzwerk-Interface Onboard LAN-Controller (1 Port verwendet) Disk-Subsystem Onboard HDD-Controller 1 × DOM SATA 3G 64GB Main N H-P Netzteil 1 × Modular PSU 800W titanium hp Software BIOS R1.0.0 BIOS-Einstellungen Hardware Prefetcher = Disabled Adjacent Cache Line Prefetch = Disabled DCU Streamer Prefetcher = Disabled DDR Performance = Low-Voltage optimized Onboard USB Controllers = Disabled Power Technology = Custom QPI Link Frequency Select = 6.4 GT/s QPI Link 1 Disable = Enabled Intel Virtualization Technology = Disabled ASPM Support = Auto DMI Control = Gen1 LAN Controller = LAN 1 Firmware 7.01F Betriebssystem Microsoft Windows Server 2012 Standard Betriebssystemeinstellungen Using the local security settings console, “lock pages in memory” was enabled for the user running the benchmark. Power Management: Enabled (“Fujitsu Enhanced Power Settings” power plan) Set “Turn off hard disk after = 1 Minute” in OS. Benchmark was started via Windows Remote Desktop Connection. JVM IBM J9 VM (build 2.6, JRE 1.7.0 Windows Server 2008 R2 amd64-64 20120322_106209 (JIT enabled, AOT enabled) JVM-Einstellungen start /NODE [0,1] /AFFINITY [0x3,0xC,0x30,0xC0,0x300,0xC00,0x3000,0xC000,0x30000,0xC0000] -Xaggressive -Xcompressedrefs -Xgcpolicy:gencon -Xmx1875m -Xms1875m -Xmn1400m -XlockReservation -Xnoloa -XtlhPrefetch -Xlp -Xconcurrentlevel0 -Xthr:minimizeusercpu Weitere Software IBM SDK Java Technology Edition Version 7.0 for Windows x64, ServerView Agent for Windows, ServerView RAID Manager Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 15 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Ergebnisse Die PRIMERGY RX300 S8 erzielte folgendes Ergebnis: SPECpower_ssj2008 = 8,097 overall ssj_ops/watt Das nebenstehende Diagramm zeigt das Ergebnis der oben beschriebenen Konfiguration. Die roten waagerechten Balken zeigen für die einzelnen Laststufen (an der y-Achse des Diagramms abgebildet) das Verhältnis von Durchsatz zu Energieverbrauch (Performance to Power Ratio) in ssj_ops/watt (x-Achse oben). Die blaue Kurve stellt den durchschnittlichen Energieverbrauch dar (an der xAchse unten abgebildet); die Werte für die einzelnen Laststufen sind jeweils mit einer kleinen Raute gekennzeichnet. Die schwarze senkrechte Linie zeigt das Benchmark-Resultat von 8,097 overall ssj_ops/watt für die PRIMERGY RX300 S8. Das ist der Quotient aus der Summe der Transaktionsdurchsätze der einzelnen Laststufen und der Summe der an diesen Stufen jeweils durchschnittlich aufgenommenen elektrischen Leistung. SPECpower_ssj2008: PRIMERGY RX300 S8 Performance to Power Ratio 0 2,500 5,000 7,500 10,000 Target Load 8,097 overall ssj_ops/watt 100% 9,479 90% 10,007 80% 10,088 70% 9,651 60% 9,077 50% 8,339 40% 7,394 30% 6,171 20% 4,671 10% 2,704 active idle 0 0 25 50 75 100 125 150 175 Average Active Power (W) Die folgende Tabelle zeigt die Benchmark-Ergebnisse bezüglich des Durchsatzes in ssj_ops, der elektrischen Leistungsaufnahme in Watt und des daraus resultierenden Energieeffizienz-Werts für jede einzelne Laststufe. Performance Power Energy Efficiency Target Load ssj_ops 100% 1,751,287 185 9,479 90% 1,576,257 158 10,007 80% 1,399,340 139 10,088 70% 1,231,438 128 9,651 60% 1,050,537 116 9,077 50% 875,717 105 8,339 40% 701,819 94.9 7,394 30% 526,932 85.4 6,171 20% 351,729 75.3 4,671 10% 175,376 64.9 2,704 0 40.8 0 Active Idle Average Power (W) ssj_ops/watt ∑ssj_ops / ∑power = 8,097 Mit diesem Ergebnis erzielte die PRIMERGY RX300 S8 einen neuen Weltrekord und übertraf damit das beste Konkurrenz-Ergebnis um 7.3% (Stand: 2. Oktober 2013). Damit beweist sich die PRIMERGY RX300 S8 als energieeffizientester Server weltweit. Die aktuellen SPECpower_ssj2008-Ergebnisse sind zu finden unter http://www.spec.org/power_ssj2008/results. Seite 16 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SPECpower_ssj2008: PRIMERGY RX300 S8 vs. Wettbewerb Der Vergleich zur Konkurrenz macht den Vorsprung der PRIMERGY RX300 S8 im Bereich Energieeffizienz deutlich. Mit 7.3% höherer Energieeffizienz gegenüber dem besten Konkurrenzergebnis, dem IBM iDataPlex dx360 M4 Server, setzt die PRIMERGY RX300 S8 neue Maßstäbe. Folgendes Diagramm zeigt für jede Laststufe den Stromverbrauch (auf der rechten Y-Achse) und den Durchsatz (auf der linken Y-Achse) der PRIMERGY RX300 S8 gegenüber dem Vorgängersystem PRIMERGY RX300 S7. SPECpower_ssj2008: PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 2,000,000 250 Throughput [ssj_ops] 1,800,000 225 1,600,000 1,400,000 175 1,200,000 150 1,000,000 125 800,000 100 600,000 400,000 75.0 200,000 50.0 0 Load Level 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% RX300 S8 ssj_ops 1,751,28 1,576,25 1,399,34 1,231,43 1,050,53 875,717 701,819 526,932 351,729 175,376 RX300 S7 ssj_ops 1,432,82 1,291,01 1,149,95 1,003,83 863,137 720,232 573,470 431,904 287,140 143,632 active idle 25.0 0 0 RX300 S8 watt 185 158 139 128 116 105 94.9 85.4 75.3 64.9 40.8 RX300 S7 watt 245.0 216.0 183.0 153.0 132.0 117.0 106.0 95.2 85.4 75.3 54.0 http://www.fujitsu.com/de/primergy Power Consumption [watt] 200 Seite 17 (56) White Paper Performance Report PRIMERGY RX300 S8 SPECpower_ssj2008 overall ssj_ops/watt: PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 1,700 8,000 8,097 7,000 1,300 6,000 1,100 5,000 5,406 900 4,000 700 3,000 500 RX300 S7 Seite 18 (56) 1,500 total power [watt] 9,000 overall ssj_ops/watt Durch die neue Ivy-Bridge Prozessorgeneration hat die PRIMERGY RX300 S8 im Vergleich zur PRIMERGY RX300 S7 einen deutlich höheren Durchsatz und eine deutlich niedrigere Leistungsaufnahme. Beides führt im Gesamtergebnis zu einer Steigerung der Energieeffizienz der PRIMERGY RX300 S8 um 50%. Version: 1.3 2015-03-06 RX300 S8 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Disk-I/O: Performance von Speichermedien Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. http://www.fujitsu.com/de/primergy Seite 19 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse gelten für die im Folgenden aufgelisteten Hardware- und Software-Komponenten: System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Controller SSD/HDD: 1 × RAID Ctrl SAS 6G 0/1 (D2607) PCIe-SSD: integriert DOM: onboard Speichermedien Für Modellvariante PY RX300S8 6x3.5: SSD, PCIe-SSD, DOM HDD Intel SSDSC2BA100G3C Intel SSDSC2BA200G3C Intel SSDSC2BA400G3C Intel SSDSC2BA800G3C HGST HUS156030VLS600 HGST HUS156045VLS600 HGST HUS156060VLS600 Seagate ST1000NM0011 Seagate ST1000NM0023 Seagate ST1000NM0033 Seagate ST2000NM0011 Seagate ST2000NM0023 Seagate ST2000NM0033 Seagate ST3000NM0023 Seagate ST3000NM0033 Seagate ST33000650NS Seagate ST3300657SS Seagate ST3450857SS Seagate ST3600057SS Seagate ST4000NM0023 Seagate ST500NM0011 Western Digital WD1001FYYG Western Digital WD1003FBYX Western Digital WD2000FYYZ Western Digital WD2001FYYG Western Digital WD3000FYYZ Western Digital WD3001FYYG Western Digital WD4001FYYG Western Digital WD5003ABYX Fusion-io F00-001-1T20-CS-0001 Fusion-io F00-001-785G-CS-0001 Fusion-io J00-001-365G-CS-0001 Innodisk DHSML-64GJ301C1QNF Seite 20 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Für die Modellvarianten PY RX300S8 2.5" expandable PY RX300S8 8x2.5 PY RX300S8 12x2.5: SSD, PCIe-SSD, DOM HDD Intel SSDSC2BA100G3C Intel SSDSC2BA200G3C Intel SSDSC2BA400G3C Intel SSDSC2BA800G3C Seagate ST100FM0012 Seagate ST200FM0002 Seagate ST200FM0012 Seagate ST400FM0012 Toshiba PX02SMB160 Toshiba PX02SMF020 Toshiba PX02SMF040 Toshiba PX02SMF080 HGST HUC101212CSS600 Seagate ST300MM0006 Seagate ST450MM0006 Seagate ST600MM0006 Seagate ST900MM0006 Seagate ST91000640NS Seagate ST91000640SS Seagate ST9146853SS Seagate ST9250610NS Seagate ST9300605SS Seagate ST9300653SS Seagate ST9450405SS Seagate ST9500620NS Seagate ST9500620SS Seagate ST9600205SS Seagate ST9900805SS Toshiba MK1401GRRB Toshiba MK3001GRRB Western Digital WD3001BKHG Western Digital WD4501BKHG Western Digital WD6001BKHG Western Digital WD9001BKHG Fusion-io F00-001-1T20-CS-0001 Fusion-io F00-001-785G-CS-0001 Fusion-io J00-001-365G-CS-0001 Innodisk DHSML-64GJ301C1QNF Software Betriebssystem F00-001-1T20-CS-0001 und F00-001-785G-CS-0001: Microsoft Windows Server 2008 R2 Enterprise HUS156030VLS600 und ST3300657SS: Microsoft Windows Server 2008 Enterprise x64 Edition SP1 Alle anderen: Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Verwaltungssoftware ServerView RAID Manager 5.7.2 Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten 32 GB Messdatei Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, für die Modellvarianten der PRIMERGY RX300 S8 passende Speichermedien unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Hierzu wurde in der im Unterkapitel Benchmark-Umgebung angegebenen Konfiguration jeweils ein einzelnes Speichmedium gemessen. Bei den Messungen wurden Controller verwendet, deren wichtigste Eigenschaften in der folgenden Tabelle zusammengefasst sind: Speichermedium Controller-Name Cache RAID Levels SATA 3G/6G SAS 3G/6G PCIe 2.0 x8 0, 1, 1E, 10 - - PCIe 2.0 x4 - - SATA 3G - - SSD/HDD RAID Ctrl SAS 6G 0/1 (D2607) - PCIe-SSD integriert DOM AHCI SATA on Intel C600 http://www.fujitsu.com/de/primergy Unterstützte Interfaces Seite 21 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Speichermedien Durch die Auswahl des Speichermedientyps und deren Anzahl lässt sich eine Gewichtung in Richtung Speicherkapazität, Performance, Sicherheit oder Preis vornehmen. In der PRIMERGY RX300 S8 können folgende Typen von Speichermedien verwendet werden: Speichermedientyp Schnittstelle Formfaktor HDD SATA 6G 2.5" HDD SATA 6G 3.5" HDD SAS 6G 2.5" HDD SAS 6G 3.5" SSD SATA 6G 2.5" * SSD SAS 6G 2.5" SSD SAS 12G 2.5" PCIe-SSD PCIe Gen2 x4 Low profile DOM SATA 3G ) Disk on module *) teilweise auch mit 3.5"-Rahmen erhältlich HDDs und konventionelle SSDs werden über Host-Bus-Adapter, meist RAID-Controller, mit SATA- oder SAS-Schnittstelle betrieben. Die Schnittstelle des RAID-Controllers zum Chipsatz des Systemboards ist typischerweise PCIe oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Systemboards. PCIe-SSDs hingegen werden direkt und ausschließlich über PCIe-Schnittstelle betrieben. DOM steht für „Disk on module“. Es handelt sich hierbei um extrem platz- und stromsparenden FlashSpeicher, der in Servern vor allem als Boot-Laufwerk Verwendung findet. Die Speicher-Technologie entspricht der von SSDs. Für eine Reihe von PRIMERGY Servern bietet Fujitsu ein DOM mit SATA 3G Schnittstelle an, das direkt auf einen SATA-Port des Systemboards gesteckt werden kann. Von allen Speichermedientypen bieten konventionelle SSDs und PCIe-SSDs die bei weitem die höchsten Transaktionsraten für wahlfreie Lastprofile wie auch die kürzesten Zugriffszeiten. Dafür ist allerdings der Preis pro Gigabyte Speicherkapazität erheblich höher. Cache-Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Performance-Werte Die Performance-Werte der PRIMERGY RX300 S8 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für ein einzelnes Speichermedium bei verschiedenen Zugriffsarten und Blockgrößen. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet: jeder Wert ist das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit Seite 22 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. SSDs, PCIe-SSDs und DOM im Vergleich zur leistungsstärksten HDD Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 Kapazität Speichermedium Schnittstelle [GB] 1200 Fusion-io F00-001-1T20-CS-0001 PCIe Gen2 x4 800 Intel SSDSC2BA800G3C 785 Fusion-io F00-001-785G-CS-0001 PCIe Gen2 x4 600 Seagate ST3600057SS (HDD) SAS 6G 400 Intel SSDSC2BA400G3C SATA 6G 365 Fusion-io J00-001-365G-CS-0001 PCIe Gen2 x4 200 Intel SSDSC2BA200G3C 100 Intel SSDSC2BA100G3C 64 SATA 6G Transaktionen [IO/s] Database Fileserver 50159 19178 Filecopy 18144 35120 5554 5313 48620 17964 17053 676 561 539 36667 5453 5338 n/a n/a n/a SATA 6G 35023 4903 4466 SATA 6G 28535 3371 3128 Innodisk DHSML-64GJ301C1QNF SATA 3G 22 17 13 PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable Modellvariante PY RX300S8 8x2.5 Modellvariante PY RX300S8 12x2.5 Kapazität Speichermedium [GB] 1600 Toshiba PX02SMB160 1200 Schnittstelle Transaktionen [IO/s] Fileserver Filecopy 44255 8121 7130 Fusion-io F00-001-1T20-CS-0001 PCIe Gen2 x4 50159 19178 18144 800 800 Toshiba PX02SMF080 Intel SSDSC2BA800G3C 38768 35120 7084 5554 6102 5313 785 Fusion-io F00-001-785G-CS-0001 PCIe Gen2 x4 48620 17964 17053 400 400 400 Toshiba PX02SMF040 Intel SSDSC2BA400G3C Seagate ST400FM0012 40808 36667 15879 7819 5453 3246 6400 5338 3409 365 Fusion-io J00-001-365G-CS-0001 PCIe Gen2 x4 n/a n/a n/a 300 Seagate ST9300653SS (HDD) SAS 6G 706 591 571 200 200 200 200 Toshiba PX02SMF020 Intel SSDSC2BA200G3C Seagate ST200FM0012 Seagate ST200FM0002 SAS 12G SATA 6G SATA 6G SAS 6G 40915 35023 14541 14184 7699 4903 3055 3006 6350 4466 2950 2985 100 100 Intel SSDSC2BA100G3C Seagate ST100FM0012 SATA 6G SATA 6G 28535 11971 3371 2142 3128 1967 Innodisk DHSML-64GJ301C1QNF SATA 3G 22 17 13 64 http://www.fujitsu.com/de/primergy SAS 12G Database SAS 12G SATA 6G SAS 12G SATA 6G SATA 6G Seite 23 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 Kapazität Speichermedium Schnittstelle [GB] 1200 Fusion-io F00-001-1T20-CS-0001 PCIe Gen2 x4 800 Intel SSDSC2BA800G3C 382 342 785 Fusion-io F00-001-785G-CS-0001 PCIe Gen2 x4 1331 945 600 Seagate ST3600057SS (HDD) 400 Intel SSDSC2BA400G3C SAS 6G 200 196 SATA 6G 434 341 365 Fusion-io J00-001-365G-CS-0001 PCIe Gen2 x4 n/a n/a 200 Intel SSDSC2BA200G3C SATA 6G 410 330 100 Intel SSDSC2BA100G3C SATA 6G 434 196 Innodisk DHSML-64GJ301C1QNF SATA 3G 122 113 64 SATA 6G Durchsatz [MB/s] Streaming Restore 1394 1037 PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable Modellvariante PY RX300S8 8x2.5 Modellvariante PY RX300S8 12x2.5 Kapazität Speichermedium [GB] Schnittstelle 1600 Toshiba PX02SMB160 SAS 12G 1200 Fusion-io F00-001-1T20-CS-0001 PCIe Gen2 x4 520 292 1394 1037 522 382 292 342 1331 945 526 434 336 293 341 218 800 800 Toshiba PX02SMF080 Intel SSDSC2BA800G3C 785 Fusion-io F00-001-785G-CS-0001 PCIe Gen2 x4 400 400 400 Toshiba PX02SMF040 Intel SSDSC2BA400G3C Seagate ST400FM0012 365 Fusion-io J00-001-365G-CS-0001 PCIe Gen2 x4 n/a n/a 300 Seagate ST9300653SS (HDD) SAS 6G 192 191 200 200 200 200 Toshiba PX02SMF020 Intel SSDSC2BA200G3C Seagate ST200FM0012 Seagate ST200FM0002 SAS 12G SATA 6G SATA 6G SAS 6G 528 410 341 377 294 330 194 196 100 100 Intel SSDSC2BA100G3C Seagate ST100FM0012 SATA 6G SATA 6G 434 360 196 133 Innodisk DHSML-64GJ301C1QNF SATA 3G 122 113 64 Seite 24 (56) SAS 12G SATA 6G Durchsatz [MB/s] Streaming Restore SAS 12G SATA 6G SATA 6G http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 HDDs Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0023 4000 Western Digital WD4001FYYG Schnittstelle SAS 6G SAS 6G Transaktionen [IO/s] Database Fileserver 410 354 331 294 Filecopy 353 310 3000 3000 3000 3000 3000 Seagate ST3000NM0033 Seagate ST33000650NS Seagate ST3000NM0023 Western Digital WD3001FYYG Western Digital WD3000FYYZ SATA 6G SATA 6G SAS 6G SAS 6G SATA 6G 391 379 370 343 254 345 334 321 305 234 341 333 323 316 230 2000 2000 2000 2000 2000 Seagate ST2000NM0033 Seagate ST2000NM0023 Western Digital WD2001FYYG Western Digital WD2000FYYZ Seagate ST2000NM0011 SATA 6G SAS 6G SAS 6G SATA 6G SATA 6G 358 357 328 301 250 321 313 290 271 225 317 315 303 278 209 1000 1000 1000 1000 1000 Seagate ST1000NM0033 Seagate ST1000NM0023 Western Digital WD1001FYYG Western Digital WD1003FBYX Seagate ST1000NM0011 SATA 6G SAS 6G SAS 6G SATA 6G SATA 6G 356 340 320 243 233 315 298 287 220 215 310 298 299 231 203 600 600 Seagate ST3600057SS HGST HUS156060VLS600 SAS 6G SAS 6G 676 673 561 550 539 545 500 500 Western Digital WD5003ABYX Seagate ST500NM0011 SATA 6G SATA 6G 242 217 219 198 228 189 450 450 HGST HUS156045VLS600 Seagate ST3450857SS SAS 6G SAS 6G 644 542 527 467 521 447 300 300 HGST HUS156030VLS600 Seagate ST3300657SS SAS 6G SAS 6G 600 590 496 500 504 480 http://www.fujitsu.com/de/primergy Seite 25 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable Modellvariante PY RX300S8 8x2.5 Modellvariante PY RX300S8 12x2.5 Kapazität Speichermedium [GB] Schnittstelle Database Transaktionen [IO/s] Fileserver Filecopy 1200 HGST HUC101212CSS600 SAS 6G 638 539 539 1000 1000 Seagate ST91000640NS Seagate ST91000640SS SATA 6G SAS 6G 372 363 317 298 314 289 900 900 900 Western Digital WD9001BKHG Seagate ST900MM0006 Seagate ST9900805SS SAS 6G SAS 6G SAS 6G 568 502 499 485 436 432 462 422 425 600 600 600 Western Digital WD6001BKHG Seagate ST600MM0006 Seagate ST9600205SS SAS 6G SAS 6G SAS 6G 572 551 536 484 471 458 460 456 449 500 500 Seagate ST9500620SS Seagate ST9500620NS SAS 6G SATA 6G 355 240 297 215 290 221 450 450 450 Seagate ST450MM0006 Seagate ST9450405SS Western Digital WD4501BKHG SAS 6G SAS 6G SAS 6G 533 530 515 453 444 462 437 424 450 300 300 300 300 300 Seagate ST9300653SS Toshiba MK3001GRRB Seagate ST300MM0006 Western Digital WD3001BKHG Seagate ST9300605SS SAS 6G SAS 6G SAS 6G SAS 6G SAS 6G 706 631 535 521 516 591 519 460 447 436 571 492 445 420 421 250 Seagate ST9250610NS SATA 6G 318 275 272 146 146 Seagate ST9146853SS Toshiba MK1401GRRB SAS 6G SAS 6G 632 594 531 506 505 492 Seite 26 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0023 4000 Western Digital WD4001FYYG Schnittstelle SAS 6G SAS 6G Durchsatz [MB/s] Streaming Restore 186 185 173 173 3000 3000 3000 3000 3000 Seagate ST3000NM0033 Seagate ST33000650NS Seagate ST3000NM0023 Western Digital WD3001FYYG Western Digital WD3000FYYZ SATA 6G SATA 6G SAS 6G SAS 6G SATA 6G 176 155 182 167 167 175 154 182 167 167 2000 2000 2000 2000 2000 Seagate ST2000NM0033 Seagate ST2000NM0023 Western Digital WD2001FYYG Western Digital WD2000FYYZ Seagate ST2000NM0011 SATA 6G SAS 6G SAS 6G SATA 6G SATA 6G 179 176 160 157 146 177 175 160 157 145 1000 1000 1000 1000 1000 Seagate ST1000NM0033 Seagate ST1000NM0023 Western Digital WD1001FYYG Western Digital WD1003FBYX Seagate ST1000NM0011 SATA 6G SAS 6G SAS 6G SATA 6G SATA 6G 162 167 159 130 146 162 166 159 129 146 600 600 Seagate ST3600057SS HGST HUS156060VLS600 SAS 6G SAS 6G 200 189 196 188 500 500 Western Digital WD5003ABYX Seagate ST500NM0011 SATA 6G SATA 6G 132 153 131 152 450 450 HGST HUS156045VLS600 Seagate ST3450857SS SAS 6G SAS 6G 190 202 188 199 300 300 HGST HUS156030VLS600 Seagate ST3300657SS SAS 6G SAS 6G 187 204 186 194 http://www.fujitsu.com/de/primergy Seite 27 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable Modellvariante PY RX300S8 8x2.5 Modellvariante PY RX300S8 12x2.5 Kapazität Speichermedium [GB] Schnittstelle Durchsatz [MB/s] Streaming Restore 1200 HGST HUC101212CSS600 SAS 6G 191 191 1000 1000 Seagate ST91000640NS Seagate ST91000640SS SATA 6G SAS 6G 108 111 107 111 900 900 900 Western Digital WD9001BKHG Seagate ST900MM0006 Seagate ST9900805SS SAS 6G SAS 6G SAS 6G 192 191 158 193 191 158 600 600 600 Western Digital WD6001BKHG Seagate ST600MM0006 Seagate ST9600205SS SAS 6G SAS 6G SAS 6G 193 194 161 193 193 163 500 500 Seagate ST9500620SS Seagate ST9500620NS SAS 6G SATA 6G 109 110 109 109 450 450 450 Seagate ST450MM0006 Seagate ST9450405SS Western Digital WD4501BKHG SAS 6G SAS 6G SAS 6G 188 155 192 188 158 192 300 300 300 300 300 Seagate ST9300653SS Toshiba MK3001GRRB Seagate ST300MM0006 Western Digital WD3001BKHG Seagate ST9300605SS SAS 6G SAS 6G SAS 6G SAS 6G SAS 6G 192 196 190 192 155 191 194 190 193 157 250 Seagate ST9250610NS SATA 6G 114 113 146 146 Seagate ST9146853SS Toshiba MK1401GRRB SAS 6G SAS 6G 190 207 190 204 Seite 28 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Disk-I/O: Performance von RAID-Controllern Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. http://www.fujitsu.com/de/primergy Seite 29 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardwareund Software-Komponenten ermittelt: System Under Test (SUT) Hardware Controller 1 × „LSI SW RAID on Intel C600 (Onboard SATA)“ 1 × „LSI SW RAID on Intel C600 (Onboard SAS)“ 1 × „RAID Ctrl SAS 6G 0/1 (D2607)“ 1 × „RAID Ctrl SAS 5/6 512MB (D2616)“ 1 × „RAID Ctrl SAS 6G 1GB (D3116C)“ 1 × „PRAID EP400i“ 1 × „PRAID EP420i“ Festplatte 6 × 3.5" SAS HDD Hitachi HUS156030VLS600 16 × 2.5" SAS SSD Seagate ST200FM002 4 × 2.5" SATA SSD Seagate ST200FM012 8 × 2.5" SAS SSD Toshiba PX02SMF040 4 × 2.5" SATA HDD Seagate ST91000640NS 16 × 2.5" SAS HDD Toshiba MK1401GRRB Software BIOS-Einstellungen Intel Virtualization Technology = Disabled VT-d = Disabled Energy Performance = Performance Utilization Profile = Unbalanced Package C State limit = C0 Betriebssystem Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Microsoft Windows Server 2012 Standard BetriebssystemEinstellungen Choose or customize a power plan: High performance Für die Disk-I/O-erzeugenden Prozesse: Setzen der AFFINITY auf den CPU-Node, an den der PCIe-Slot des RAID-Controllers angeschlossen ist Verwaltungssoftware ServerView RAID Manager 5.7.2 Initialisierung von RAID-Verbänden RAID-Verbände werden vor der Messung mit einer elementaren Blockgröße von 64 kB („Stripe Size“) initialisiert Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten Messdateien von 32 GB bei 1 – 8 Festplatten; 64 GB bei 9 – 16 Festplatten; 128 GB bei 17 oder mehr Festplatten Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 30 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, aus den verschiedenen Konfigurationsmöglichkeiten der PRIMERGY RX300 S8 die passende Lösung unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Im Folgenden sollen verschiedene Kombinationen von RAID-Controllern und Datenträgern untersucht werden. Informationen zur Auswahl der Datenträger selbst finden sich im Kapitel „Disk-I/O: Performance von Speichermedien“. Festplatten Die erste wesentliche Komponente sind die Festplatten. Wenn im Folgenden von „Festplatten“ die Rede ist, so ist dies als Oberbegriff gemeint für HDDs („hard disk drives“, also konventionelle Festplatten) und SSDs („solid state drives“, also nichtflüchtige elektronische Speichermedien). Mischkonfigurationen von SAS- und SATA-Festplatten in einem System sind zulässig, sofern sie nicht für spezielle Festplattentypen im Konfigurator ausgeschlossen sind. Durch die Verwendung von 2.5"-Festplatten anstelle von 3.5"-Festplatten sind mehr Festplatten pro System möglich. Dadurch sinkt die Belastung, die jede einzelne Festplatte zu bewältigen hat, und die maximale Gesamt-Performance des Systems steigt. Detailliertere Performance-Aussagen zu den Festplattentypen sind im Kapitel „Disk-I/O: Performance von Speichermedien“ im vorliegenden Performance Report zu finden. Modellvarianten Die maximale Anzahl von Festplatten im System hängt von der Systemkonfiguration ab. Die folgende Tabelle stellt die wesentlichen Fälle zusammen. Formfaktor Schnittstelle Anschlusstyp Anzahl PCIeController Maximalzahl Festplatten 2.5" SATA 3G, SAS 3G direkt 0 4 3.5" SATA 6G, SAS 6G direkt 1 6 2.5" SATA 6G, SAS 6G Expander 1 16 2.5" SATA 6G, SAS 12G direkt 1 8 http://www.fujitsu.com/de/primergy Seite 31 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 RAID-Controller Neben den Festplatten ist der RAID-Controller die zweite Performance-bestimmende Schlüsselkomponente. Bei diesen Controllern bietet das „Modular RAID“ Konzept der PRIMERGY Server eine Fülle von Möglichkeiten, um den verschiedenen Anforderungen unterschiedlichster Anwendungsszenarien gerecht zu werden. Die folgende Tabelle fasst die wichtigsten Eigenschaften der verfügbaren RAID-Controller der PRIMERGY RX300 S8 zusammen. Pro Controller ist hierin ein kurzer Alias angegeben, der bei der anschließenden Zusammenstellung der Performance-Werte verwendet wird. Controller-Name Alias Cache Unterstützte Interfaces Im System Max. # Disks pro Controller BBU/ FBU RAID Levels LSI SW RAID on Intel C600 (Onboard SATA) Patsburg A - SATA 3G - 4 × 2.5" 0, 1, 10 -/- LSI SW RAID on Intel C600 (Onboard SAS) Patsburg B - SATA 3G SAS 3G - 4 × 2.5" 0, 1, 10 -/- RAID Ctrl SAS 6G 0/1 (D2607) LSI2008 - SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 8 × 2.5" 6 × 3.5" 0, 1, 1E, 10 -/- RAID Ctrl SAS 6G 5/6 512MB (D2616) LSI2108 512 MB SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 16 × 2.5" 6 × 3.5" 0, 1, 5, 6, 10, 50, 60 /- RAID Ctrl SAS 6G 1GB (D3116C) LSI2208-1G 1 GB 16 × 2.5" 6 × 3.5" 0, 1, 1E, 5, 6, 10, 50, 60 -/ PRAID EP400i PRAID EP400i 1 GB SATA 6G SAS 12G PCIe 3.0 x8 8 × 2.5" 0, 1, 1E, 5, 6, 10, 50, 60 -/ PRAID EP420i PRAID EP420i 2 GB SATA 6G SAS 12G PCIe 3.0 x8 8 × 2.5" 0, 1, 1E, 5, 6, 10, 50, 60 -/ SATA 3G/6G PCIe 3.0 SAS 3G/6G x8 Der Onboard RAID Controller ist im Chip-Set Intel C600 auf dem Systemboard des Servers realisiert und benutzt die CPU des Servers für die RAID-Funktionalität. Dieser Controller ist eine einfache Lösung, die keinen PCIe-Steckplatz benötigt. Neben der immer vorhandenen Anschlussmöglichkeit von SATAFestplatten kann die optionale SAS-Funktionalität über einen „SAS enabling key“ freigeschaltet werden. Systemspezifische Schnittstellen Die Schnittstellen eines Controllers zum Systemboard und zu den Festplatten haben jeweils spezifische Grenzen für den Datendurchsatz. Diese Grenzen sind in der folgenden Tabelle zusammengestellt. Das Minimum dieser beiden Werte ist eine prinzipielle Grenze, die nicht überschritten werden kann. Dieser W ert ist in der folgenden Tabelle mit Fettdruck hervorgehoben. ControllerAlias Effektiv in der Konfiguration Patsburg A 4 × SATA 3G Patsburg B 4 × SAS 3G LSI2008 # Disk-Kanäle Grenze für Durchsatz Disk-Interface Anschluss über Expander PCIeVersion PCIeBreite Grenze für Durchsatz PCIe-Interface 1030 MB/s - - - - 1030 MB/s - - - - 8 × SAS 6G 4120 MB/s 2.0 x8 3433 MB/s - LSI2108 8 × SAS 6G 4120 MB/s 2.0 x8 3433 MB/s LSI2208-1G 8 × SAS 6G 4120 MB/s 3.0 x8 6761 MB/s PRAID EP 400i 8 × SAS 12G 8240 MB/s 3.0 x8 6761 MB/s - PRAID EP 420i 8 × SAS 12G 8240 MB/s 3.0 x8 6761 MB/s - Ein Expander ermöglicht es, in einem System mehr Festplatten anzuschließen als der Controller SASKanäle hat. Ein Expander kann den möglichen Maximaldurchsatz eines Controllers nicht steigern, stellt ihn aber in Summe allen angeschlossenen Festplatten zur Verfügung. Weitere Details zu den RAID-Controllern der PRIMERGY Systeme finden sich im White Paper „RAID-Controller-Performance“. Seite 32 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Bei Controllern mit Cache gibt es mehrere einstellbare Parameter. Die jeweils optimalen Einstellungen können vom RAID-Level, vom Anwendungsszenario und vom Datenträgertyp abhängen. Besonders bei den RAID-Levels 5 und 6 (und den davon abgeleiteten komplexeren RAID-Levels 50 und 60) ist bei Anwendungsszenarien mit Schreibanteil das Einschalten des Controller-Caches Pflicht. Bei aktiviertem Controller-Cache sollten die darin temporär gespeicherten Daten gegen Verlust bei Stromausfall gesichert werden. Hierfür ist geeignetes Zubehör verfügbar (beispielsweise eine BBU bzw. FBU). Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Nähere Informationen zu den Einstellungsmöglichkeiten beim Controller-Cache sind im White Paper „RAIDController-Performance“ zu finden. Performance-Werte Generell hängt die Disk-I/O-Performance eines RAID-Verbandes von Festplattentyp und –anzahl, vom RAID-Level und vom RAID-Controller ab. Sofern die Limitierungen der systemspezifischen Schnittstellen nicht überschritten werden, gelten also Aussagen zur Disk-I/O-Performance für alle PRIMERGY Systeme. Daher gelten auch alle Performance-Aussagen des Dokumentes „RAID-Controller-Performance“ für die PRIMERGY RX300 S8, soweit die dort vermessenen Konfigurationen auch von diesem System unterstützt werden. Die Performance-Werte der PRIMERGY RX300 S8 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für verschiedene RAID-Level, Zugriffsarten und Blockgrößen. Wesentlich verschiedene Konfigurationsvarianten werden getrennt behandelt. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet dreierlei: Zum einen wurden Festplatten mit optimaler Performance verwendet (die Komponenten sind im Unterkapitel Benchmark-Umgebung näher beschrieben). Des Weiteren sind Cache-Einstellungen von Controllern und Festplatten zugrunde gelegt, die für das jeweilige Zugriffsszenario und den RAID-Level optimal sind. Und schließlich ist jeder Wert das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. http://www.fujitsu.com/de/primergy Seite 33 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 2.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): Patsburg A ST91000640NS SATA HDD ST200FM0012 SATA SSD SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable 2 4 4 1 0 10 550 1073 828 447 583 446 17760 36497 28683 3951 8249 6665 Patsburg B MK1401GRRB SAS HDD ST200FM0002 SAS SSD 2 4 4 1 0 10 804 1830 1347 694 1015 744 17736 37028 29082 3916 8333 6779 LSI2008 MK1401GRRB SAS HDD ST200FM002 SAS SSD 2 8 8 1 0 10 820 3491 2716 702 1980 1516 17649 40766 28692 4117 12706 10539 LSI2108 MK1401GRRB SAS HDD ST200FM002 SAS SSD 2 16 16 16 1 10 0 5 859 7944 10460 6324 679 4124 5606 3555 19002 25172 77421 19675 4400 15894 25486 12245 LSI2208-1G MK1401GRRB SAS HDD ST200FM002 SAS SSD 2 16 16 16 1 10 0 5 1109 8135 10460 5835 863 4232 5606 3257 20201 50643 151967 35989 4362 27923 42734 19737 PRAID EP400i MK1401GRRB SAS HDD PX02SMF040 SAS SSD 2 8 8 8 1 10 0 5 1222 4898 6103 3885 867 2379 3015 1929 78733 113462 132049 54614 12318 58778 81445 23046 2 1 1413 915 80178 12460 PRAID EP420i MK1401GRRB SAS HDD PX02SMF040 SAS SSD 8 8 8 10 0 5 5097 6090 4163 2477 3045 1990 105915 123219 54214 58569 79893 22894 Seite 34 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 2.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): Patsburg A ST91000640NS SATA HDD ST200FM0012 SATA SSD SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] HDDs sequentiell 64 kB Blöcke 100% read [MB/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX300 S8 Modellvariante PY RX300S8 2.5" expandable 2 4 4 1 0 10 112 422 226 108 419 213 506 946 662 175 718 338 Patsburg B MK1401GRRB SAS HDD ST200FM0002 SAS SSD 2 4 4 1 0 10 199 780 399 192 770 384 504 953 662 180 642 337 LSI2008 MK1401GRRB SAS HDD ST200FM0002 SAS SSD 2 8 8 1 0 10 287 1492 745 190 1264 728 338 2470 1286 199 1322 634 LSI2108 MK1401GRRB SAS HDD ST200FM0002 SAS SSD 2 16 16 16 1 10 0 5 371 1886 2750 1808 192 864 2483 1203 679 1953 2327 1870 176 843 2177 1225 LSI2208-1G MK1401GRRB SAS HDD ST200FM0002 SAS SSD 2 16 16 16 1 10 0 5 355 1678 3040 2850 194 1549 3040 2200 680 2967 3999 4043 169 1603 2981 2151 PRAID EP400i MK1401GRRB SAS HDD PX02SMF040 SAS SSD 2 8 8 8 1 10 0 5 325 860 1520 1352 193 778 1500 1343 1596 5873 5818 5790 420 1653 3295 2651 2 1 370 193 1595 421 PRAID EP420i MK1401GRRB SAS HDD PX02SMF040 SAS SSD 8 8 8 10 0 5 862 1514 1368 778 1434 1343 5888 5848 5847 1650 3281 2611 (kursiv: berechnet) http://www.fujitsu.com/de/primergy Seite 35 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 3.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): LSI2008 LSI2108 LSI2208-1G Seite 36 (56) SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 HUS156030VLS600 SAS HDD 2 6 6 1 0 10 868 2708 2090 729 N/A 1548 N/A 1160 N/A N/A N/A N/A HUS156030VLS600 SAS HDD 2 6 6 6 1 10 0 5 1042 3110 4216 2241 730 1600 2149 1138 N/A N/A N/A N/A N/A N/A N/A N/A 2 1 1105 746 N/A N/A 6 6 6 10 0 5 3162 4384 2316 1632 N/A 2246 N/A 1259 N/A N/A N/A N/A HUS156030VLS600 SAS HDD http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 3.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): LSI2008 LSI2108 LSI2208-1G HUS156030VLS600 SAS HDD 2 6 6 1 0 10 283 964 528 HUS156030VLS600 SAS HDD 2 6 6 6 1 10 0 5 342 881 1068 903 2 1 6 6 6 10 0 5 HUS156030VLS600 SAS HDD 184 N/A 986 N/A 517 N/A 183 540 1077 898 SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] HDDs sequentiell 64 kB Blöcke 100% read [MB/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX300 S8 Modellvariante PY RX300S8 6x3.5 N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A 357 183 N/A N/A 648 1080 901 548 N/A 1077 N/A 897 N/A N/A N/A N/A Fazit Die PRIMERGY RX300 S8 erreicht im Vollausbau mit leistungsfähigen Festplatten einen Durchsatz von bis zu 5888 MB/s bei sequentiellen Lastprofilen und eine Transaktionsrate von bis zu 151967 IO/s bei typischen wahlfreien Anwendungsszenarien. http://www.fujitsu.com/de/primergy Seite 37 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SAP SD Benchmark-Beschreibung Die SAP Anwendungssoftware besteht aus Modulen zum Management aller Standard-Geschäftsprozesse. Es gibt u.a. Module für ERP (Enterprise Resource Planning) wie Assemble-to-Order (ATO), Financial Accounting (FI), Human Resources (HR), Materials Management (MM), Production Planning (PP) und Sales and Distribution (SD), aber auch für SCM (Supply Chain Management), Retail, Banking, Utilities, BI (Business Intelligence), CRM (Customer Relation Management) oder PLM (Product Lifecycle Management). Die Applikationssoftware setzt immer auf einer Datenbank auf, so dass eine SAP-Konfiguration neben der Hardware aus den Software-Komponenten Betriebssystem, Datenbank und letztendlich der SAP-Software selbst besteht. Zur Verifikation der Performance, Stabilität und Skalierbarkeit eines SAP-Applikationssystems hat die SAP AG die SAP Standard Application Benchmarks entwickelt. Die Benchmarks (der wichtigste und am meisten verbreitete ist der SD Benchmark) analysieren die Performance des Gesamtsystems und liefern somit ein Maß für die Qualität der Integration der Einzelkomponenten. Bei dem Benchmark wird zwischen einer Two-Tier- und einer Three-Tier-Konfiguration unterschieden. Bei der Two-Tier-Konfiguration sind die SAP-Applikation und die Datenbank auf einem Server installiert. Bei einer Three-Tier-Konfiguration können die einzelnen Komponenten der SAP-Applikation über mehrere Server verteilt sein und ein weiterer Server übernimmt die Datenbank. Eine komplette Spezifikation des von der SAP AG, Walldorf – Deutschland entwickelten Benchmarks ist unter http://www.sap.com/benchmark zu finden. Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: 2-Tier-Umgebung Server Disk-Subsystem Netzwerk BenchmarkTreiber Seite 38 (56) System Under Test (SUT) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Prozessor 2 × Xeon E5-2697 v2 Speicher 16 × 16GB (1x16GB) 2Rx4 DDR3-1866 R ECC Netzwerkinterface 1Gbit/s LAN Disk-Subsystem PRIMERGY RX300 S8: 1 × HD SATA 6G 250GB 7.2K HOT PLUG 2.5" BC 1 × FC Ctrl 8Gb/s 2 Chan LPe12002 1 × FibreCAT CX4-480 Storage Unit Netzteil 1 × Power supply 800W Software BIOS-Einstellungen DDR Performance = Performance Optimized Betriebssystem Microsoft Windows Server 2012 Standard Edition Datenbank Microsoft SQL Server 2012 Enterprise x64 Edition SAP Business Suite Software SAP enhancement package 5 for SAP ERP 6.0 Benchmark-Treiber Hardware Modell PRIMERGY RX300 S4 Prozessor 2 × Xeon X5460 Speicher 32 GB Netzwerkinterface 1Gbit/s LAN Software Betriebssystem SUSE Linux Enterprise Server 11 SP1 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Zertifikationsnummer 2013024 Number of SAP SD benchmark users 10240 Average dialog response time 0.96 seconds Throughput Fully processed order line items/hour Dialog steps/hour SAPS 1,120,670 3,362,000 56,030 Average database request time (dialog/update) 0.017 sec / 0.035 sec CPU utilization of central server 99% Operating system, central server Windows Server 2012 Standard Edition RDBMS SQL Server 2012 SAP Business Suite software SAP enhancement package 5 for SAP ERP 6.0 Configuration Central Server Fujitsu PRIMERGY RX300 S8 2 processors / 24 cores / 48 threads Intel Xeon E5-2697 v2, 2.7GHz, 64KB L1 cache and 256KB L2 cache per core, 30 MB L3 cache per processor 256 GB main memory http://www.fujitsu.com/de/primergy Seite 39 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Die PRIMERGY RX300 S8 erzielte das beste 2 Processor, Two-Tier SAP SD Standard Application Benchmark Ergebnis mit SAP enhancement package 5 for SAP ERP 6.0 (Stand: 10. September 2013). Die aktuellen SAP SD Ergebnisse sind zu finden unter http://www.sap.com/solutions/benchmark/sd2tier.epx. Two-Tier SAP SD results on SAP enhancement package 5 for SAP ERP 6.0 for 2 processor servers: PRIMERGY RX300 S8 vs. next best 2-socket server Fujitsu PRIMERGY RX300 S8 2 x Xeon E5-2697 v2 2 processors/24 cores/48 threads 256 GB main memory Windows Server 2012 Standard Edition SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2013024 10240 HP ProLiant BL460c Gen8 2 x Xeon E5-2697 v2 2 processors/24 cores/48 threads 256 GB main memory Windows Server 2012 Datacenter Edition SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2013025 10025 0 2000 4000 6000 8000 10000 Number of Benchmark Users Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY RX300 S8 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S7, in jeweils performantester Ausstattung. Two-Tier SAP SD results: PRIMERGY RX300 S8 vs. predecessor Fujitsu PRIMERGY RX300 S8 2 x Xeon E5-2697 v2 2 processors/24 cores/48 threads 256 GB main memory Windows Server 2012 Standard Edition SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2013024 10240 Fujitsu PRIMERGY RX300 S7 2 x Xeon E5-2690 2 processors/16 cores/32 threads 128 GB main memory Windows Server 2008 R2 Enterprise Edition SQL Server 2008 SAP enhancement package 4 for SAP ERP 6.0 Certification number: 2012008 7520 0 2000 4000 6000 8000 10000 Number of Benchmark Users Seite 40 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 OLTP-2 Benchmark-Beschreibung OLTP steht für Online Transaction Processing. Dem OLTP-2-Benchmark liegt das typische Anwendungsszenario einer Datenbanklösung zugrunde. Es werden bei OLTP-2 Zugriffe auf eine Datenbank simuliert und die Anzahl erreichter Transaktionen pro Sekunde (tps) als Maß für die Leistungsfähigkeit des vermessenen Systems ermittelt. Im Gegensatz zu Benchmarks, wie beispielsweise SPECint und TPC-E, die von unabhängigen Gremien standardisiert wurden und bei denen die Einhaltung des jeweiligen Reglements überwacht wird, ist OLTP-2 ein interner Benchmark von Fujitsu. OLTP-2 basiert auf dem bekannten Datenbank-Benchmark TPC-E. OLTP-2 wurde so gestaltet, dass eine Vielzahl von Konfigurationen messbar sind, um die Skalierung eines Systems hinsichtlich CPU- und Speicherausbau darstellen zu können. Auch wenn die beiden Benchmarks OLTP-2 und TPC-E ähnliche Anwendungsszenarien simulieren und die gleichen Lastprofile verwenden, so sind die Ergebnisse nicht vergleichbar oder gar gleichzusetzen, da die beiden Benchmarks unterschiedliche Methoden zur Simulation der Benutzerlast verwenden. Typischerweise sind OLTP-2-Werte TPC-E-Werten ähnlich. Ein direkter Vergleich oder gar die Bezeichnung des OLTP-2Ergebnisses als TPC-E-Ergebnis ist nicht zulässig, da insbesondere kein Preis-Leistungswert ermittelt wird. Weitere Informationen können dem Dokument Benchmark-Überblick OLTP-2 entnommen werden. Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: Driver Tier A Tier B Netzwerk Netzwerk Applikations-Server Clients Datenbank-Server DiskSubsystem System Under Test (SUT) Alle Ergebnisse wurden exemplarisch auf einer PRIMERGY RX300 S8 ermittelt. http://www.fujitsu.com/de/primergy Seite 41 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Datenbank-Server (Tier B) Hardware Modell PRIMERGY RX300 S8 Prozessor Intel Xeon Processor E5-2600 v2 Product Family Speicher 1 Prozessor: 8 × 32GB (1x32GB) 4Rx4 L DDR3-1600 LR ECC 2 Prozessoren: 16 × 32GB (1x32GB) 4Rx4 L DDR3-1600 LR ECC Netzwerk-Interface 2 × onboard LAN 1 Gb/s Disk-Subsystem RX300 S8: Onboard RAID Ctrl SAS 6G 5/6 1024MB (D3116C) 2 × 146 GB 15k rpm SAS Drive, RAID1 (OS), 6 × 300 GB 15k rpm SAS Drive, RAID10 (LOG) 5 × LSI MegaRAID SAS 9286CV-8e 5 × JX40: Je 16 × 200 GB SSD Drive, RAID5 (Daten) ® ® Software BIOS Version R0.91.0 Betriebssystem Microsoft Windows Server 2012 Standard Datenbank Microsoft SQL Server 2012 Enterprise SP1 Applikations-Server (Tier A) Hardware Modell 1 × PRIMERGY RX200 S8 Prozessor 2 × Xeon E5-2640 v2 Speicher 32 GB, 1600 MHz registered ECC DDR3 Netzwerk-Interface 2 × onboard LAN 1 Gb/s 1 × Dual Port LAN 1Gb/s Disk-Subsystem 1 × 250 GB 7.2k rpm SATA Drive Software Betriebssystem Microsoft Windows Server 2012 Standard Client (Lastgenerator) Hardware Modell 1 × PRIMERGY RX200 S5 Prozessor 2 × Xeon X5570 Speicher 24 GB, 1333 MHz registered ECC DDR3 Netzwerk-Interface 2 × onboard LAN 1 Gb/s Disk-Subsystem 1 × 73 GB 15k rpm SAS Drive Software Betriebssystem Microsoft Windows Server 2008 R2 Standard Benchmark OLTP-2 Software EGen version 1.12.0 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 42 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Ergebnisse Die Datenbank-Performance ist in hohem Maße abhängig von den Ausbaumöglichkeiten mit CPU, Speicher und den Anschlussmöglichkeiten eines für die Datenbank angemessenen Disk-Subsystems. Bei den folgenden Skalierungsbetrachtungen der Prozessoren gehen wir davon aus, dass sowohl der Speicher als auch das Disk-Subsystem adäquat gewählt ist und keinen Engpass darstellt. Als Richtlinie für die Auswahl von Arbeitsspeicher gilt im Datenbankumfeld, dass eine ausreichende Menge wichtiger ist als die Geschwindigkeit der Speicherzugriffe. Daher wurde bei den Messungen mit zwei Prozessoren eine Bestückung mit insgesamt 512 GB Speicher und bei den Messungen mit einem Prozessor eine Bestückung mit insgesamt 256 GB Speicher betrachtet. Beide Speicherbestückungen haben einen Memory-Zugriff von 1600 MHz. Weitere Informationen über Speicherperformance sind in dem White Paper Speicher-Performance Xeon E5-2600 v2 (Ivy Bridge-EP) basierter Systeme zu finden. ® Die nachfolgende Grafik zeigt die OLTP-2 Transaktionsraten, die mit einem und zwei Prozessoren der Intel ® Xeon Processor E5-2600 v2 Product Family erreicht werden können. OLTP-2 tps E5-2697 v2 - 12C, HT 2479.88 1442.64 E5-2695 v2 - 12C, HT 2367.02 1376.33 E5-2690 v2 - 10C, HT 2366.91 1376.26 E5-2680 v2 - 10C, HT 2252.25 1309.59 E5-2670 v2 - 10C, HT 2133.38 1240.47 E5-2660 v2 - 10C, HT 1955.07 1136.79 E5-2650Lv2 - 10C, HT 1539.01 894.87 E5-2667 v2 - 8C, HT 2093.08 1217.04 E5-2650 v2 - 8C, HT 1809.11 1051.93 E5-2640 v2 - 8C, HT 1462.76 850.54 E5-2643 v2 - 6C, HT 1681.30 977.61 E5-2630 v2 - 6C, HT 1371.18 758.76 E5-2630Lv2 - 6C, HT 696.33 E5-2620 v2 - 6C, HT 655.53 E5-2637 v2 - 4C, HT 634.96 619.01 E5-2609 v2 - 4C 1258.36 1184.63 1147.46 2CPUs 512GB RAM 342.54 482.41 266.95 E5-2603 v2 - 4C 0 1CPU 256GB RAM 500 1000 1500 2000 2500 tps HT: Hyper-Threading http://www.fujitsu.com/de/primergy Fett: Kursiv: gemessen berechnet Seite 43 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Es wird deutlich, dass durch die Vielzahl an freigegebenen Prozessoren eine große Leistungsbandbreite abgedeckt wird. Vergleicht man den OLTP-2-Wert des leistungsschwächsten Prozessors Xeon E5-2603 v2 mit dem des leistungsstärksten Prozessors Xeon E5-2690 v2, so ergibt sich eine Leistungssteigerung um den Faktor 5.1. Anhand der erzielten Resultate lassen sich die Prozessoren in verschiedene Leistungsgruppen unterteilen: Den Einstieg stellen Xeon E5-2603 v2 und E5-2609 v2 als Prozessoren mit vier Kernen aber ohne HyperThreading und ohne Turbo-Modus dar. Mit dem Performance-optimierten 4-Core-Prozessor Xeon E5-2637 v2 werden aufgrund seiner hohen Taktfrequenz und der hohen QPI-Geschwindigkeit von 8.00 GT/s fast schon die Durchsatzraten der 6-Core-Prozessoren mit den niedrigsten Frequenzen (Xeon E5-2620 v2 und E5-2630Lv2) erreicht, die mit 80 Watt bzw. 60 Watt aber auch eine deutlich geringere Leistungsaufnahme haben als der Xeon E5-2637 v2 mit 130 Watt. Alle Prozessoren mit sechs, acht, zehn und zwölf Cores sind Hyper-Threading-fähig und haben mit 7.20 GT/s bzw. 8.00 GT/s eine hohe QPI-Geschwindigkeit. Die Leistung innerhalb einer Prozessorgruppe skaliert über die CPU-Taktfrequenzen; Leistungssprünge bei einigen Prozessortypen ergeben sich durch eine höhere QPI-Geschwindigkeit oder einen größeren L3-Cache pro Prozessorkern. Am oberen Leistungsende der 6-Core-Prozessoren und auch der 8-Core-Prozessoren liegen die besonders hoch getakteten Prozessoren Xeon E5-2643 v2 und E5-2667 v2, die jeweils eine OLTP-Leistung oberhalb des leistungsschwächsten Prozessors in der vorherigen Gruppe erreichen. Am oberen Ende der Leistungsskala findet man die Gruppen der Prozessoren mit zehn bzw. zwölf Kernen und einer QPI-Geschwindigkeit von 8.00 GT/s (bis auf die 10-Core Low-Voltage CPU E5-2650Lv2). Durch die gestaffelten CPU-Taktfrequenzen wird innerhalb der Gruppe der 10-Core-Prozessoren eine OLTPLeistung von 1539.01 tps (2 × Xeon E5-2650Lv2) bis 2366.91 tps (2 × Xeon E5-2690 v2) erreicht, während die 12-Core-Prozessoren mit bis zu 2479.88 tps (2 × Xeon E5-2697 v2) die beste Performance liefern. Vergleicht man die maximal erreichbaren OLTP-2 Werte der aktuellen Systemgeneration mit den Werten, die auf den Vorgängersystemen erreicht wurden, so ergibt sich eine Steigerung von ca. 33%. Maximum OLTP-2 tps Vergleich der Systemgenerationen tps + ~33% 2500 2000 1500 1000 2 × E5-2690 512 GB 2 × E5-2697 v2 512 GB SQL 2012 SQL 2012 500 0 Vorgängersystem Aktuelles System Aktuelles System TX300 S8 RX200 S8 RX300 S8 RX350 S8 BX924 S4 Vorgängersystem TX300 S7 RX200 S7 RX300 S7 RX350 S7 BX924 S3 Seite 44 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 TPC-E Benchmark-Beschreibung Der TPC-E-Benchmark misst die Performance online transaktionsverarbeitender Systeme (Online Transaction Processing oder kurz OLTP genannt). Er basiert auf einer komplexen Datenbank und einer Reihe unterschiedlicher Transaktionstypen, die auf ihr ausgeführt werden. TPC-E ist ein sowohl Hardwareals auch Software-unabhängiger Benchmark und kann damit auf jeder Testplattform – sei es eine proprietäre oder offene – implementiert werden. Neben den Messergebnissen müssen auch sämtliche Details der vermessenen Systeme und des Messvorgangs in einem Messreport (Full Disclosure Report oder kurz FDR) erläutert werden. Dadurch wird überprüfbar, ob eine Messung allen Benchmark-Anforderungen entspricht und nachvollziehbar ist. Durch TPC-E wird nicht ein einzelner Server, sondern eine recht umfangreiche Systemkonfiguration vermessen. Performance-bestimmend ist hierbei die Systemleistung des Datenbankservers mit Disk-I/O und Netzwerk-Kommunikation. Die Performance-Metrik ist tpsE. tps steht dabei für transactions per second. tpsE ist die mittlere Anzahl an Trade-Result-Transaktionen, die innerhalb einer Sekunde ausgeführt wurden. Gemäß dem TPC-E-Standard besteht eine korrekte Angabe aus der tpsE-Rate, dem zugehörigen Preis/Leistungs-Wert und dem Weitere Informationen über TPC-E können dem Übersichtsdokument Benchmark Overview TPC-E entnommen werden. Benchmark-Ergebnisse Im September 2013 veröffentlichte Fujitsu ein TPC-E Benchmark-Ergebnis für PRIMERGY RX300 S8 mit dem 12-Core Prozessor Intel Xeon E5-2697 v2 und 512 GB Speicher. Die Resultate zeigen eine enorme Leistungssteigerung gegenüber der PRIMERGY RX300 S7 bei gleichzeitiger Reduzierung der Kosten. http://www.fujitsu.com/de/primergy Seite 45 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 TPC-E 1.12.0 TPC Pricing 1.7.0 PRIMERGY RX300 S8 Report Date September 10, 2013 TPC-E Throughput 2,472.58 tpsE Price/Performance $ 135.14 USD per tpsE Availability Date September 10, 2013 Total System Cost $ 334,140 USD Database Server Configuration Operating System Microsoft Windows Server 2012 Standard Edition Database Manager Microsoft SQL Server 2012 Enterprise Edition SP1 SUT Processors/Cores/Threads 2/24/48 Memory 512 GB Tier A PRIMERGY RX200 S8 2x Intel Xeon E5-2640 v2 2.00 GHz 32 GB Memory 1x 250 GB 7.2k rpm SATA Drive 2x onboard LAN 1 Gb/s 1x Dual Port LAN 1 Gb/s Tier B PRIMERGY RX300 S8 2x Intel Xeon E5-2697 v2 2.70 GHz 512 GB Memory 2x 146 GB 15k rpm SAS Drives 6x 300 GB 15k rpm SAS Drives 2x onboard LAN 1 Gb/s 6x SAS RAID Controller Storage 1x PRIMECENTER Rack 5x ETERNUS JX40 80x 200 GB SSD Drives Initial Database Size 10,246 GB Redundancy Level 1 RAID-5 data and RAID-10 log Storage 80 x 200 GB SSD 6 x 300 GB 15k rpm HDD Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Weitere Informationen zu diesem TPC-E Ergebnis, speziell auch den Full Disclosure Report, findet man auf der TPC-Webseite http://www.tpc.org/tpce/results/tpce_result_detail.asp?id=113091001. Seite 46 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Im September 2013 ist Fujitsu in der TPC-E Liste mit zwölf PRIMERGY Veröffentlichungen vertreten: System und Prozessoren Durchsatz Preis / Performance Watts/tpsE Verfügbarkeitsdatum TX300 S4 mit 2 × Xeon X5460 317.45 tpsE $523.49 pro tpsE - 30. August 2008 RX600 S4 mit 4 × Xeon X7350 492.34 tpsE $559.88 pro tpsE - 1. Januar 2009 RX600 S4 mit 4 × Xeon X7460 721.40 tpsE $459.71 pro tpsE - 1. Januar 2009 RX300 S5 mit 2 × Xeon X5570 800.00 tpsE $343.91 pro tpsE - 1. April 2009 RX600 S5 mit 4 × Xeon X7560 2046.96 tpsE $193.68 pro tpsE - 1. September 2010 RX900 S1 mit 8 × Xeon X7560 3800.00 tpsE $245.82 pro tpsE - 1. Oktober 2010 1. November 2010 RX300 S6 mit 2 × Xeon X5680 1246.13 tpsE $191.48 pro tpsE - RX300 S6 mit 2 × Xeon X5690 1268.30 tpsE $183.94 pro tpsE 0.93 1. März 2011 RX900 S2 mit 8 × Xeon E7-8870 4555.54 tpsE $217.27 pro tpsE 1.00 1. Juli 2011 RX300 S7 mit 2 × Xeon E5-2690 1871.81 tpsE $175.57 pro tpsE 0.69 17. August 2012 RX500 S7 mit 4 × Xeon E5-4650 2651.27 tpsE $161.95 pro tpsE 0.68 RX300 S8 mit 2 × Xeon E5-2697 v2 2472.58 tpsE $135.14 pro tpsE - 1. November 2012 10. September 2013 Weitere Informationen sowie alle TPC-E Ergebnisse können der TPC-Webseite (http://www.tpc.org/tpce) entnommen werden. Die folgende Grafik für 2-Sockel PRIMERGY Systeme mit den unterschiedlichen Prozessortypen zeigt die gute Leistung des 2-Sockel-Systems PRIMERGY RX300 S8. tpsE $/tpsE 2500 tpsE 2,472.58 $/tpsE 500 523.49 2000 1,871.81 400 1500 343.91 300 1,246.13 1,268.30 1000 200 191.48 183.94 175.57 500 135.14 100 better better 800.00 317.45 0 0 PRIMERGY TX300 S4 2 × X5460 64 GB PRIMERGY RX300 S5 2 × X5570 96 GB PRIMERGY RX300 S6 2 × X5680 96 GB PRIMERGY RX300 S6 2 × X5690 96 GB PRIMERGY RX300 S7 2 × E5-2690 512 GB PRIMERGY RX300 S8 2 × E5-2697 v2 512 GB Gegenüber der PRIMERGY RX300 S7 beträgt der Leistungsgewinn +32% und gegenüber der PRIMERGY RX300 S6 +95%. Der Preis pro Performance ist $135.14/tpsE. Die Kosten reduzieren sich gegenüber der PRIMERGY RX300 S7 auf 77% und gegenüber der PRIMERGY RX300 S6 auf 73%. http://www.fujitsu.com/de/primergy Seite 47 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Die folgende Übersicht, sortiert nach Preis/Performance, zeigt die besten TPC-E Preis/Performance-Werte (Stand 11. September 2013) und die zugehörigen TPC-E Durchsätze für Konfigurationen mit zwei Prozessoren. Dabei erreicht die PRIMERGY RX300 S8 mit einem Preis/Performance-Wert von $135.14/tpsE das beste Preis-Leistungsverhältnis in dieser Klasse. Zwar ist noch ein TPC-E Ergebnis mit einem besseren Durchsatz in dieser Übersicht vorhanden, allerdings wird der Performance-Vorteil von 4.8% erkauft durch 16% höhere Gesamtkosten. System Fujitsu PRIMERGY RX300 S8 IBM System x3690 X5 IBM System x3650 M4 HP ProLiant DL380p Gen8 Fujitsu PRIMERGY RX300 S7 HP ProLiant DL385p Gen8 Fujitsu PRIMERGY RX300 S6 12x2.5 Fujitsu PRIMERGY RX300 S6 IBM System x3650 M4 HP ProLiant DL380 G7 Server Prozessortyp Prozessoren/ Cores/Threads 2 × Intel Xeon E5-2697 v2 2 × Intel Xeon E7-2870 2 × Intel Xeon E5-2697 v2 2 × Intel Xeon E5-2690 2 × Intel Xeon E5-2690 2 × AMD Opteron 6386SE 2 × Intel Xeon X5690 2 × Intel Xeon X5680 2 × Intel Xeon E5-2690 2 × Intel Xeon X5690 Microsoft SQL Server Version SQL Server 2012 Enterprise Edition SP1 SQL Server 2008 Enterprise Edition R2 SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SP1 SQL Server 2008 Enterprise Edition R2 SQL Server 2008 Enterprise Edition R2 SQL Server 2012 Enterprise Edition SQL Server 2008 R2 Enterprise Edition x64 tpsE (höher ist besser) $/tpsE (niedriger ist besser) Verfügbarkeitsdatum 2,472.58 135.14 2013-09-10 1,560.70 143.32 2011-05-27 2,590.93 150.00 2013-11-29 1,881.76 173.00 2012-12-21 1,871.71 175.57 2012-08-17 1,416.37 183.00 2013-05-15 1,268.30 183.94 2011-03-01 1,246.13 191.48 2010-11-01 1,863.23 207.85 2012-05-31 1,284.14 250.00 2011-05-04 Weitere Informationen sowie alle TPC-E Ergebnisse können der TPC-Webseite (http://www.tpc.org/tpce) entnommen werden. Bei dem Vergleich ist zu berücksichtigen, dass die PRIMERGY RX300 S8 mit der aktuellen Microsoft SQL Server 2012 Version vermessen wurde. Durch Änderung der Microsoft Lizenzpolitik bei Microsoft SQL Server 2012 gegenüber Microsoft SQL Server 2008 R2 ergeben sich unterschiedliche Kosten, die den Preis/Performance-Wert beeinflussen. Durch den Wechsel von Prozessor-basierten Lizenzen für Microsoft SQL Server 2008 R2 zu 2-Core-basierten Lizenzen für Microsoft SQL Server 2012 ergeben sich bei Konfigurationen mit Prozessoren, die mehr als zwei Cores enthalten, höhere Lizenzkosten mit Microsoft SQL Server 2012 als mit Microsoft SQL Server 2008 R2. Seite 48 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Die nachfolgende Tabelle enthält die Übersicht aller TPC-E Ergebnisse, die mit Microsoft SQL Server 2012 vermessen wurden (Stand 11. September 2013), sortiert nach Preis/Performance. Bei diesem Vergleich liefert die PRIMERGY RX300 S8 das beste Preis-Leistungsverhältnis. Prozessortyp Prozessoren/ Cores/Threads Intel Xeon E5-2697 v2 Fujitsu PRIMERGY RX300 S8 2/24/48 Intel Xeon E5-2697 v2 IBM System x3650 M4 2/24/48 Intel Xeon E5-4650 Fujitsu PRIMERGY RX500 S7 4/32/64 Intel Xeon E5-2690 HP ProLiant DL380p Gen8 2/16/32 Intel Xeon E5-2690 Fujitsu PRIMERGY RX300 S7 2/16/32 AMD Opteron 6386SE HP ProLiant DL385p Gen8 2/32/32 Intel Xeon E5-2690 IBM System x3650 M4 2/16/32 Intel Xeon E5-4870 IBM System x3850 X5 4/40/80 Intel Xeon E7-8870 IBM System x3850 X5 8/80/160 Intel Xeon E5-4870 Huaw ei Tecal RH5885 V2 4/40/80 NEC Intel Xeon E7-8870 NEC Express5800/A1080a-E 8/80/160 System Microsoft SQL Server Version SQL Server 2012 Enterprise Edition SP1 SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SP1 SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition SQL Server 2012 Enterprise Edition tpsE (höher ist besser) $/tpsE (niedriger ist besser) Verfügbarkeitsdatum 2,472.58 135.14 2013-09-10 2,590.93 150.00 2013-11-29 2,651.27 161.95 2012-11-01 1,881.76 173.00 2012-11-21 1,871.81 175.57 2012-08-17 1,416.37 183.00 2013-05-15 1,863.23 207.85 2012-05-31 3,218.46 225.30 2012-11-28 5,457.20 249.58 2013-03-08 3,053.84 352.48 2012-10-30 4,614.22 450.18 2012-04-02 Weitere Informationen sowie alle TPC-E Ergebnisse können der TPC-Webseite (http://www.tpc.org/tpce) entnommen werden. http://www.fujitsu.com/de/primergy Seite 49 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 STREAM Benchmark-Beschreibung STREAM ist ein seit vielen Jahren eingesetzter synthetischer Benchmark zur Ermittlung des Speicherdurchsatzes, der von John McCalpin während seiner Professur an der Universität in Delaware entwickelt wurde. Heute wird STREAM an der Universität von Virginia betreut. Dort kann der Quellcode wahlweise in Fortran oder C heruntergeladen werden. Besonders im HPC-Umfeld spielt STREAM nach wie vor eine wichtige Rolle. So ist er z.B. Bestandteil der HPC Challenge Benchmark-Suite. Der Benchmark ist so konzipiert, dass er sowohl auf PCs als auch auf Serversystemen eingesetzt werden kann. Die Maßeinheit des Benchmarks ist GB/s, also die Anzahl Gigabytes, die pro Sekunde gelesen und geschrieben werden kann. STREAM misst den Speicherdurchsatz bei sequentiellen Zugriffen. Diese können generell effizienter durchgeführt werden als Zugriffe, die zufällig auf den Speicher verteilt sind, da bei sequentiellem Zugriff die Prozessor-Caches genutzt werden. Vor der Ausführung wird der Quellcode der zu vermessenden Umgebung angepasst. So muss die Größe des Datenbereiches mindestens 12mal höher sein als die Summe aller „last-level“ Prozessor-Caches, damit diese einen möglichst geringen Einfluss auf das Ergebnis nehmen. Mit Hilfe der OpenMPProgrammbibliothek können ausgewählte Programmteile während der Laufzeit des Benchmarks parallel ausgeführt werden, wodurch eine optimale Lastverteilung auf die verfügbaren Prozessorkerne erreicht wird. Bei der Ausführung wird der definierte Datenbereich, bestehend aus 8-Byte-Elementen, nacheinander auf vier Arten kopiert, wobei teilweise zusätzlich arithmetische Berechnungen durchgeführt werden. Art Ausführung Bytes je Schritt Gleitkommarechnung je Schritt COPY a(i) = b(i) 16 0 SCALE a(i) = q × b(i) 16 1 SUM a(i) = b(i) + c(i) 24 1 TRIAD a(i) = b(i) + q × c(i) 24 2 Bei jeder Berechnungs-Art wird der Durchsatz in GB/s ausgegeben. Die Unterschiede der verschiedenen Werte sind auf modernen Systemen in der Regel nur gering. Zum Vergleich wird im Allgemeinen nur noch der ermittelte TRIAD-Wert verwendet. Die Messergebnisse hängen in erster Linie von der Taktfrequenz der Speichermodule ab, die Prozessoren beeinflussen die arithmetischen Berechnungen. 9 In diesem Kapitel sind Durchsätze durchgängig zur Basis 10 angegeben (1 GB/s = 10 Byte/s). Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Prozessor 2 Prozessoren der Intel Xeon Processor E5-2600 v2 Product Family Speicher 16 × 16GB (1x16GB) 2Rx4 DDR3-1866 R ECC ® ® Software BIOS-Einstellungen Alle Prozessoren außer Xeon E5-2603 v2, E5-2609 v2: Hyper-Threading = Disabled Betriebssystem Red Hat Enterprise Linux Server release 6.4 Betriebssystemeinstellungen echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled Compiler Intel C Compiler 12.1 Benchmark Stream.c Version 5.9 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 50 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Ergebnisse Prozessor Speicherfrequenz [MHz] Max. Speicher- Cores bandbreite [GB/s] Prozessorfrequenz [Ghz] Anzahl Prozessoren TRIAD [GB/s] Xeon E5-2603 v2 1333 42.6 4 1.80 2 48.4 Xeon E5-2609 v2 1333 42.6 4 2.50 2 59.2 Xeon E5-2620 v2 1600 51.2 6 2.10 2 78.8 Xeon E5-2630Lv2 1600 51.2 6 2.40 2 80.4 Xeon E5-2630 v2 1600 51.2 6 2.60 2 81.8 Xeon E5-2640 v2 1600 51.2 8 2.00 2 83.2 Xeon E5-2650Lv2 1600 51.2 10 1.70 2 81.8 Xeon E5-2637 v2 1866 59.7 4 3.50 2 82.8 Xeon E5-2643 v2 1866 59.7 6 3.50 2 97.0 Xeon E5-2650 v2 1866 59.7 8 2.60 2 96.9 Xeon E5-2667 v2 1866 59.7 8 3.30 2 98.6 Xeon E5-2660 v2 1866 59.7 10 2.20 2 95.8 Xeon E5-2670 v2 1866 59.7 10 2.50 2 97.3 Xeon E5-2680 v2 1866 59.7 10 2.80 2 97.9 Xeon E5-2690 v2 1866 59.7 10 3.00 2 98.1 Xeon E5-2695 v2 1866 59.7 12 2.40 2 101 Xeon E5-2697 v2 1866 59.7 12 2.70 2 101 Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY RX300 S8 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S7, in jeweils performantester Ausstattung. STREAM TRIAD: PRIMERGY RX300S8 vs. PRIMERGY RX300S7 GB/s 120 100 101 81.9 80 60 40 20 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 × Xeon E5-2667 2 × Xeon E5-2697 v2 http://www.fujitsu.com/de/primergy Seite 51 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 LINPACK Benchmark-Beschreibung LINPACK wurde in den 1970er Jahren von Jack Dongarra und anderen entwickelt, um die Leistungsfähigkeit von Supercomputern zu zeigen. Der Benchmark besteht aus einer Sammlung von Bibliotheksfunktionen zur Analyse und Lösung linearer Gleichungssysteme. Eine Beschreibung findet man in dem Dokument http://www.netlib.org/utk/people/JackDongarra/PAPERS/hplpaper.pdf. Mit LINPACK lässt sich die Geschwindigkeit von Computern bei der Lösung eines linearen Gleichungssystems messen. Hierzu wird eine n × n-Matrix gebildet und diese mit Zufallszahlen zwischen -2 und +2 gefüllt. Die Berechnung erfolgt dann per LR-Zerlegung mit partieller Pivotisierung. Für die Matrix wird eine Speichermenge von 8n² Bytes benötigt. Bei einer n × n-Matrix entspricht die Anzahl 2 3 2 der zur Lösung notwendigen arithmetischen Operationen /3n + 2n . Die Wahl von n bestimmt daher die Dauer der Messung: eine Verdopplung von n führt annähernd zu einer Verachtfachung der Messdauer. Zusätzlich hat die Größe von n einen Einfluss auf das Messergebnis selbst: mit steigendem n nähert sich der Messwert asymptotisch einem Grenzwert an. Die Größe der Matrix wird daher im Allgemeinen der Menge des zur Verfügung stehenden Speichers angepasst. Des Weiteren spielt die Speicherbandbreite des Systems eine für das Messergebnis zwar nur geringe, aber nicht völlig zu vernachlässigende Rolle. Der für das Messergebnis maßgebliche Faktor ist die Prozessorleistung. Da der verwendete Algorithmus eine parallele Bearbeitung zulässt, ist neben der Taktrate vor allem die Anzahl der eingesetzten Prozessoren und ihrer Prozessorkerne von herausragender Bedeutung. Mit LINPACK wird gemessen, wie viele Gleitkommaoperationen pro Sekunde durchgeführt wurden. Das Ergebnis wird als Rmax bezeichnet und in GFlops (Giga Floating Point Operations per Second) angegeben. Eine obere, als Rpeak bezeichnete, Schranke für die Geschwindigkeit eines Computers lässt sich aus der maximalen Anzahl Gleitkommaoperationen, die seine Prozessorkerne innerhalb eines Taktzyklus theoretisch ausführen könnten, errechnen: Rpeak = Maximale Anzahl Gleitkommaoperationen pro Taktzyklus × Anzahl Prozessorkerne des Computers × Nominalfrequenz des Prozessors [GHz] Im Umfeld des High Performance Computing (HPC) zählt LINPACK zu den führenden Benchmarks. Innerhalb der HPC Challenge Benchmark-Suite, die weitere Aspekte der Leistungsfähigkeit im HPC-Umfeld berücksichtigt, ist LINPACK einer von sieben aktuell enthaltenen Benchmarks. Eine herstellerunabhängige Veröffentlichung von LINPACK-Ergebnissen ist unter http://www.top500.org/ möglich. Voraussetzung hierfür ist die Verwendung einer auf HPL basierenden LINPACK-Version (Siehe: http://www.netlib.org/benchmark/hpl/). Für Einzelsysteme mit Intel-Prozessoren bietet Intel eine hoch optimierte LINPACK-Version an (Shared memory version). Parallele Prozesse kommunizieren hierbei über „shared memory“, also gemeinsam genutzten Speicherbereich. Eine weitere von Intel zur Verfügung gestellte Version basiert auf HPL (HighPerformance Linpack). Die Kommunikation der LINPACK-Prozesse untereinander erfolgt hierbei über OpenMP und MPI (Message Passing Interface). Dies ermöglicht eine Kommunikation zwischen den parallelen Prozessen auch über Rechnergrenzen hinweg. Beide Versionen können von http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/ heruntergeladen werden. Auch bei der Verwendung von Grafikkarten für General Purpose Computation on Graphics Processing Unit (GPGPU) kommen herstellerspezifische LINPACK-Versionen zum Einsatz. Diese basieren auf HPL und beinhalten Erweiterungen, die zur Kommunikation mit den Grafikkarten benötigt werden. Seite 52 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX300 S8 Prozessor 2 Prozessoren der Intel Xeon Processor E5-2600 v2 Product Family Speicher 16 × 8GB (1x8GB) 2Rx8 DDR3-1866 R ECC ® ® Software BIOS-Einstellungen Alle Prozessoren außer Xeon E5-2603 v2, E5-2609 v2: Hyper-Threading = Disabled Alle Prozessoren außer Xeon E5-2603 v2, E5-2609 v2: Turbo Mode = Enabled (default) = Disabled Betriebssystem Red Hat Enterprise Linux Server release 6.4 Benchmark HPL version: Intel Optimized MP LINPACK Benchmark for Clusters 11.0 Update 5 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Anzahl Prozessoren Rpeak [GFlops] Rmax (ohne Turbomodus) [GFlops] Effizienz Rmax (mit Turbomodus) [GFlops] Effizienz 4 1.80 2 115 110 96% Xeon E5-2609 v2 4 2.50 2 160 152 95% Xeon E5-2637 v2 4 3.50 2 224 213 95% 220 98% Xeon E5-2620 v2 6 2.10 2 202 192 95% 219 108% Xeon E5-2630Lv2 6 2.40 2 230 219 95% 238 103% Xeon E5-2630 v2 6 2.60 2 250 238 95% 265 106% Xeon E5-2643 v2 6 3.50 2 336 320 95% 329 98% Xeon E5-2640 v2 8 2.00 2 256 244 95% 280 109% Xeon E5-2650 v2 8 2.60 2 333 316 95% 364 109% Xeon E5-2667 v2 8 3.30 2 422 402 95% 423 100% Xeon E5-2650Lv2 10 1.70 2 272 259 95% 289 106% Xeon E5-2660 v2 10 2.20 2 352 335 95% 395 112% Xeon E5-2670 v2 10 2.50 2 400 380 95% 440 110% Xeon E5-2680 v2 10 2.80 2 448 426 95% 463 103% Xeon E5-2690 v2 10 3.00 2 480 456 95% 486 101% Xeon E5-2695 v2 12 2.40 2 461 437 95% 496 108% Xeon E5-2697 v2 12 2.70 2 518 492 95% 546 105% Cores Xeon E5-2603 v2 Prozessor Nominalfrequenz [Ghz] Benchmark-Ergebnisse Rmax = Messergebnis Rpeak = Maximale Anzahl Gleitkommaoperationen pro Taktzyklus × Anzahl Prozessorkerne des Computers × Nominalfrequenz [GHz] http://www.fujitsu.com/de/primergy Seite 53 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Systemvergleich Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY RX300 S8 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S7, in jeweils performantester Ausstattung. LINPACK: PRIMERGY RX300 S8 vs. PRIMERGY RX300 S7 GFlops 546 600 500 352 400 300 200 100 0 PRIMERGY RX300 S7 PRIMERGY RX300 S8 2 × Xeon E5-2690 2 × Xeon E5-2697 v2 Seite 54 (56) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 Literatur PRIMERGY Server http://primergy.de/ PRIMERGY RX300 S8 Dieses White Paper: http://docs.ts.fujitsu.com/dl.aspx?id=17042c73-bfcf-44a9-89a8-ef2cd6e6e2f2 http://docs.ts.fujitsu.com/dl.aspx?id=19a3e09c-44c0-4930-b466-0d8c31326057 http://docs.ts.fujitsu.com/dl.aspx?id=60b95b62-4253-4e2a-b3fa-98483755cbb5 Datenblatt http://docs.ts.fujitsu.com/dl.aspx?id=bb4216b5-57f3-48e4-a93f-a56d34e8dd59 PRIMERGY Performance http://www.fujitsu.com/de/x86-server-benchmarks Performance von Server-Komponenten http://www.fujitsu.com/de/products/computing/servers/mission-critical/benchmarks/x86components.html BIOS-Optimierungen für Xeon E5-2600 v2 basierte Systeme http://docs.ts.fujitsu.com/dl.aspx?id=0a62a369-241b-4de2-a970-41437aa4901b Speicher-Performance Xeon E5-2600 v2 (Ivy Bridge-EP) basierter Systeme http://docs.ts.fujitsu.com/dl.aspx?id=9c2f6975-753c-47b8-821a-b54caf030979 ® Performance Report PCIe-SSDs ioDrive 2 http://docs.ts.fujitsu.com/dl.aspx?id=be87b2de-30a9-4536-901d-c78ed72767b8 RAID-Controller-Performance http://docs.ts.fujitsu.com/dl.aspx?id=71fac54b-7ec3-4b3f-b13d-f80fbb42d583 Disk-I/O: Performance von Speichermedien und RAID-Controllern Grundlagen Disk-I/O-Performance http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d Informationen über Iometer http://www.iometer.org LINPACK The LINPACK Benchmark: Past, Present, and Future http://www.netlib.org/utk/people/JackDongarra/PAPERS/hplpaper.pdf TOP500 http://www.top500.org/ HPL - A Portable Implementation of the High-Performance Linpack Benchmark for DistributedMemory Computers http://www.netlib.org/benchmark/hpl/ Intel Math Kernel Library – LINPACK Download http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/ OLTP-2 Benchmark-Überblick OLTP-2 http://docs.ts.fujitsu.com/dl.aspx?id=743d7d46-56e8-41d2-9d50-9ab29ccf4d18 SAP SD http://www.sap.com/benchmark Benchmark Überblick SAP SD http://docs.ts.fujitsu.com/dl.aspx?id=ae039b1d-73d8-4946-ae60-08dcef54cfa8 http://www.fujitsu.com/de/primergy Seite 55 (56) White Paper Performance Report PRIMERGY RX300 S8 Version: 1.3 2015-03-06 SPECcpu2006 http://www.spec.org/osg/cpu2006 Benchmark Überblick SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=04351fd2-8a69-42a3-ba1c-4342dcc89b89 SPECpower_ssj2008 http://www.spec.org/power_ssj2008 Benchmark-Überblick SPECpower_ssj2008 http://docs.ts.fujitsu.com/dl.aspx?id=66467935-98dc-4374-80b2-3ddae4c73491 STREAM http://www.cs.virginia.edu/stream/ TPC-E http://www.tpc.org/tpce Benchmark Overview TPC-E (DE) http://docs.ts.fujitsu.com/dl.aspx?id=08c95eef-5f18-4453-bed6-cbf9363f4e2f Kontakt FUJITSU Website: http://www.fujitsu.com/de/ PRIMERGY Product Marketing mailto:[email protected] PRIMERGY Performance und Benchmarks mailto:[email protected] © Copyright 2013-2015 Fujitsu Technology Solutions. Fujitsu und das Fujitsu Logo sind Handelsnamen und/oder eingetragene Warenzeichen von Fujitsu Ltd. in Japan und anderen Ländern. Andere Firmen-, Produkt- und Servicebezeichnungen können Marken oder eingetragene Marken der jeweiligen Eigentümer sein. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann. Weitere Einzelheiten unter http://www.fujitsu.com/de/resources/navigation/terms-of-use.html 2015-03-06 WW DE Seite 56 (56) http://www.fujitsu.com/de/primergy