Knockout: Intels Xeon 5160 deklassiert AMDs Opteron

Werbung
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Knockout: Intels Xeon 5160
deklassiert AMDs Opteron
› Intels stellt mit dem Xeon 5160 „Woodcrest“ die erste CPU mit der neuen
Core-Architektur vor. In unserem Update vergleichen wir die Core-CPU mit dem ebenfalls
neuen Xeon 5080 und AMDs Opteron. Zusätzlich messen wir den Energieverbrauch der
neuen Systeme.
Von Christian Vilsbeck (23.05.2006, Update: 26.06.2006)
For an english version click here (http://www.tecchannel.de/index.cfm?webcode=439566) .
Die Zeit der Schmach scheint zu enden. Intel konnte AMDs Opteron lange Zeit kein wirklich adäquates
Produkt entgegen setzen. Besonders der 2,8-GHz-Dual-Core-Xeon Paxville DP
(http://www.tecchannel.de/technologie/prozessoren/432493/) für 2-Wege-Systeme ist den Opteron-Doppelkernen
hoffnungslos unterlegen. Die Xeon-5100-Serie „Woodcrest“ soll jetzt eine neue Ära bei Intel einläuten. Mit
seiner neuen Core-Architektur (http://www.tecchannel.de/technologie/prozessoren/437111/) will der Dual-Core-Prozessor
höchste Performance bei gleichzeitig deutlich reduziertem Energiebedarf bieten.
Xeon 5160 „Woodcrest“ 3,0 GHz: Der Xeon-Prozessor
mit Core-Architektur besitzt zwei Kerne, einen 4 MByte
Shared L2-Cache sowie einen FSB1333.
Den Xeon „Woodcrest“ für 2-Wege-Systeme lässt Intel als Modell 5160 mit einer Taktfrequenz von 3,0 GHz
arbeiten. Beide Kerne greifen auf einen 4 MByte großen gemeinsamen L2-Cache zurück. Die
Geschwindigkeit des Prozessorbusses hebt Intel auf 1333 MHz an. In einem 2-Sockel-System steht jedem
Woodcrest ein eigener FSB zum Chipsatz zur Verfügung. So setzt der Core-Prozessor auf die neuen
Plattformen (http://www.tecchannel.de/server/hardware/432919/) „Bensley“ für Server sowie „Glidewell“ für
Workstations.
Xeon 5080 „Dempsey“ 3,73 GHz: Der Xeon-Prozessor
mit NetBurst-Architektur besitzt zwei Kerne, je 2 MByte
L2-Cache pro Core sowie einen FSB1066.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
1
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Beide Plattformen sollen mit vier FB-DIMM-Channels (http://www.tecchannel.de/server/hardware/402269/) mit
DDR2-533 für einen ordentlichen Speicherdurchsatz sorgen. Damit sind theoretische 17 GByte/s Bandbreite
möglich – mit DDR2-667 sogar 21 GByte/s. Bensley und Glidewell gibt es seit xx. Juni 2006 zusammen mit
der ebenfalls neuen Xeon-5000-Serie „Dempsey“. Diese Dual-Core-CPUs mit Taktfrequenzen bis 3,73 GHz
(Xeon 5080) basieren aber noch auf der NetBurst-Architektur.
Im tecCHANNEL-Testlabor müssen die neuen Xeon 5080 „Dempsey“ und Xeon 5160 „Woodcrest“ ihre
Leistungsfähigkeit gegen die bisherigen Xeon-Modelle unter Beweis stellen. Von AMD treten der
Dual-Core-Opteron 280 (2,4 GHz) sowie die Single-Core-Variante 254 (2,8 GHz) an. Leider konnte uns AMD
noch immer keine Opteron 285 (2,6 GHz) als Testsamples zur Verfügung stellen.
Zusätzlich vergleichen wir die Energieaufnahme des Bensley-Servers, wenn zwei Xeon 5080 durch ein
5160er Woodcrest-Doppelpack ausgetauscht werden. Der Unterschied überrascht!
› Details zum Xeon „Woodcrest“
Beim Xeon „Woodcrest“ für 2-Sockel-Systeme führt Intel die 5100er Prozessornummern ein. Als Topmodell
fungiert der von uns getestete Xeon 5160 mit 3,0 GHz Taktfrequenz. Zusätzlich bietet Intel die Modelle 5110
(1,66 GHz), 5120 (1,83 GHz), 5130 (2,00 GHz), 5140 (2,33 GHz) und 5150 (2,67 GHz) an. Allen Xeons
gemein ist der 4 MByte große L2-Cache. Unterschiede finden sich beim Prozessorbus: Der Xeon 5110 und
5120 besitzen einen FSB1066, die schnelleren Woodcrests arbeiten mit einem FSB1333.
Schneller Bus: Der Xeon „Woodcrest“ ist Intels erste
CPU mit einer FSB-Taktfrequenz von 1333 MHz.
Die 5100er Xeons nehmen in der Bensley-/Glidewell-Plattform (http://www.tecchannel.de/server/hardware/432919/) im
LGA771-Sockel Platz. Wahlweise lassen sich die neuen Server-/Workstation-Mainboards auch mit den
Xeon-5000-Modellen „Dempsey“ bestücken. Während ein Xeon 5080 mit 3,73 GHz Taktfrequenz und
NetBurst-Architektur mit 130 Watt TDP spezifiziert ist, begnügt sich der 5160er 3,0-GHz-Woodcrest mit 80
Watt TDP. Die mit geringerer Taktfrequenz arbeitenden Woodcrests spezifiziert Intel mit 40 und 65 Watt
TDP.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
2
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Neuer Steckplatz: Die Xeon-Modelle „Dempsey“ und
„Woodcrest“ nehmen im LGA771-Sockel Platz. Die
Pin-losen CPUs verfügen nur noch über
Kontaktflächen, dem so genannten Land Grid Array.
Intels Xeon-5100-Serie beherrscht die 64-Bit-Erweiterung EM64T – ein Pflicht-Feature für eine neue
Architektur. Für die Virtualisierung der CPU verfügen die Woodcrest-Xeons über den VT-x-Befehlssatz der
Vanderpool-Technologie. Ein Standard-Feature bei der Xeon-5100-Serie ist auch die XD-Technologie für
erweiterten Schutz vor Viren und Buffer Overflows. SpeedStep zum dynamischen Senken der Taktfrequenz
und der Kernspannung zählt ebenfalls zum Repertoire der Woodcrest-CPU. Hyper-Threading sucht man bei
den Xeons mit Core-Architektur jedoch vergeblich.
Im Gegensatz zu den Dempsey-Xeons sind beim Woodcrest beide Prozessorkerne auf einem Die vereint.
Bei den Dempsey-Modellen besitzt jeder Kern noch seinen eigenen 2 MByte großen L2-Cache. Intel fertigt
die Xeon-Modelle „Woodcrest“ und „Dempsey“ jeweils in einem 65-nm-Prozess.
Die Preise der Woodcrest-Xeons reichen bei einer Abnahmemenge 1000 Stück von 209 US-Dollar für den
Xeon 5110 bis 851 US-Dollar für das Top-Modell Xeon 5160. Die Preisspanne bei den Dempsey-Modellen
liegt zwischen 177 US-Dollar (Xeon 5050 mit 3,0 GHz) und ebenfalls 851 US-Dollar (Xeon 5080 mit 3,73
GHz).
Alle Details über die Core-Architektur des Xeon „Woodcrest“ finden Sie bei tecCHANNEL im Artikel Wechsel
an der Spitze: Intels neue Core Prozessoren (http://www.tecchannel.de/technologie/prozessoren/437111/) . Ausführliche
Informationen über die neuen Woodcrest-Plattformen erhalten Sie im Artikel Alles neu: Intels Xeon-Plattform
Bensley & Glidewell (http://www.tecchannel.de/server/hardware/432919/) .
› CPU2000: SPECint_base2000
Wir setzen die SPEC-Benchmarks (http://www.spec.org/) unter Windows Server 2003 praxisnah ein und
kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET für alle
Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum
Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei
Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität zu den
verschiedenen CPUs.
Der SPECint_base2000-Benchmark arbeitet singlethreaded und nutzt die Vorteile von Hyper-Threading und
Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
3
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
SPECint_base2000: Der Xeon 5160 deklassiert die
restliche x86-Welt. Die Integer-Performance ist in allen
12 Einzeltests der Suite konkurrenzlos. Dabei ist es
egal, ob der Test im Cache abläuft oder
speicherintensiv ist. Insgesamt arbeitet der
3,0-GHz-Woodcrest 60 Prozent schneller als der
Zweitplatzierte Opteron 254.
In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks der wichtigsten
Prozessoren im Vergleich:
SPECint_base2000: Official Run
Prozessor
Opteron 254
Opteron 280
Xeon 5080 „Dempsey“
Xeon 5160 „Woodcrest“
Taktfrequenz
2,8 GHz
2,4 GHz
3,73 GHz
3,0 GHz
Sockel
S940
S940
LGA771
LGA771
Core
AMD64
AMD64
Dempsey
Woodcrest
Speichertyp
Reg. DDR400 CL3
Reg. DDR400 CL3
FB-DDR2-533 CL4
FB-DDR2-533 CL4
Chipsatz
NF Prof.
NF Prof.
5000P
5000P
Compiler
-QxW
-QxW
-fast
-fast
164.gzip
1548
1333
1268
1880
175.vpr
1531
1365
1208
2133
Test
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
4
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
176.gcc
1450
1261
2118
3002
181.mcf
1234
1183
1925
4119
186.crafty
1988
1718
1375
2523
197.parser
1754
1539
1542
2401
252.eon
2491
2143
2322
3486
253.perlbmk
2061
1788
1980
3263
254.gap
2026
1771
1959
2828
255.vortex
2738
2410
2825
4427
256.bzip2
1451
1290
1299
2234
300.twolf
1890
1665
1881
3300
Gesamt
1800
1585
1750
2872
› Analyse Integer-Performance
Der Core-Prozessor Xeon 5160 „Woodcrest“ erreicht in allen Integer-Tests eine deutlich höhere
Performance als der NetBurst-basierende Xeon 5080 „Dempsey“. In den Single-Thread-Tests von
SPECint_base2000 profitiert Woodcrest zusätzlich von seinem Advanced Smart Cache
(http://www.tecchannel.de/technologie/prozessoren/437111/index10.html) : Arbeitet nur ein Core, so stehen ihm die vollen 4
MByte des gemeinsamen L2-Cache zur Verfügung.
Die Auswirkungen des großen L2-Cache sind bei der speicherintensiven Routing-Simulation 300.twolf gut zu
erkennen. Der 3,0-GHz-Woodcrest arbeitet 75 Prozent schneller als der 3,73-GHz-Dempsey. Das Gros der
benötigten Daten kann der Core-Prozessor im 4 MByte fassenden L2-Cache halten. Der NetBurst-Xeon
puffert mit 2 MByte dagegen weniger Daten und muss auf den Hauptspeicher zurückgreifen – dies kostet
Performance. Bei der Planungs-Software 181.mcf punktet der Xeon 5160 sogar mit 114 Prozent höherer
Leistung.
Für die Komprimieranwendung 164.gzip reicht eine L2-Cache-Größe von 512 KByte dagegen bereits
problemlos aus. Ein L2-Cache mit 2 oder 4 MByte sowie flinkerer Speicher nutzen hier nichts. Jetzt wird die
„pure“ Integer-Performance des Woodcrest im Vergleich zum NetBurst-Dempsey deutlich: der
Core-Prozessor rechnet 48 Prozent schneller.
Überwiegend im L1-Cache ablaufenden Raytracern wie der Anwendung 252.eon zeigen ein ähnliches
Kräfteverhältnis. Der Xeon 5160 ist 50 Prozent flinker unterwegs als der Xeon 5080 – trotz geringerer
Taktfrequenz. Das von Intel erklärte Ziel der Effizienzsteigerung bei der Core-Architektur lässt sich hier
bestätigen. Auch AMDs Opteron-Prozessoren können mit ihrer ebenfalls effizienten Architektur in keinem der
12 Integer-Anwendungen mithalten. Anders sieht der Vergleich der Opterons mit den NetBurst-Dempsey
aus. Beispielsweise beim Komprimierer 164.gzip – läuft im Cache ab – haben die Opterons trotz deutlich
geringerer Taktfrequenz den Dempsey im Griff.
› CPU2000: SPECint_rate_base2000
Wir setzen die SPEC-CPU2000-Benchmarks (http://www.spec.org/) unter Windows Server 2003 praxisnah ein
und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET für
alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht
zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die Leistungsfähigkeit der Prozessoren bei
parallel arbeitender Standard-Software. Hier achten die Software-Hersteller auf größtmögliche Kompatibilität
zu den verschiedenen CPUs.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
5
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen
Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel.
Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des
Systems.
SPECint_rate_base2000: Intels Woodcrest-Prozessoren
arbeiten parallel laufende Integer-Programme ebenfalls
mit Abstand schneller ab. Nicht nur die
Single-Core-Doppelpacks liegen chancenlos zurück.
Bei dem speicherintensiven SPECint_rate-Szenario
profitiert der Xeon 5160 zusätzlich von seinem
FSB1333.
› Optimierte Herstellerangaben: SPECint_rate_base2000
Die Prozessorhersteller sowie die Anbieter von Servern, Workstations und PCs veröffentlichen auf der
SPEC-Website (http://www.spec.org/cpu2000/results/cpu2000.html) ihre eigenen, hoch optimierten Ergebnisse des
CPU2000-Benchmarks. Dabei sind teilweise mehrere Compiler sowie spezielle, auf die CPUs abgestimmte
Bibliotheken im Einsatz.
Die SPECint_rate_base2000-Werte der Hersteller zeigen die maximale Integer-Leistungsfähigkeit der
Prozessoren in einer Multitask-Umgebung.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
6
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
SPECint_rate_base2000: Bei optimaler Unterstützung
arbeitet das Opteron-280-Doppelpack nochmals zirka
14 Prozent schneller als bei unseren Messungen. Die
Opteron-285-CPUs, die uns AMD nicht liefern konnte,
erreichen fast das Niveau der 5080er Xeons. Weit vorne
liegen die Core-CPUs Xeon 5160.
› CPU2000: SPECfp_base2000
Wir setzen die SPEC-Benchmarks (http://www.spec.org/) unter Windows Server 2003 praxisnah ein und
kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio sowie Intel
Fortran 9.0 für alle Fließkommatests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen
Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die
Leistungsfähigkeit der Prozessoren bei Standard-Software. Hier achten die Software-Hersteller auf
größtmögliche Kompatibilität zu den verschiedenen CPUs.
Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading und
Dual-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.
AMDs Opteron-Prozessoren beherrschen wie die Intel-CPUs SSE3. Die Intel-Compiler verweigern aber mit
eingestellter SSE3-Optimierung -QxP/fast die Zusammenarbeit mit den AMD-CPUs. Wir testen die
AMD64-Prozessoren mit dem Compiler-Switch -QxW mit SSE2-Unterstützung.
Zwar lässt sich die Prozessorabfrage bei den Intel-Compilern per Patch „umgehen“, doch nach den strengen
SPEC-Regeln dürfen nur Ergebnisse mit offiziell verfügbarerer Hard-/Software publiziert werden. So
unterstützt Intel dieses „umgehen“ der CPU-Abfrage bei seinen Compilern nicht, wie der Hersteller mitteilt.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
7
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
SPECfp_base2000: Dual-Core bewirkt hier nichts. Der
Xeon 5160 stürmt mit Abstand an die Spitze. AMDs
Opteron 280 muss sich dem höher getakteten 254er
Modell beugen.
In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks der
wichtigsten Prozessoren im Vergleich:
SPECfp_base2000: Official Run
Prozessor
Opteron 254
Opteron 280
Xeon 5080 „Dempsey“
Xeon 5160 „Woodcrest“
Taktfrequenz
2,8 GHz
2,4 GHz
3,73 GHz
3,0 GHz
Sockel
S940
S940
LGA771
LGA771
Core
AMD64
AMD64
Dempsey
Woodcrest
Speichertyp
Reg. DDR400 CL3
Reg. DDR400 CL3
FB-DDR2-533 CL4
FB-DDR2-533 CL4
Chipsatz
NF Prof.
NF Prof.
5000P
5000P
Compiler
-QxW
-QxW
-fast
-fast
168.wupwise
2177
1928
2721
3135
171.swim
2353
2239
2639
2692
172.mgrid
1520
1344
1606
1757
173.applu
1320
1215
1630
2084
Test
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
8
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
177.mesa
2065
1785
1597
2742
178.galgel
2567
2326
3799
7149
179.art
1900
1811
4096
9249
183.equake
1754
1636
2172
2280
187.facerec
2071
1847
1691
2661
188.ammp
1332
1190
1246
2128
189.lucas
1971
1877
1792
1962
191.fma3d
1655
1491
1526
1961
200.sixtrack
748
645
740
1178
301.apsi
1524
1351
1286
1596
Gesamt
1712
1551
1852
2561
› Analyse Floating-Point
Die Floating-Point-Anwendungen der SPEC-CPU2000-Benchmark-Suite sind wesentlich speicherintensiver
als die Integer-Tests. Je größer der Cache, desto besser können „langsame“ Speicherzugriffe abgepuffert
werden. Bei einigen sehr speicherintensiven Programmen nutzen allerdings selbst große Caches nur noch
wenig – dann zählt die Speicherbandbreite. Dies wird bei der sehr speicherintensiven
Flachwasser-Simulation 171.swim zur Berechnung finiter Wasserelemente deutlich. Der Xeon 5160 mit 4
MByte L2-Cache arbeitet hier kaum schneller als der Xeon 5080 mit 2 MByte L2-Cache (der Cache des
zweiten Core bleibt hier ungenutzt).
Beide CPUs profitieren aber von den vier FB-DIMM-Channels der Bensley-Plattorm. Bei der Anwendung
171.swim liest die CPU in einem 1335 x 1335 großen Daten-Array eine Vielzahl von Datenblöcken im
Burst-Modus aus dem Speicher. Hohe Latenzzeiten fallen hier kaum ins Gewicht, es zählt die
Speicherbandbreite. Die Opterons ziehen aus ihrem schnellen integrierten Speicher-Controller ebenfalls
Gewinn, müssen Dempsey und Woodcrest aber dennoch ziehen lassen.
In Fällen wie der Bilderkennung 179.art arbeitet der Xeon 5160 sogar 126 Prozent schneller als der
3,73-GHz-Dempsey. Der Workload der Anwendung passt hier überwiegend in den 4 MByte großen Shared
L2-Cache (http://www.tecchannel.de/technologie/prozessoren/437111/index10.html) – der 2 MByte große Puffer des Xeon
5080 reicht nur noch partiell aus. Die Opterons mit ihrer L2-Cache-Größe von 1 MByte (pro Core) fallen noch
weiter zurück.
Bei allen Floating-Point-Anwendungen der CPU2000-Benchmark-Suite wird aber unabhängig von der
Workload-Größe die hohe SSE-Performance des Woodcrest deutlich. So wird bei NetBurst eine 128 Bit
breite SSE-Instruktion beim Dekodieren in zwei 64-Bit-Micro-Ops aufgeteilt. Der Datenpfad in die
SSE-Execution-Unit besitzt ebenfalls eine Datenbreite von nur 64 Bit. Somit werden für die Ausführung eines
128-Bit-SSE-Befehls zwei Taktzyklen benötigt.
Die Core-Architektur des Woodcrest besitzt dagegen einen durchgehenden 128-Bit-Ausführungspfad. Damit
muss nur ein einziger Micro-Op erzeugt, geordnet und ausgeführt werden. Die Berechnung eines
SSE-Befehls in der entsprechenden Ausführungseinheit erfolgt in einem Taktzyklus. Damit verdoppelt sich
die SSE-Performance. Beispielsweise kann Core auch einen 128-Bit Packet Multiply, 128-Bit Packed Add,
128-Bit Packet Load, 128-Bit Packed Store und einen Macro-Fusion-Befehl „cmp & jcc“ zusammen in einem
Taktzyklus berechnen.
› CPU2000: SPECfp_rate_base2000
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
9
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Wir setzen die SPEC-CPU2000-Benchmarks (http://www.spec.org/) unter Windows Server 2003 praxisnah ein
und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.0 und MS Visual Studio .NET
sowie Intel Fortran 9.0 für alle Fließkommatests. Spezielle Bibliotheken für die Optimierung auf den
jeweiligen Prozessor kommen nicht zum Einsatz. Die Ergebnisse geben einen guten Anhaltspunkt für die
Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standard-Software. Hier achten die
Software-Hersteller auf größtmögliche Kompatibilität zu den verschiedenen CPUs.
Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den
maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks
parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren
des Systems.
SPECfp_rate_base2000: Bei den speicherlastigen
Floating-Point-Benchmarks profitieren die
Xeon-5160-CPUs von den zwei 1333-MHz-FSBs sowie
den vier FB-DIMM-Channels. Außerdem nutzen die
Core-Prozessoren ihre hohe SSE-Performance aus.
› Optimierte Herstellerangaben: SPECfp_rate_base2000
Die Prozessorhersteller sowie die Anbieter von Servern, Workstations und PCs veröffentlichen auf SPEC.org
ihre eigenen, hoch optimierten Ergebnisse des CPU2000-Benchmarks. Dabei sind teilweise mehrere
Compiler sowie spezielle, auf die CPUs abgestimmte Bibliotheken im Einsatz.
Die SPECfp_rate_base2000-Werte der Hersteller zeigen die maximale Floating-Point-Leistungsfähigkeit der
Prozessoren in einer Multitask-Umgebung.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
10
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
SPECfp_rate_base2000: Durch den Einsatz der AMD
Core Math Library ACML und einem Compiler-Mix aus
Intels 9.0er und den PGI-6.0-Compilern überholt der
Opteron 280 die Dempseys-CPUs. Der Xeon 5160 bleibt
aber weiterhin deutlich in Führung.
› Floating Point: Linpack Linux 64 Bit
Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern.
Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.
Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark
erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher
wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8
(Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.
Unter SUSE Linux 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige
Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Opteron-Prozessoren mit
SSE3 arbeiten mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen.
Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000, 15.000, 18.000 und 22.000
Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und
zirka 3,6 GByte Arbeitsspeicher (22.000 Gleichungssysteme). Im Diagramm finden Sie die von den
Prozessoren maximal erreichten GFlops.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
11
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Bandbreitenvorteil: Das Xeon-5160-Doppelpack arbeitet
31 Prozent schneller als die 3,73-GHz-Xeons – trotz 20
Prozent geringerer Taktfrequenz. Durch den sehr hohen
Speicherbedarf von Linpack profitieren die neuen
Xeons auch von den vier FB-DIMM-Channels.
Alle Prozessoren nutzen bei Linpack 2.1.2 ihre SSE3-Befehlserweiterung aus. Mit einer speziell für den
Xeon 5160 optimierten Linpack-Version 3.0 erreichen die Core-CPUs einen Peak-Wert von 31,42 GFlops in
unserem Test. Die 3.0er Version nutzt die in der Core-Architektur zusätzlichen 16 neuen SSE4-Befehle aus.
Intel verwendet für die neuen Multimedia-Befehle allerdings bisher keinen neuen Namen. „SSE4“ ist nur eine
Alias-Bezeichnung.
› Analyse: SunGard Adaptiv Credit Risk
SunGards (http://www.sungard.com) Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend
auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf
Basis vorhandener Marktdaten.
SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle
Mathematik-Bibliotheken wie Intels MKL (http://www.intel.com/cd/software/products/asmo-na/eng/perflib/mkl/index.htm) oder
AMDs Core Math Library ACML (http://developer.amd.com/acml.aspx) verwendet Adaptiv Credit Risk nicht. Das
Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard arbeitet
überwiegend mit Integer-Operationen.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
12
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Schnelle Vorhersagen: Die beiden Xeon 5080 erreichen
fast die Performance des Woodcrest-Doppelpacks.
Speicherzugriffe halten sich bei Adaptiv Credit Risk in
Grenzen.
› Rendering: CINEBENCH 2003
CINEBENCH 2003 basiert auf Cinema 4D Release 8 von Maxon (http://www.maxon.net) und führt Shading- und
Raytracing-Tests durch. Die aktuelle Version unterstützt SSE2 sowie Multiprocessing und Intels
Hyper-Threading-Technologie (http://www.tecchannel.de/index.cfm?webcode=401793) .
Der Raytracing-Test von CINEBENCH 2003 überprüft die Render-Leistung des Prozessors. Eine Szene
"Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit
Shadowmaps behaftet sind und so genannte weiche Schatten werfen. Bei dem FPU-lastigen Test spielt die
Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle.
Höhere Speicher- und FSB-Bandbreiten nutzen beim Raytracing-Test von CINEBENCH 2003 wenig - der
Workload läuft überwiegend in den ersten beiden Cache-Stufen ab.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
13
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
1 Thread: Beim Rendering wird jetzt nur ein
Prozessorkern verwendet - Dual-Core, Hyper-Threading
und eine zweite CPU nutzen hier nichts. Der
3,0-GHz-Woodcrest arbeitet bei sieben Prozent höherer
Taktfrequenz 30 Prozent schneller als der Opteron 254
(2,8 GHz). Gegenüber den 3,73-GHz-Xeons rendert
Woodcrest sogar 56 Prozent flinker. Das selbst 1 MByte
L2-Cache hier genügt, zeigt der Vergleich der
3,60-GHz-Xeons mit 1 und 2 MByte L2-Cache.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
14
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren
– physikalischen und virtuellen – Prozessorkerne. Das
Woodcrest-Doppelpack zieht den zwei Opteron 280
sogar mit 48 höherer Performance davon. Gegenüber
den 3,73-GHz-Dempseys sind die 3,0-GHz-Woodcrest
44 Prozent schneller.
› Rendering: CINEBENCH 9.5
Mit CINEBENCH 9.5 stellt Maxon ein Benchmark-Tool mit der aktuelleren Version Cinema 4D 9.5 seines
Rendering-Werkzeugs zur Verfügung. CINEBENCH 9.5 verwendet beim Rendering neue
Berechnungsverfahren und nutzt moderne CPU-Architekturen besser aus. Die Ergebnisse sind nicht mit den
Werten von CINEBENCH 2003 vergleichbar.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
15
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
1 Thread: Hier wird wieder nur ein Prozessorkern
verwendet. Die Core-CPU Woodcrest arbeitet jetzt „nur
noch“ 19 Prozent schneller als der Opteron 254 - bei
CINEBENCH 2003 sind es 30 Prozent. Cinema 4D
unterstützt in der Version 9.5 AMDs
Opteron-Prozessoren besser. Der prozentuale
Vorsprung des Woodcrest zu den übrigen Xeons hat
sich kaum geändert.
Alle Threads: Arbeiten alle CPUs und Kerne, so rendern
die Woodcrests 41 Prozent schneller als die 280er
Opterons. Bei CINEBENCH 2003 setzen sich die
Woodcrests noch mit einer 48 Prozent höheren
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
16
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Renderleistung ab.
› Rendering: 3ds Max
Discreet/Autodesk (http://www.discreet.de) bietet mit 3ds Max 7 eine professionelle Software für 3D-Modelling,
Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 7 Multiprocessing voll aus. Die
Dual-Core- und Hyper-Threading-Technologien sowie ein zweiter Prozessor wirken somit beschleunigend.
Die Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org
(http://www.spec.org) . Die Grafikkarten-Performance spielt beim Rendering keine Rolle, die
OpenGL-basierenden Tests der SPECapc-Suite verwenden wir nicht.
Szene Radiosity: Unverändert markiert das
Core-basierende Xeon-5160-Duo die Spitze – diesmal
„nur“ mit 15 Prozent Vorsprung. Die Core-Prozessoren
nutzen ihre hohe SSE-Performance beim Rendern
bestens aus.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
17
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Szene Underwater: Hier geht es mit dem
Woodcrest-Doppelpack 27 Prozent schneller als mit
den 3,73-GHz-Xeon-5080-CPUs. Die 280er
Dual-Core-Opterons setzen sich jetzt zwischen die 3,20und 3,73-GHz-Dempseys. Es wird deutlich, dass die
Render-Performance der Prozessoren vom Workload und somit der Cache-Größe - abhängig ist. In der
Underwater-Szene genügt im Gegensatz zum
Radiosity-Workload 1 MByte L2-Cache. Die
3,60-GHz-Xeons mit 2M L2 sind hier nicht schneller als
die Modelle mit 1M L2.
Wir überprüften die Renderleistung der Woodcrest-Prozessoren bei diesen Szenen zusätzlich noch mit dem
aktuellen 3ds Max 8. Die ermittelte Performance gleicht den Ergebnissen von 3ds Max 7.
› Raytracing: POV-Ray 3.7
Das Raytracing-Programm POV-Ray (http://www.povray.org) ist ein frei erhältliches Open-Source-Tool zum
kreieren von 3D-Grafiken. Der „Persistence of Vision Raytracer“ bietet in der Version 3.7. Beta 9 ein
optimiertes Thread-Handling an. Die Beta-Version wartet außerdem mit einer SSE2-optimierten
Rendering-Engine auf.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
18
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Raytracing mit 1 Thread: Intels Xeon 5160 setzt seinen
Alleingang fort. Der Open-Source-Raytracer arbeitet mit
der Core-CPU 62 Prozent schneller als der Opteron 254.
Multi-Thread-Raytracing: Die hohe SSE2-Performance
des Woodcrest lässt der Konkurrenz keine Chance.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
19
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Woodcrest, Dempsey und Paxville DP sind bei diesem
Workload gegenüber dem Opteron 280 zusätzlich durch
ihre größeren L2-Caches im Vorteil. AMDs 280er steht
nur 1 MByte pro Prozessorkern zur Verfügung. Welchen
Einfluss bei POV-Ray der L2-Cache hat, zeigt der
Vergleich der beiden 3,60-GHz-Xeons.
› Enkodieren: LAME 3.97a
LAME etablierte sich neben den Fraunhofer-Varianten zu den bekanntesten MP3-Codecs. Der
LAME-Open-Source-Codec beherrscht eine variable und konstante Bitrate und erzeugt aus wav-Dateien
entsprechende mp3-Files.
Das Israel Institute of Technology Technicon (http://www.technion.ac.il/) erstellte in einem LAME-Projekt 32- und
64-Bit-Versionen des MP3-Encoders – jeweils mit Microsoft und Intel-Compilern erstellt. Bei unseren Tests
verwenden wir die Intel-Compilern erstellte LAME-3.97a-32-Bit-Version. Beim Enkodieren stellen wir die
Verwendung von einem Thread ein, um die Performance der verschiedenen CPU-Architekturen zu
beurteilen. LAME 3.97a verwendet die SSE2-Befehlserweiterung für das Enkodieren.
Talentiert: Intels Xeon 5160 wandelt wav-Musikstücke
40 Prozent schneller um als der 254er 2,8-GHz-Opteron.
Der Core-Prozessor profitiert hier besonders von seiner
hohen SSE-Performance.
› Energieverbrauch – deutlich weniger Watt
Intel spezifiziert den neuen Xeon 5160 mit einem TDP-Wert von 80 Watt. Der auf der NetBurst-Architektur
basierende Dual-Core-Prozessor Xeon 5080 besitzt dagegen einen TDP-Wert von 130 Watt. Beide Modelle
fertigt Intel im 65-nm-Verfahren.
Beide LGA771-Prozessoren arbeiten in der Bensley-Plattform mit FB-DIMM-Speicher und sind einfach
austauschbar. Somit lässt sich leicht überprüfen, wie der Energieverbrauch des 2-Sockel-Servers von den
CPUs abhängig ist.
Im folgenden Diagramm zeigen wir den Energieverbrauch des 2-Sockel-Bensley-Servers im „Leerlauf“.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
20
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Leerlauf: Mit zwei Xeon 5160 bestückt, benötigt der
Bensley-Server im Leerlauf 31 Prozent weniger Energie.
Jetzt arbeitet das Xeon-5080- und Xeon-5160-Doppelpack im Bensley-Server „auf Anschlag“. Für volle
CPU-Auslastung der sorgt SPECint_rate_2000 der CPU2000-Benchmark-Suite.
Genügsam: Arbeiten die CPUs unter Last, so lässt sich
mit den zwei Xeon 5160 sogar 37 Prozent Energie
sparen. Der Bensley-Server benötigt mit den
Woodcrests satte 150 Watt weniger Energie.
Auf einen direkten Vergleich mit unserem 2-Sockel-Opteron-Testsystem verzichten wir, weil sich das
Netzteil, Lüfter sowie die Grafikkarte vom Bensley-Server unterscheiden. Die folgenden Werte sollten
deshalb nur als „prozentuale Einschätzung“ dienen. So benötigt die AMD-Testplattform, bestückt mit zwei
Opteron 280 (TDP 95 Watt) im Leerlauf 236 Watt. Unter voller Last steigt der Energiebedarf um 44 Prozent
auf 340 Watt an.
In allen Fällen waren die Energiesparfunktionen (SpeedStep bei Intel, PowerNow! bei AMD) deaktiviert.
› Cache/Speicher: 32-Bit-Transfer
Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus
der tecCHANNEL Benchmark Suite Pro (http://www.tecchannel.de/index.cfm?webcode=401877) unter Windows Server
2003. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load-/Store-Unit der CPU und
den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben
eine getrennte Analyse von Load-, Store- und Move-Operationen.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
21
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Xeon 5160 „Woodcrest“ 3,00 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Die Core-CPU erreicht im Cache mit
11.394 MByte/s fast die Transferleistung des
3,73-GHz-Dempseys. Aus dem FB-DIMM-Speicher holt
Woodcrest bei 32-Bit-Zugriffen mit 3015 MByte/s etwas
mehr heraus als die NetBurst-CPU Dempsey. Hier
profitiert Woodcrest von seinem schnellen FSB1333.
Xeon 5080 „Dempsey“ 3,73 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Im Cache erreicht die Dempsey-CPU
eine Transferleistung von 12.617 MByte/s. Im
FB-DIMM-Speicher liegt die Transferrate bei 2965
MByte/s.
Xeon „Paxville DP“ 2,80 GHz Registered DualDDR2-400
CL3: Mit 9483 MByte/s ist der maximale Cache-Transfer
25 Prozent langsamer als beim Dempsey. Dies
entspricht der prozentual geringeren Taktfrequenz
gegenüber dem 3,73-GHz-Dempsey. Der
Dual-Channel-DDR2-400-Speicher erlaubt eine
Bandbreite von 2376 MByte/s.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
22
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Opteron 280 (2,40 GHz) Registered DualDDR400 CL3:
Bei bis 64 KByte großen Blockzugriffen (L1-Cache)
besitzt der Opteron mit 18.204 MByte/s eine wesentlich
höhere Bandbreite als die Xeons. Im 1 MByte fassenden
L2-Cache erlaubt die AMD-CPU allerdings nur noch
6189 MByte/s - deutlich weniger als die Xeons durch
ihre hohe Taktfrequenz. Im DDR400-Speicher erreicht
der Opteron 280 bei 32-Bit-Zugriffen mit 2621 MByte/s
allerdings fast das Niveau des Dempsey-Xeons mit vier
FB-DIMM-Channels.
› Cache/Speicher: 64-Bit-Transfer
Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem
MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU
mit jedem Befehl mehr Daten transferieren kann.
Xeon 5160 „Woodcrest“ 3,00 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Mit 22.828 MByte/s Durchsatz steigt der
L1-Cache-Durchsatz bei 64-Bit-Operationen schon
deutlich. Im Speicher erreicht der Dual-Core-Woodcrest
mit 3698 MByte/s ebenfalls mehr als bei
32-Bit-Kommandos.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
23
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Xeon 5080 „Dempsey“ 3,73 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Die NetBurst-CPU erreicht mit 27.969
MByte/s L1-Cache-Durchsatz wieder mehr als der
Woodcrest. Allerdings entlockt der FSB1066-Dempsey
dem Speicher mit 3560 MByte/s wieder etwas weniger.
Xeon „Paxville DP“ 2,80 GHz Registered DualDDR2-400
CL3: Der Core erlaubt bei 2,80 GHz Taktfrequenz eine
L1-Cache-Transferrate von 21.003 MByte/s. Im
L2-Cache sind noch 12.162 MByte/s möglich. Der
DualDDR2-400-Speicher erreicht bei 64-Bit-Kommandos
mit 3849 MByte/s (Load) eine höhere Bandbreite als die
FB-DIMMs des Dempsey und Woodcrest.
Opteron 280 (2,40 GHz) Registered DualDDR400 CL3:
Mit 24.463 MByte/s Durchsatz steigt der
L1-Cache-Durchsatz bei 64-Bit-Operationen schon
deutlich. Im Speicher erreicht der Dual-Core-Opteron
mit 3411 MByte/s ebenfalls mehr als bei
32-Bit-Kommandos.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
24
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
› Cache/Speicher: 128-Bit-Transfer
Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine
CPU erreichen kann.
Xeon 5160 „Woodcrest“ 3,00 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Im L1-Cache erreicht die CPU maximal
45.650 MByte/s. In der zweiten Pufferstufe sind es
19.581 MByte/s. Im Speicher liegt die Bandbreite mit
3813 MByte/s hinter dem Paxville-DP-Xeon.
Xeon 5080 „Dempsey“ 3,73 GHz 4-Channel-FB-DIMM
DDR2-533 CL4: Die Cache-Transferleistungen liegen
mit maximal 55.081 MByte/s in der ersten und 29.730
MByte/s in der zweiten Pufferstufe über den Werten des
Woodcrest. Dafür ist die Transferleistung beim
Speicher mit 3710 MByte/s etwas geringer. Mit
verantwortlich hierfür ist der gegenüber dem
Woodcrest langsamere FSB1066.
Xeon „Paxville DP“ 2,80 GHz Registered DualDDR2-400
CL3: Die maximale Transferleistung des L1-Cache liegt
jetzt bei 41.444 MByte/s. Der L2-Cache bietet bei
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
25
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
128-Bit-Operationen eine Bandbreite von 22.105
MByte/s. Im Speicher reicht es noch für 4127 MByte/s.
Opteron 280 (2,40 GHz) Registered DualDDR400 CL3:
Im L1-Cache erreicht die CPU maximal 18.360 MByte/s.
In der zweiten Pufferstufe sind es 9448 MByte/s. Damit
ist der Opteron bei 128-Bit-Zugriffen deutlich langsamer
als die Xeons. Im Speicher liegt die
AMD-Dual-Core-CPU mit 3316 MByte/s ebenfalls hinter
den Xeons.
› Fazit
Schon im Februar 2006 kündigte (http://www.tecchannel.de/news/themen/technologie/434774/index.html) Intel „vollmundig“
an, ihre künftigen Prozessoren mit Core-Architektur würden zum Zeitpunkt des Debüts 20 Prozent schneller
sein, als die dann erhältlichen Konkurrenzprodukte von AMD. Was damals als leicht „anmaßend“ erschien,
bestätigt sich jetzt aber. Der Server-/Workstation-Prozessor Xeon 5160 „Woodcrest“ schlägt in unserem
Benchmark-Test die restliche x86-Welt um Längen. Dabei ist es egal, ob es sich um AMDs Opteron-CPUs
oder den ebenfalls neuen 3,73-GHz-Prozessor Xeon 5080 „Dempsey“ mit NetBurst-Architektur handelt.
So weist der 5160er 3,0-GHz-Xeon beim renommierten CPU2000-Benchmark (http://www.spec.org/cpu2000/) eine
64 Prozent (Rate: 43) höhere Integer-Performance als der Xeon 5080 mit 3,73 GHz Taktfrequenz auf. Der
Core-CPU hilft hier seine vierfach superskalare Auslegung ebenso wie der dynamische 4 MByte große
L2-Cache, den beide Prozessorkerne gemeinsam nutzen.
Bei den Fließkommaberechnungen der CPU2000-Suite rechnet Woodcrest 38 Prozent (Rate: 33) schneller
als der 3,73-GHz-NetBurst-Xeon. Dies ist ein sehr gutes Ergebnis, denn die NetBurst-CPUs sind ja für ihre
hohe Floating-Point-Performance durchaus bekannt. Beim Woodcrest verbesserte Intel aber die
SSE-Befehlsverarbeitung entscheidend: Statt die 128-Bit-Instruktionen intern in zwei 64-Bit-Happen zu
verarbeiten, rutschen die SSE-Daten beim Core-Prozessor in voller 128-Bit-Breite durch. Eine
SSE-Instruktion berechnet Woodcrest somit in einem Taktzyklus.
Doch nicht nur bei der CPU2000-Benchmark-Suite beeindruckt Intels Woodcrest. Im Cache ablaufende
Rendering-Programme, Audio-Dekodieren oder sehr speicherintensive Tests wie Linpack bewältigt
Woodcrest meist zirka 20 bis 50 Prozent schneller als der Zweitbeste. Dabei spielt es auch keine Rolle, ob
die Anwendung single- oder multi-threaded programmiert ist.
Für den Xeon 5160 spricht neben der hohen Performance die deutlich geringere Leistungsaufnahme – im
Vergleich zum Xeon 5080. So lässt sich in einem 2-Sockel-Server auf Basis der Bensley-/Glidewell-Plattform
(http://www.tecchannel.de/server/hardware/432919/) über 30 Prozent Energie sparen, wenn statt Dempsey-CPUs zwei
Xeon 5160 eingesetzt werden.
AMD (http://www.amd.com/de-de) muss sich nach dieser Steilvorlage mächtig ins Zeug legen. Ob der im dritten
Quartal 2006 erwartete Socket-F-Opteron (http://www.tecchannel.de/news/themen/technologie/435044/index.html) mit
DDR2-Speicher-Controller ebenfalls einen merklichen Performance-Schub erwirkt, bleibt fraglich. Allerdings
sollte AMD nicht vorschnell unterschätzt werden, vielleicht wartet ja auch die nächste Opteron-Generation
mit überraschenden Innovationen auf. (cvi)
› Testplattform Woodcrest- & Dempsey-CPUs
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
26
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Intels 3,0-GHz-Xeon-5160-Prozessoren sowie das Xeon-5080-Doppelpack testen wir in einer
Bensley-Validation-Plattform.
Bensley-Plattform: Das Bridgeport-Mainboard setzt auf
den Blackford-Chipsatz und arbeitet mit zwei Xeon
„Woodcrest“ mit 3,00 GHz Taktfrequenz. Die acht
FB-DIMM-Slots sind mit vier 1-GByte-Riegeln bestückt.
Die Xeons nehmen in einem Mainboard mit der Bezeichnung „Bridgeport“ Rev. 205 Platz. Das Board setzt
auf den Blackford-Chipsatz 5000P für Server. Beide Xeon-5160-CPUs arbeiten mit einem 1333 MHz
schnellen FSB, die 5080er Modelle sind mit einem FSB1066 ausgestattet. Über vier FB-DIMM-Channels
steuert der Chipsatz insgesamt vier 1-GByte-Module vom Typ Micron MT18HTF12872FDY-53EB5E3 an. Die
FB-DIMMs setzen DDR2-533-SDRAMs mit CL4 ein.
Gekühlt: Der Advanced Memory Buffer (im Bild in der
Mitte des Moduls unter dem Blech) arbeitet mit 3,2 GHz
Taktfrequenz und bedarf einiger Kühlung.
Bei der Grafikkarte setzt das Bridgeport-Mainboard (Woodcrest und Dempsey) auf eine integrierte ATI
RAGE XL. Alle verwendeten Benchmarks sind von der Grafik-Performance unabhängig. Als Betriebssystem
verwenden wir Windows Server 2003 SP1 in der 32-Bit-Version sowie SUSE Linux in der 64-Bit-Version.
Hyper-Threading ist bei allen Tests der Dempsey-Prozessoren aktiviert.
Die 3,20-GHz-Dempseys (Xeon 5060) testeten wir in den Performance Labs der Intel-Fab in Portland. Als
Plattform stand uns dort ein Evaluation-Mainboard mit der Bezeichnung „Hoodsport“ zur Verfügung. Das
Board setzt auf den Greencreek-Chipsatz für Workstations. Die Speicherbestückung war identisch mit dem
Bridgeport-Server-Mainboards der 3,73-GHz-Dempseys und der 3,0-GHz-Woodcrests.
› Testplattform Xeons Socket 604 & Opterons
Die 3,60-GHz-Xeons „Irwindale“ (2M L2-Cache) und „Nocona“ (1M L2-Cache) nehmen in einem Supermicro
(http://www.supermicro.com) X6DA8-G2 Platz. Das Mainboard für zwei Prozessoren verwendet Intels
(http://www.intel.de) E7525-Chipsatz und unterstützt DDR2-400-SDRAM in einer Dual-Channel-Konfiguration.
Bei den Speichermodulen setzen wir auf Registered DIMMs PC2-3200R von Infineon (http://www.infineon.de) mit
einer CAS-Latency von 3.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
27
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
Xeon-Plattform: Das Supermicro X6DA8-G2 für zwei
Irwindale/Nocona-Prozessoren setzt auf Intels
DDR2-Chipsatz E7525. Acht DIMM-Steckplätze erlauben
bis zu 16 GByte Arbeitsspeicher.
Der Xeon 2,80 GHz „Paxville DP“ mit Dual-Core-Technologie arbeitet in einem Supermicro X6DHR-3G2 mit
E7520-Chipsatz. Das Board ist für den Betrieb mit der Dual-Core-CPU angepasst und verzichtet auf eine
PCI-Express-Grafik-Schnittstelle.
Für den Test der Opteron-CPUs von AMD (http://www.amd.com/de-de) verwenden wir ein Tyan (http://www.tyan.com)
K8WE mit NVIDIAs nForce-Professional-Chipsatz. Über ihren integrierten Memory-Controller greifen die
CPUs auf Dual-Channel-DDR400-SDRAM mit CL3 zurück. Die verwendeten Corsair-Module sind dabei
gepuffert ausgeführt.
Dualismus: Tyans K8WE nimmt zwei Opterons sowie
zwei PCI-Express-Grafikkarten auf. Jeder CPU stehen
vier DIMM-Steckplätze für insgesamt maximal 16 GByte
Arbeitsspeicher zur Verfügung.
Um die gleiche Testkonfiguration zu gewährleisten, stehen den Prozessoren jeweils 4 GByte Arbeitsspeicher
zur Verfügung.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
28
Knockout: Intels Xeon 5160 deklassiert AMDs Opteron
IDG Business Verlag GmbH
Alle Rechte vorbehalten. Jegliche Vervielfältigung oder Weiterverbreitung in jedem Medium in Teilen oder als Ganzes
bedarf der schriftlichen Zustimmung der IDG Business Verlag GmbH. DPA-Texte und Bilder sind urheberrechtlich
geschützt und dürfen weder reproduziert noch wiederverwendet oder für gewerbliche Zwecke verwendet werden. Für den
Fall, dass in tecChannel unzutreffende Informationen veröffentlicht oder in Programmen oder Datenbanken Fehler
enthalten sein sollten, kommt eine Haftung nur bei grober Fahrlässigkeit des Verlages oder seiner Mitarbeiter in Betracht.
Die Redaktion übernimmt keine Haftung für unverlangt eingesandte Manuskripte, Fotos und Illustrationen. Für Inhalte
externer Seiten, auf die von tecChannel aus gelinkt wird, übernimmt die IDG Business Verlag GmbH keine Verantwortung.
© tecCHANNEL
http://www.tecchannel.de/index.cfm?webcode=439240
29
Herunterladen