Iscriviti al feed

Recentemente Intel ha lanciato la quinta generazione di processori scalabili Intel® Xeon® (Intel Xeon SP), nome in codice Emerald Rapids; una famiglia di processori di fascia alta destinati a un'ampia gamma di carichi di lavoro. Al fine di verificare le prestazioni dei chip Intel, abbiamo collaborato con Intel e altre aziende per eseguire test benchmark con Red Hat Enterprise Linux 8.8 / 9.2 e versioni successive.

I processori Intel Xeon Scalable di quinta generazione sono compatibili con le schede madri Xeon Scalable di quarta generazione. Ora supporta fino a 64 core per socket, rispetto ai 60 core precedenti. Inoltre, è in grado di gestire velocità di memoria DDR5-5600 rispetto alle DDR5-4800 della generazione precedente, LLC fino a 3 volte superiori e velocità fino a 20 GT/s UPI 2.0. Il team Red Hat Performance Engineering ha configurato un prototipo di sistema di punta di Intel per entrambi i modelli, al fine di misurare le prestazioni.

Performance SAP

RHEL 8.8 SAP HANA: Leadership sui processori scalabili Intel Xeon di quinta generazione

Data la lunga storia di collaborazione, Red Hat e Intel hanno collaborato ancora una volta per offrire prestazioni all'avanguardia nei data center aziendali e non solo. I team di sviluppo e ingegneria delle prestazioni di Red Hat hanno lavorato all'abilitazione dell'hardware e alla convalida di questi nuovi processori scalabili per oltre un anno, eseguendo una serie di test benchmark prima del rilascio GA di Red Hat Enterprise Linux.

Prestazioni dei singoli core più elevate, ultima cache (LLC) più estesa, memoria più veloce e storage combinato con core ottimizzati per i carichi di lavoro migliorano le prestazioni complessive del sistema. Per dimostrare le prestazioni e fornire ulteriori informazioni su scalabilità e dimensionamento per le applicazioni e i carichi di lavoro SAP HANA, SAP ha introdotto l'edizione Business Warehouse (BWH) di SAP HANA Standard Application Benchmark [1]. Attualmente alla versione 3, questo benchmark simula una serie di utenti con requisiti analitici diversi e misura l'indicatore chiave di prestazione (KPI) rilevante per ciascuna delle tre fasi del benchmark, definite di seguito:

  1. Fase di caricamento dei dati, test della latenza dei dati e delle prestazioni di caricamento (più basso è migliore)
  2. Fase di throughput delle query, test del throughput delle query con query moderatamente complesse (più alto è migliore)
  3. Fase di runtime delle query, per testare le prestazioni dell'esecuzione di query molto complesse (inferiore è migliore)

Red Hat Enterprise Linux (RHEL) è stato utilizzato in diverse pubblicazioni recenti del benchmark descritto sopra. In particolare, due diverse dimensioni iniziali dei record (1,3 e 2,6 miliardi di record) che utilizzano un server Dell PowerEdge R760 con processori scalabili Intel Xeon di quinta generazione, hanno dimostrato che l'esecuzione del carico di lavoro su Red Hat Enterprise Linux può offrire un significativo aumento delle prestazioni rispetto alla generazione precedente di Intel server (vedi Tabella 1).

Tabella 1.Risultati nella categoria scale-up che eseguono SAP BW Edition for SAP HANA Standard Application Benchmark, Version 3 su SAP NetWeaver 7.50 e SAP HANA 2.0

 

Record

Iniziali

(Miliardi)

Fase 1

(più basso è migliore)

Fase 2

(più alto è migliore)

Fase 3

(più basso è migliore)

Red Hat Enterprise Linux 8.8 [2]

2.6

7.083 sec

13.410

68 sec

SUSE Linux Enterprise Server 15 [3]

2.6

10.404 sec

9.917

76 sec

Risultati per Intel Xeon/Red Hat Enterprise Linux di quinta generazione

 

31,9%

35,2%

10,5%

[1] Risultati SAP al 1° marzo 2023; SAP e SAP HANA sono marchi registrati di SAP AG in Germania e in molti altri Paesi. Per ulteriori informazioni, visita www.sap.com/benchmark

[2] Dell PowerEdge R760 (2 processori / 128 core / 256 thread, Intel Xeon
Processore Platinum 8592+, 1,9 GHz, 80 KB di cache L1 e 2048 KB di cache L2 per core, 320 MB di cache L3 per processore, 1536 GB di memoria principale). Numero di certificazione n. 2023076

[3] Atos BullSequana SH20 (2 processori / 120 core / 240 thread, Intel Xeon
Processore Platinum 8490H, 1,9 GHz, 80 KB di cache L1 e 2048 KB di cache L2 per core, 112,5 MB L3 cache per processore, 1024 GB di memoria principale). Numero di certificazione n. 2023028

 

Inoltre, utilizzando un set di dati di 1,3 miliardi di record iniziali, un server Dell EMC PowerEdge R760 che esegue Red Hat Enterprise Linux ha superato un server configurato in modo simile su due dei tre indicatori KPI di riferimento dimostrando tempi di caricamento dei set di dati migliori e runtime di query complesse (vedere la Tabella 2).

Tabella 2.Risultati nella categoria scale-up che eseguono SAP BW Edition for SAP HANA Standard Application Benchmark, Version 3 su SAP NetWeaver 7.50 e SAP HANA 2.0

 

Record iniziali (miliardi)

Fase 1

(più basso è migliore)

Fase 2

(più alto è migliore)

Fase 3

(più basso è migliore)

Red Hat Enterprise Linux 8.8 [4]

1.3

6.069 sec

17.846

65 sec

SUSE Linux Enterprise Server 15 [5]

1.3

8.041 sec

14.288

61 sec

Risultati per Intel Xeon/Red Hat Enterprise Linux di quinta generazione

 

24,5%

24,9%

-6,6%

1536
​ GB di memoria principale).Numero di certificazione n. 2023075

[5] Atos BullSequana SH20 (2 processori / 120 core / 240 thread, Intel Xeon
Processore Platinum 8490H, 1,9 GHz, 80 KB di cache L1 e 2048 KB di cache L2 per core, 112,5 MB L3 cache per processore, 1024 GB di memoria principale). Numero di certificazione n. 2023026

 

Questi risultati dimostrano l'impegno di Red Hat nell'aiutare i partner OEM e gli ISV a fornire soluzioni ad alte prestazioni ai nostri clienti comuni e mostrano lo stretto allineamento tra Red Hat e Dell che, in collaborazione con SAP, ha portato alla creazione di soluzioni certificate da un'unica fonte per SAP HANA. Disponibile sia in configurazioni a server singolo che in configurazioni con scalabilità orizzontale. La soluzione Dell è ottimizzata con Red Hat Enterprise Linux for SAP Solutions.

TPC-H @ SF =10000

Un altro benchmark standard di settore è il quello per il supporto decisionale TPC-H del Transaction Processing Council (TPC).

I risultati mostrano prestazioni ottime per le macchine di classe HPE ProLiant DL380 nel benchmark TPC-H @ SF= 10000, con un miglioramento delle prestazioni del 17,9% in termini di query/ora (QphH) e un aumento di prezzo/prestazioni del 31,4% (prezzo/QphH). I test TPC-H sono stati eseguiti da HPE e utilizzando Microsoft SQLserver 2022 a 64 bit su Intel Xeon SP di quinta generazione con RHEL9.3; sono stati confrontati con i risultati di Intel Xeon SP di quarta generazione con lo stesso SQLserver 2022 su sistemi operativi Microsoft Windows Server 2022 Standard Edition.La combinazione di RHEL9.3 e Intel Xeon SP di quinta generazione aiuta a dimostrare il valore dell'upgrade del server e del sistema operativo a una soluzione che ha ottenuto il primo risultato in termini di prestazioni TPC-H non cluster da 10.000 GB [6]

TPC -H con HPE DB @ 10 TB SF = 10000

       

Sponsor

Sistema

Prestazioni (QphH)

Prezzo/kQphH

Disponibilità del sistema

Data di invio

Nome software DB

Nome del software del sistema operativo

Processore Intel Xeon di quarta generazione

HPE ProLiant DL380 Gen11

2.028.444

821,80 USD

5/1/2023

2/8/2023

Microsoft SQL Server 2022 Enterprise Edition 64 bit

Microsoft Windows Server 2022 Standard Edition

NUOVO processore Intel Xeon di quinta generazione

HPE ProLiant DL380 Gen11

2.391.511

625,77 USD

6/30/2024

1/25/2024

Microsoft SQL Server 2022 Enterprise Edition 64 bit

Red Hat Enterprise Linux Server Release 9.3

Speedup Gen5/Gen4

 

17,9%

31,4%

    

RHEL 9.4 (beta) AI/ML e prestazioni di elaborazione con Intel® AMX

Di seguito esaminiamo il processore Intel Xeon di quinta generazione [7] che offre capacità di AI/ML, a confronto con le prestazioni del precedente processore Intel Xeon di quarta generazione [8], utilizzando alcuni dei benchmark Phoronix Test Suite (PTS) per PyTorch e TensorFlow e le suite di test Neural Magic DeepSparse e Intel® OpenVINO™. Queste quattro suite di benchmark includono più di 100 test secondari. Vedere [9] per riprodurre questi risultati.

Abbiamo anche eseguito benchmark di elaborazione CPU generici come SPEC CPU Base Rate (stimata) e alcuni FFTW bidimensionali nei nostri sistemi di laboratorio per un confronto più congruo sui sistemi beta RHEL 9.4.

(I nostri risultati SPEC CPU Base Rate non sono il prodotto di un'esecuzione ufficiale.Abbiamo utilizzato i file binari Intel con la configurazione ic2024.0.2-lin-sapphirrapids-rate-20231213.cfg)

I risultati riflettono i miglioramenti delle prestazioni così come da configurazione. Nessuno dei benchmark presenta adattamenti o ottimizzazioni specifiche di Intel Xeon SP di quinta generazione oltre a quelli rilevabili automaticamente dal compilatore.I nostri risultati mostrano che i fattori di velocità media di Intel Xeon SP di quinta generazione sono compresi tra 1,07 e 1,22 e che i valori di velocità massima relativi a Intel Xeon SP di quarta generazione sono compresi tra 1,19 e 1,89. 

Graph comparing Average and Max Speedup

Riepilogo

Il team Red Hat Performance Engineering collabora con Intel per garantire le capacità prestazionali di Red Hat Enterprise Linux sui sistemi prima che i fornitori di hardware li distribuiscano in produzione.Questo blog ha esaminato una serie di funzionalità della 5a generazione di Intel, tra cui un numero maggiore di CPU, una memoria DDR5 più veloce, cache di 3° livello più grandi e una larghezza di banda tra i processori migliorata. Tutte queste funzionalità sono supportate nelle versioni di spedizione di RHEL 8.8 e RHEL 9.2.Abbiamo spiegato in che modo gli OEM hanno utilizzato queste funzionalità per ottenere risultati di prim'ordine su SAP [1] benchmark standard di settore e TPC [6]. Abbiamo anche eseguito dei test su RHEL 9.4 beta che hanno mostrato incrementi significativi per i carichi di lavoro della CPU e i benchmark AI/ML confrontando Intel Xeon SP di quinta generazione con Intel Xeon SP di quarta generazione.

La collaborazione tra Intel e Red Hat ci aiuta a espandere le nostre capacità e continueremo a offrire funzionalità innovative nelle versioni future di RHEL, che speriamo continuerà ad essere il sistema operativo a cui clienti e partner si affidano.

Scopri di più


[6] TPC e TPC-H sono marchi commerciali del Transaction Processing Performance Council. Tutti i marchi di terze parti sono di proprietà dei rispettivi proprietari: vedi:https://www.tpc.org/tpch/results.Tutti i confronti e le attestazioni al 15 marzo 2024.Risultati filtrati per 10.000 GB: https://www.tpc.org/tpch/results/tpch_perf_results5.asp?resulttype=nonc…

[7] Configurazione hardware Intel Xeon SP di quinta generazione

Processor:    2 x Intel Xeon Platinum 8592+ @ 3.90GHz (128 Cores / 256 Threads)
Motherboard:  Intel D50DNP1SBB (SE5C7411.86B.9533.D01.2310110651 BIOS)
Memory:       1008 GB @ 5800 MT/s
Architecture:            x86_64
 CPU op-mode(s):        32-bit, 64-bit
 Address sizes:         52 bits physical, 57 bits virtual
 Byte Order:            Little Endian
CPU(s):                  256
 On-line CPU(s) list:   0-255
Vendor ID:               GenuineIntel
 BIOS Vendor ID:        Intel(R) Corporation
 Model name:            INTEL(R) XEON(R) PLATINUM 8592+
   BIOS Model name:     INTEL(R) XEON(R) PLATINUM 8592+
   CPU family:          6
   Model:               207
   Thread(s) per core:  2
   Core(s) per socket:  64
   Socket(s):           2
   Stepping:            2
   CPU(s) scaling MHz:  100%
   CPU max MHz:         3900.0000
   CPU min MHz:         800.0000
   BogoMIPS:            3800.00
Flags:
   fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht
   tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc
   cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm
   pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch
   cpuid_fault epb cat_l3 cat_l2 cdp_l3 cdp_l2 ssbd mba ibrs ibpb stibp ibrs_enhanced tpr_shadow flexpriority ept vpid
   ept_ad fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid cqm rdt_a avx512f avx512dq rdseed adx smap avx512ifma
   clflushopt clwb intel_pt avx512cd sha_ni avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc
   cqm_mbm_total cqm_mbm_local split_lock_detect avx_vnni avx512_bf16 wbnoinvd dtherm ida arat pln pts hwp hwp_act_window
   hwp_epp hwp_pkg_req vnmi avx512vbmi umip pku ospke waitpkg avx512_vbmi2 gfni vaes vpclmulqdq avx512_vnni avx512_bitalg
   tme avx512_vpopcntdq la57 rdpid bus_lock_detect cldemote movdiri movdir64b enqcmd fsrm md_clear serialize tsxldtrk
   pconfig arch_lbr ibt amx_bf16 avx512_fp16 amx_tile amx_int8 flush_l1d arch_capabilities
Virtualization features:
 Virtualization:        VT-x
Caches (sum of all):     
 L1d:                   6 MiB (128 instances)
 L1i:                   4 MiB (128 instances)
 L2:                    256 MiB (128 instances)
 L3:                    640 MiB (2 instances)
NUMA:
 NUMA node(s):          4
 NUMA node0 CPU(s):     0-31,128-159
 NUMA node1 CPU(s):     32-63,160-191
 NUMA node2 CPU(s):     64-95,192-223
 NUMA node3 CPU(s):     96-127,224-255
Vulnerabilities:         
 Gather data sampling:  Not affected
 Itlb multihit:         Not affected
 L1tf:                  Not affected
 Mds:                   Not affected
 Meltdown:              Not affected
 Mmio stale data:       Not affected
 Retbleed:              Not affected
 Spec rstack overflow:  Not affected
 Spec store bypass:     Mitigation; Speculative Store Bypass disabled via prctl
 Spectre v1:            Mitigation; usercopy/swapgs barriers and __user pointer sanitization
 Spectre v2:            Mitigation; Enhanced / Automatic IBRS, IBPB conditional, RSB filling, PBRSB-eIBRS SW sequence
 Srbds:                 Not affected
 Tsx async abort:       Not affected

[8] Configurazione hardware Intel Xeon SP di quarta generazione

Processor:   2 x Intel Xeon Platinum 8480+ @ 3.80GHz (112 Cores / 224 Threads)
Motherboard: Dell 0VRV9X (1.3.2 BIOS)
Memory:      2016 GB @ 4800 MT/s
Architecture:            x86_64
 CPU op-mode(s):        32-bit, 64-bit
 Address sizes:         46 bits physical, 57 bits virtual
 Byte Order:            Little Endian
CPU(s):                  224
 On-line CPU(s) list:   0-223
Vendor ID:               GenuineIntel
 BIOS Vendor ID:        Intel
 Model name:            Intel(R) Xeon(R) Platinum 8480+
   BIOS Model name:     Intel(R) Xeon(R) Platinum 8480+
   CPU family:          6
   Model:               143
   Thread(s) per core:  2
   Core(s) per socket:  56
   Socket(s):           2
   Stepping:            8
   CPU(s) scaling MHz:  98%
   CPU max MHz:         3800.0000
   CPU min MHz:         800.0000
   BogoMIPS:            4000.00
Flags:
   fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht 
   tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc 
   cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm 
   pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch 
   cpuid_fault epb cat_l3 cat_l2 cdp_l3 cdp_l2 ssbd mba ibrs ibpb stibp ibrs_enhanced tpr_shadow flexpriority ept vpid 
   ept_ad fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid cqm rdt_a avx512f avx512dq rdseed adx smap avx512ifma 
   clflushopt clwb intel_pt avx512cd sha_ni avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc 
   cqm_mbm_total cqm_mbm_local split_lock_detect avx_vnni avx512_bf16 wbnoinvd dtherm ida arat pln pts hwp hwp_act_window 
   hwp_epp hwp_pkg_req vnmi avx512vbmi umip pku ospke waitpkg avx512_vbmi2 gfni vaes vpclmulqdq avx512_vnni avx512_bitalg 
   tme avx512_vpopcntdq la57 rdpid bus_lock_detect cldemote movdiri movdir64b enqcmd fsrm md_clear serialize tsxldtrk 
   pconfig arch_lbr ibt amx_bf16 avx512_fp16 amx_tile amx_int8 flush_l1d arch_capabilities
Virtualization features:
 Virtualization:        VT-x
Caches (sum of all):
 L1d:                   5.3 MiB (112 instances)
 L1i:                   3.5 MiB (112 instances)
 L2:                    224 MiB (112 instances)
 L3:                    210 MiB (2 instances)
NUMA:
 NUMA node(s):          2
 NUMA node0 CPU(s):     0,2,4,6,8, . . .
 NUMA node1 CPU(s):     1,3,5,7,9, . . .
Vulnerabilities:
 Gather data sampling:  Not affected
 Itlb multihit:         Not affected
 L1tf:                  Not affected
 Mds:                   Not affected
 Meltdown:              Not affected
 Mmio stale data:       Not affected
 Retbleed:              Not affected
 Spec rstack overflow:  Not affected
 Spec store bypass:     Mitigation; Speculative Store Bypass disabled via prctl
 Spectre v1:            Mitigation; usercopy/swapgs barriers and __user pointer sanitization
 Spectre v2:            Mitigation; Enhanced / Automatic IBRS, IBPB conditional, RSB filling, PBRSB-eIBRS SW sequence
 Srbds:                 Not affected
 Tsx async abort:       Not affected

[9] Utilizzo di Phoronix-Test Suite nei container

Il framework PTS è un metodo estremamente conveniente per eseguire i test delle prestazioni e dispone di un ampio ecosistema con molti risultati registrati disponibili per il confronto. Per informazioni ufficiali, incluse le istruzioni ufficiali che spiegano come eseguire i test PTS, vederePhoronix Test Suite eOpenBenchmarking.org.

Abbiamo eseguito i test relativi all'IA/ML nei container Centos Stream 9 (su host RHEL 9.4 beta) per evitare modifiche accidentali all'ambiente del sistema host e per riportare l'ambiente di test allo stato originale.

Procedura per riprodurre sul sistema i risultati dei test relativi all'IA/ML:

  1. podman run -it --rm --net=host --privileged centos:stream9 /bin/bash
  2. sed -i "/\[crb\]/,+9s/enabled=0/enabled=1/" /etc/yum.repos.d/centos.repo
  3. dnf -y install https://dl.fedoraproject.org/pub/epel/epel-release-latest-9.noarch.rpm
  4. dnf -y install atlas-devel autoconf automake binutils blas blas-devel boost-devel boost-thread bzip2 cmake expat-devel findutils gcc gcc-c++ gcc-gfortran gflags-devel git glog-devel gmock-devel gzip hdf5-devel iputils leveldb-devel libquadmath-devel libusb-devel libusbx-devel lmdb-devel make meson nfs-utils ninja-build openblas-devel opencv opencv-devel openssl-devel patch pciutils php-cli php-json php-xml procps-ng protobuf-compiler protobuf-devel python3 python3-devel python3-pip python3-yaml snappy-devel tar unzip vim-enhanced wget xz zip
  5. At this point you might mount a shared volume with phoronix-test-suite already installed, or you can just download and unpack it in the container with steps like these:
    1. wget https://phoronix-test-suite.com/releases/phoronix-test-suite-10.8.4.tar.gz
    2. tar xvzf phoronix-test-suite-10.8.4.tar.gz
    3. cd phoronix-test-suite
  6. ./phoronix-test-suite  install      deepsparse openvino pytorch tensorflow
  7. ./phoronix-test-suite  benchmark    deepsparse openvino pytorch tensorflow

Sugli autori

Michey is a member of the Red Hat Performance Engineering team, and works on bare metal/virtualization performance and machine learning performance.. His areas of expertise include storage performance, Linux kernel performance, and performance tooling.

Read full bio
UI_Icon-Red_Hat-Close-A-Black-RGB

Ricerca per canale

automation icon

Automazione

Novità sull'automazione IT di tecnologie, team e ambienti

AI icon

Intelligenza artificiale

Aggiornamenti sulle piattaforme che consentono alle aziende di eseguire carichi di lavoro IA ovunque

open hybrid cloud icon

Hybrid cloud open source

Scopri come affrontare il futuro in modo più agile grazie al cloud ibrido

security icon

Sicurezza

Le ultime novità sulle nostre soluzioni per ridurre i rischi nelle tecnologie e negli ambienti

edge icon

Edge computing

Aggiornamenti sulle piattaforme che semplificano l'operatività edge

Infrastructure icon

Infrastruttura

Le ultime novità sulla piattaforma Linux aziendale leader a livello mondiale

application development icon

Applicazioni

Approfondimenti sulle nostre soluzioni alle sfide applicative più difficili

Original series icon

Serie originali

Raccontiamo le interessanti storie di leader e creatori di tecnologie pensate per le aziende