Aller au contenu

[benchmark] Tableau de la performance des CPU en FLOPS


X-System

Messages recommandés

Bonjour à tous :mike:

 

quand vous essayez de pousser la performance de votre processeur en augmentant la fréquence mais que savez-vous le résultat de la performance de votre processeur après avoir augmenté la fréquence par rapport la fréquence d'origine ? Gros gain ou petit gain de la performance ?

 

On peut connaître sa performance en FLOPS comme des techniciens testent la performance de ses supercalculateurs avec High Performance LINPACK.

 

Alors pour tester la performance de vos ordinateurs grand public, j'ai trouvé un site qui a un compilation pour chaque type du processeur avec des instructions très récents (AVX et FMA) : https://github.com/Mysticial/Flops

Des compilations se trouvent dans le dossier "version3/binaries_windows". Et ça existe aussi pour Linux.

 

Pour donner votre résultat, ne prends que le résultat double précision 256 bits multithread le plus rapide (plus souvent en FMA3 Fused Multiply Add)

Sauf si vous avez seulement des résultats double précision 128 bits et aucun 256 bits (c'est le cas pour des vieux CPU qui ne supportent pas 256 bits), alors vous pouvez prendre le résultat 128 bits le plus rapide (il faut le préciser pour que je puisse mentionner "128 bits" dans le tableau des résultats et aussi le type de calcul parce que certains processeurs qui calculent plus rapide en Add/Sub que Multiply + Add par exemple)

Et pour eux qui veulent tester sur son vieux PC (avant Pentium 4 / Athlon XP) sous Win95/98, voici le vieux utilitaire à télécharger : http://xsaragtr.free.fr/CPUBENCH.exe (avant lancer le test, il faut aller dans l'option et décocher tout sauf MFLOPS)

Et pour des vieux ordinateurs qui tournent sous MS-DOS, voici le vieux utilitaire à télécharger :  http://xsaragtr.free.fr/LINPCOD.EXE

 

Tableau des résultats

------------------------------

 

X-System

Intel Xeon E5-2667 v3, 16c/32t = 841,73 GFLOPS FMA3 Fused Multiply Add

Intel Xeon E5-2630L v3, 16c/32t = 541,15 GFLOPS FMA3 Fused Multiply Add

Intel Core i7-7700, 4c/8t = 255,26 GFLOPS FMA3 Fused Multiply Add

Intel Xeon E5-1607 v3, 4c/4t = 197,95 GFLOPS FMA3 Fused Multiply Add

Intel Core i3-6100T, 2c/4t = 101,38 GFLOPS FMA3 Fused Multiply Add

2x Intel Xeon X5355, 8c/8t = 84,84 GFLOPS 128 bits SSE2 Multiply + Add

Intel Core 2 Duo T9500, 2c/2t = 20,4 GFLOPS 128 bits SSE2 Multiply + Add

Intel Celeron N3150, 4c/4t = 8,72 GFLOPS 128 bits SSE2 Add/Sub

Intel Pentium III Engineering Sample @ 575 MHz (115 MHz bus et coef 5x) = testé avec CPUBENCH sous Win98 : 0,115 GFlops

Intel Pentium MMX 150 MHz = testé avec CPUBENCH sous Win98 : 0,0366 GFlops

Intel Pentium 120 MHz = testé avec CPUBENCH sous WinNT4 : 0,01197 GFlops (mode d'économie d'énergie activé)

Intel 486DX4-75 = testé avec Rolled Double Precision Linpack Benchmark - PC Version 'C/C++' sous MS-DOS 6.22 : 0,00308 GFlops

IBM 486SLC2-66 = testé avec Rolled Double Precision Linpack Benchmark - PC Version 'C/C++' sous MS-DOS 6.22 : 0,00001 GFlops

 

Strimy

AMD Ryzen 7 1700X @ 3.7 GHz, 8c/16t = 236,54 GFLOPS FMA3 Fused Multiply Add

 

brice.wernet

AMD Ryzen 5 3400GE @ 3.7 GHz, 4c/8t = 119,808 GFLOPS FMA3 Fused Multiply Add

 

ashlol

Intel Core i7-8700K @ 5.1 GHz, 6c/12t = 485,76 GFLOPS FMA3 Fused Multiply Add

 

-----------------------------------------------

 

J'ai trouvé qu'on peut connaître la puissance du calcul brut en théorie avec la méthode du calcul mais en pratique (calcul avec LINPACK), le résultat net donne souvent inférieur du résultat brut selon la configuration et l'optimisation des réglages de l'ordinateur et le système. Il est préférence de calculer avec le nombre de coeurs physiques et non pas avec le nombre de threads avec SMT parce que le SMT 2 threads pour un coeur physique ne donne pas réellement la double de performance d'un coeur physique ;)

Voici la méthode du calcul : (nombre d'instructions par cycle [simple ou double précision au choix]) * (nombre de coeurs) * (fréquence CPU en GHz) = GFLOPS max brut (théoriquement)

N.B. : simple précision = 32-bit / double précision = 64-bit (encodage)


Liste des CPU :

Intel P5 & P6 (sans ISEs) + Pentium Pro & Pentium II:

    1 double précision instructions par cycle
    1 simple précision instructions par cycle

Intel P6 (Pentium III seulement):

    1 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel NetBurst:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel Pentium M Banias & Dothan:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel Core 2 & Nehalem:

    4 double précision instructions par cycle
    8 simple précision instructions par cycle

Intel Sandy Bridge/Ivy Bridge:

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

Intel Haswell / Broadwell / Skylake / Kaby Lake / Amber Lake / Coffee Lake / Whiskey Lake / Comet Lake:

    16 double précision instructions par cycle
    32 simple précision instructions par cycle

Intel Cascade Lake:

    32 double précision instructions par cycle
    64 simple précision instructions par cycle

Intel Xeon Skylake (AVX-512):

    32 double précision instructions par cycle
    64 simple précision instructions par cycle

AMD K5 & K6:

    0,5 double précision instructions par cycle
    0,5 simple précision instructions par cycle

AMD K6-2 & K6-III:

    0,5 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD K7 & K8:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD K10:

    4 double précision instructions par cycle
    8 simple précision instructions par cycle

AMD Bulldozer/Piledriver/Steamroller/Excavator, par module (2 coeurs):

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

AMD Zen/Zen+:

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

AMD Zen 2:

    16 double précision instructions par cycle
    32 simple précision instructions par cycle

Intel Atom (Bonnell, Saltwell, Silvermont et Goldmont):

    1,5 double précision instructions par cycle
    6 simple précision instructions par cycle

AMD Bobcat:

    1,5 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD Jaguar:

    3 double précision instructions par cycle
    8 simple précision instructions par cycle

ARM11:

    1 double précision instructions par cycle
    2 simple précision instructions par cycle

ARM Cortex-A7:

    1 double précision instructions par cycle
    2 simple précision instructions par cycle

ARM Cortex-A9:

    1,5 double précision instructions par cycle
    4 simple précision instructions par cycle

ARM Cortex-A15/A32/A35/A53:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

Qualcomm Krait:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

Qualcomm Kryo:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

IBM PowerPC A2 (Blue Gene/Q), par coeur:

    8 double précision instructions par cycle
    les élements du simple précision sont étendus vers le double précision et sont traités sur les même unités

IBM PowerPC A2 (Blue Gene/Q), par tâche:

    4 double précision instructions par cycle
    les élements du simple précision sont étendus vers le double précision et sont traités sur les même unités

Intel Xeon Phi (Knights Corner), par coeur:

    16 double précision instructions par cycle
    32 simple précision instructions par cycle

Intel Xeon Phi (Knights Corner), par tâche (4 par coeur):

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

Intel Xeon Phi (Knights Landing), par coeur:

    32 double précision instructions par cycle
    64 simple précision instructions par cycle

Intel Itanium & Itanium 2 (IA-64):

    4 double précision instructions par cycle
    8 simple précision instructions par cycle

 

########### Cette liste ci-dessous, des résultats sont obtenus avec l'utilitaire obsolète pour des processeurs récents ###########

 

Alors pour des ordinateurs de bureau, des stations de travail et des serveurs sous Windows, il y a un utilitaire qui est très proche de Linpack. C'est Intel Linpack, son utilitaire se nomme IntelBurnTest.

Ca fonctionne sur des versions 32 bits et 64 bits (recommandé) et ça fonctionne aussi sur des processeurs AMD.

Le téléchargement se trouve sur ce site : http://www.majorgeeks.com/files/details/intelburntest.html (il y a des autres sites qui ont cet utilitaire bien sûr)

 

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

 

A vous de comparer avec vos processeurs pour voir que ça donne le résultat de la performance sur vos processeurs avec leur fréquence augmentée :yoda:

 

Laisser des réglages par défaut sauf sélectionner le nombre de thread ce que votre processeur a sous Windows.

 

Tableau des résultats

------------------------------

 

X-System

 

Intel Xeon E5-1607 v3 stock, 4 threads = 84,92 GFlops pointe (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 57,46 GFlops (custom stress level = 6,5 Go) (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 56,35 GFlops (very high stress level) (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 51,5 GFlops pointe (64-bit mode)

Intel Core i3-6100T stock, 4 threads = 43,82 GFlops (64-bit mode)

2x Intel Xeon 5150 stock, 4 threrds = 34 GFlops pointe (64-bit mode)

Intel Pentium G2130 stock, 2 threads = 22,6 GFlops (64-bit mode)

Intel Core i3-3220T stock, 2 threads = 19,54 GFlops (32-bit mode)

Intel Core i3-3220T stock, 4 threads = 18,66 GFlops (32-bit mode)

Intel Core 2 Duo T9500 stock, 2 threads = 11,71 GFlops (64-bit mode)

2x Intel Xeon Irwindale LV 3 GHz stock, 4 threads = 8,55 GFlops (64-bit mode)

Intel Celeron N3150 stock, 4 threads = 7,54 GFlops (64-bit mode)

2x Intel Xeon Irwindale LV 3 GHz stock, 4 threads = 7,3 GFlops (32-bit mode)

AMD Athlon X2 4450B stock, 2 threads = 6,15 GFlops pointe (32-bit mode)

Intel Atom 330 stock, 4 threads = 1,07 GFlops pointe (32-bit mode)

 

Un membre d'un autre forum

 

2x Intel Xeon E5450 stock, 8 threads = 71,3 GFlops pointe (64-bit mode)

 

Charp@BHMag

 

Intel Core i7-3770K @ 3.9 GHz, 8 threads = 97,94 GFlops (64-bit mode)

Intel Core i7-2700K @ 3.9 GHz, 8 threads = 85,99 GFlops (64-bit mode)

 

chaps

 

Intel Core i7-950 stock, 8 threads = 37,5 GFlops (64-bit mode)

 

metro557

 

Intel Core i5-2500K @ 4.3 GHz, 4 threads = 97,77 GFlops (64-bit mode)

 

Kori

 

Intel Core i7-4770K @ 4.1 GHz, 8 threads = 102,91 GFlops (l'économie d'énergie étant active) (64-bit mode)

 

SiskoKorobase

 

Intel Core i7-3770K @ 4.6 GHz, 4 threads = 116 GFlops (120,45 GFlops pointe) (64-bit mode)

Intel Core i7-3770K @ 4.4 GHz, 4 threads = 115,82 GFlops (64-bit mode)

Intel Core i7-3770K @ 4.6 GHz, 8 threads = 103,73 GFlops pointe (64-bit mode)

Intel Core i7-3770K @ 4.4 GHz, 8 threads = 96,4 GFlops (64-bit mode)

 

John Shaft

 

Intel Core i7-2600K @ 4.10GHz, 8 threads = 89,1 GFlops (64-bit mode)

 

Aloyse57

 

Intel Core i7-3770K @ 4.4 GHz, 8 threads = 93,6 GFlops (64-bit mode)

 

El_muncho

 

AMD A10-6800K stock, 4 threads = 16,07 GFlops (64-bit mode)

 

UltrA

 

Intel Core i7-3930K @ 4.5 GHz, 8 threads exécutés sur 12 = 150,77 GFlops (64-bit mode)

Intel Core i7-3930K @ 4.5 GHz, 12 threads = 134,64 GFlops (64-bit mode)

 

-hardcorgamer-

 

Intel Core i5-2500K @ 4.3 GHz, 4 threads = 111,5 GFlops (64-bit mode)

 

Goghvan

 

Intel Core i5-3350P stock, 4 threads = 80,9 GFlops (81,49 GFlops pointe) (64-bit mode)

 

nikon56

 

Intel Core i7-2600K @ 4.2 GHz, 4 threads exécutés sur 8 = 113,5 GFlops (very high stress level) (64-bit mode)

Intel Core i7-2600K @ 4.2 GHz, 4 threads exécutés sur 8 = 95,1 GFlops (64-bit mode)

Intel Core i7-2600K @ 4.2 GHz, 8 threads = 82,5 GFlops (64-bit mode)

 

picoteras

 

Intel Core i7-5960X Extreme Edition @ 4 GHz, 8 threads (SMT désactivé) = 213,18 GFlops (64-bit mode)

Intel Core i7-5960X Extreme Edition @ 4 GHz, 16 threads (SMT activé) = 130,52 GFlops (64-bit mode)

 

Strimy

 

Intel Core i5-6500 stock, 4 threads = 91,26 GFlops (64-bit mode)

AMD Ryzen 7 1700X @ 3.7 GHz, 16 threads = 75,79 GFlops (64-bit mode)

 

N3cR0n0M1c0N

Intel Core i7-950 @ 4.12 GHz, 4 threads (SMT désactivé) = 57,85 GFlops (64-bit mode)

 

Les résultats de la performance des vieux processeurs en MFlops, exécutés par des autres personnes dans le monde : http://home.iae.nl/users/mhx/flops_4.tbl

Lien vers le commentaire
Partager sur d’autres sites

  • Réponses 165
  • Créé
  • Dernière réponse

Core i7 2600K@4.1 Ghz avec HT : entre 58 et 59 Gflops selon les itérations du test.

Par contre

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

Là par contre, j'ai un doute. Il me semble que le TFlop n'a été atteint pour la première fois qu'en 1997 pour une puissance max aux alentours de 1.3 TFlops.

Lien vers le commentaire
Partager sur d’autres sites

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

Là par contre, j'ai un doute. Il me semble que le TFlop n'a été atteint pour la première fois qu'en 1997 pour une puissance max aux alentours de 1.3 TFlops.

Je l'ai lu sur le livre du Guiness des records 1996 :-)

J'ai toujours ce livre (il doit être dans un carton de démenagement), je peux faire une capture APN si tu veux le lire :-)

Lien vers le commentaire
Partager sur d’autres sites

Vaut mieux se baser sur le Top500 ;)

:chinois:

Bizarre des chiffres pour le nombre de coeur. En plus, c'était en 1996 et non 1997.

Voici j'ai trouvé un article qui parle des parties du premier supercalculateur Pentium Pro qui dépasse le TéraFlops : http://news.bbc.co.uk/2/hi/technology/6354225.stm

Lien vers le commentaire
Partager sur d’autres sites

Je voudrais savoir un détail. Sur des Core i5 et i7, pour obtenir MaxTurbo, c'est quand le processeur est 100% load ?

Je n'ai jamais eu des Core i5 et i7. Mon Core i3-3220T n'a pas MaxTurbo donc je ne peux pas le savoir :transpi:

C'est pour comparer avec Core i7-2600k @ 4.1 GHz mesuré par John Shaft :-)

Surtout quand Core i5 n'a pas de HT par rapport à Core i7.

Lien vers le commentaire
Partager sur d’autres sites

Le turbo est désactivé chez moi quoiqu'il arrive : toujours à 4.1 GHz :)

Il me semble qu'on ne peut pas OC et laisser le turbo activé. A vérifier, ça fait plus d'un 1 an et demi que j'ai pas touché à ce genre de réglages

(Mais sinon oui, l'idée du Turbo, c'est de filer plus de patate à un ou deux coeur si le reste n'est pas utilisé mais de rester à la fréquence "stock" si tout les coeurs le sont. Typiquement avec le Turbo, le 2600K peut monter à 3.9 Ghz sans OC mais sur un seul coeur. Si les 4 coeurs sont sollicités, la fréquence restera à 3.4 Ghz)

Bizarre des chiffres pour le nombre de coeur. En plus, c'était en 1996 et non 1997.

Voici j'ai trouvé un article qui parle des parties du premier supercalculateur Pentium Pro qui dépasse le TéraFlops : http://news.bbc.co.uk/2/hi/technology/6354225.stm

Le Top500 ne compile les résultats que tous les 6 mois. Le ASCI Red est "sorti" fin 1996, à priori trop tard pour se faire bencher comme il se doit en 11/96. Ceci explique sans doute cela ;)

Lien vers le commentaire
Partager sur d’autres sites

Core 2 Duo T9500 stock = 16,5 GFlops

J'ai remarqué une chose. J'ai essayé de laisser de tester pour afficher plusieurs résultats dans la liste.

La performance en GFlops a baissé (environ -0,4 GFlops) à chaque résultat suivant quand le processeur chauffe de plus en plus.

Quand j'ai arrêté le test et j'ai laissé le processeur en repos pour refroidir.

Quand la température du processeur en repos est revenu normale. Là, le résultat de la performance est comme le début du test et ça rabaisse encore quand le processeur chauffe de plus en plus.

Ca se voit bien que la performance du processeur dégrade quand le processeur devient trop chaud :D

Lien vers le commentaire
Partager sur d’autres sites

Ahah, j'avais pas fais gaffe au "T" :)

Tiens, est-ce qu'il existe un bench gratuit pour mesurer la puissance d'un proc sur le calcul entier ? J'ai bien trouvé SPECint, mais bon c'est plusieurs centaines de $ la licence :roll:

Parce que c'est bien beau de comparer la taille de la sienne en GFLOPS, mais en MIPS ça serait pas mal aussi :D

Lien vers le commentaire
Partager sur d’autres sites

Ahah, j'avais pas fais gaffe au "T" :)

Tiens, est-ce qu'il existe un bench gratuit pour mesurer la puissance d'un proc sur le calcul entier ? J'ai bien trouvé SPECint, mais bon c'est plusieurs centaines de $ la licence :roll:

Parce que c'est bien beau de comparer la taille de la sienne en GFLOPS, mais en MIPS ça serait pas mal aussi :D

7-Zip possède le benchmark en MIPS multithread.

J'ai trouvé un vieux article intéressant sur MFlops, MIPS et SPEC : http://www.sgidepot.co.uk/perf.html

:-)

Lien vers le commentaire
Partager sur d’autres sites

  • 3 semaines après...
  • 3 mois après...

2x Xeon 5150 sous Windows 64 bits = 34 GFlops

Je viens mettre à niveau des processeurs : 2x Intel Xeon X5355. Toujours la même fréquence mais le passage de 4 coeurs à 8 coeurs.

J'ai obtenu 49,5 GFlops.

EDIT : Je viens tester SiSoftware Sandra Lite 2011. J'ai obtenu 64 GFlops. Je pense qu'il y a un problème de calcul pour 8 coeurs sur IntelBurn Test. Ou alors, SiSoftware Sandra Lite 2011 ne calcule pas comme IntelBurn Test...

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.


×
×
  • Créer...