Jump to content
X-System

[benchmark] Tableau de la performance des CPU en FLOPS

Publications recommandées

Bonjour à tous :mike:

 

quand vous essayez de pousser la performance de votre processeur en augmentant la fréquence mais que savez-vous le résultat de la performance de votre processeur après avoir augmenté la fréquence par rapport la fréquence d'origine ? Gros gain ou petit gain de la performance ?

 

On peut connaître sa performance en FLOPS comme des techniciens testent la performance de ses supercalculateurs avec High Performance LINPACK.

 

Alors pour tester la performance de vos ordinateurs grand public, j'ai trouvé un site qui a un compilation pour chaque type du processeur avec des instructions très récents (AVX et FMA) : https://github.com/Mysticial/Flops

Des compilations se trouvent dans le dossier "version3/binaries_windows". Et ça existe aussi pour Linux.

 

Pour donner vos résultats, ne prends que des résultats double précision 256 bits multithread.

Sauf si vous avez seulement des résultats double précision 128 bits et aucun 256 bits (c'est le cas pour des vieux CPU qui ne supportent pas 256 bits), alors vous pouvez prendre des résultats 128 bits (il faut le préciser pour que je puisse mentionner "128 bits" dans le tableau des résultats)

Et pour eux qui veulent tester sur son vieux PC (avant Pentium 4 / Athlon XP) sous Win95/98, voici le vieux utilitaire à télécharger : http://xsaragtr.free.fr/CPUBENCH.exe (avant lancer le test, il faut aller dans l'option et décocher tout sauf MFLOPS)

 

Tableau des résultats

------------------------------

 

X-System

Intel Xeon E5-2630L v3 # 16c/32t

AVX Add/Sub = 135 GFLOPS

AVX Multiply = 261,07 GFLOPS

AVX Multiply + Add = 268,99 GFLOPS

FMA3 Fused Multiply Add = 541,15 GFLOPS

 

Intel Xeon E5-1607 v3 # 4c/4t

AVX Add/Sub = 49,34 GFLOPS

AVX Multiply = 83,33 GFLOPS

AVX Multiply + Add = 98,59 GFLOPS

FMA3 Fused Multiply Add = 197,95 GFLOPS

 

Intel Core i3-6100T # 2c/4t

AVX Add/Sub = 44,38 GFLOPS

AVX Multiply = 50,35 GFLOPS

AVX Multiply + Add = 47,14 GFLOPS

FMA3 Fused Multiply Add = 101,38 GFLOPS

 

2x Intel Xeon X5355 # 8c/8t

128 bits SSE2 Add/Sub = 42,22 GFLOPS

128 bits SSE2 Multiply = 41,3 GFLOPS

128 bits SSE2 Multiply + Add = 84,84 GFLOPS

 

Intel Core 2 Duo T9500 # 2c/2t

128 bits SSE2 Add/Sub = 10,22 GFLOPS

128 bits SSE2 Multiply = 10,08 GFLOPS

128 bits SSE2 Multiply + Add = 20,4 GFLOPS

 

Intel Celeron N3150 # 4c/4t

128 bits SSE2 Add/Sub = 8,72 GFLOPS

128 bits SSE2 Multiply = 4,18 GFLOPS

128 bits SSE2 Multiply + Add = 8,26 GFLOPS

 

Intel Pentium III Engineering Sample @ 575 MHz (115 MHz bus et coef 5x) # 1c/1t

testé avec CPUBENCH sous Win98 = 0,115 GFlops

 

Intel Pentium MMX 150 MHz # 1c/1t

testé avec CPUBENCH sous Win98 = 0,0366 GFlops

 

Intel Pentium 120 MHz # 1c/1t

testé avec CPUBENCH sous WinNT4 = 0,01197 GFlops (mode d'économie d'énergie activé)

 

Intel 486DX4-75 # 1c/1t

testé avec Rolled Double Precision Linpack Benchmark - PC Version 'C/C++' sous MS-DOS 6.22 = 0,00308 GFlops

 

IBM 486SLC2-66 # 1c/1t

testé avec Rolled Double Precision Linpack Benchmark - PC Version 'C/C++' sous MS-DOS 6.22 = 0,00001 GFlops

 

Strimy

AMD Ryzen 7 1700X @ 3.7 GHz # 8c/16t

AVX Add/Sub = 117,76 GFLOPS

AVX Multiply = 118,13 GFLOPS

AVX Multiply + Add = 209,14 GFLOPS

FMA3 Fused Multiply Add = 236,54 GFLOPS

 

-----------------------------------------------

 

J'ai trouvé qu'on peut connaître la puissance du calcul brut en théorie avec la méthode du calcul mais en pratique (calcul avec LINPACK), le résultat net donne souvent inférieur du résultat brut selon la configuration et l'optimisation des réglages de l'ordinateur et le système. Il est préférence de calculer avec le nombre de coeurs physiques et non pas avec le nombre de threads avec SMT parce que le SMT 2 threads pour un coeur physique ne donne pas réellement la double de performance d'un coeur physique ;)

Voici la méthode du calcul : (nombre d'instructions par cycle [simple ou double précision au choix]) * (nombre de coeurs) * (fréquence CPU en GHz) = GFLOPS max brut (théoriquement)

N.B. : simple précision = 32-bit / double précision = 64-bit (encodage)


Liste des CPU :

Intel P5 & P6 (sans ISEs) + Pentium Pro & Pentium II:

    1 double précision instructions par cycle
    1 simple précision instructions par cycle

Intel P6 (Pentium III seulement):

    1 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel NetBurst:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel Pentium M Banias & Dothan:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

Intel Core 2 and Nehalem:

    4 double précision instructions par cycle
    8 simple précision instructions par cycle

Intel Sandy Bridge/Ivy Bridge:

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

Intel Haswell/Broadwell/Skylake/Kaby Lake/Coffee Lake:

    16 double précision instructions par cycle
    32 simple précision instructions par cycle

Intel Xeon Skylake (AVX-512):

    32 double précision instructions par cycle
    64 simple précision instructions par cycle

AMD K5 & K6:

    0,5 double précision instructions par cycle
    0,5 simple précision instructions par cycle

AMD K6-2 & K6-III:

    0,5 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD K7 & K8:

    2 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD K10:

    4 double précision instructions par cycle
    8 simple précision instructions par cycle

AMD Bulldozer/Piledriver/Steamroller/Excavator, par module (2 coeurs):

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

AMD Zen (Ryzen):

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

Intel Atom (Bonnell, Saltwell, Silvermont et Goldmont):

    1,5 double précision instructions par cycle
    6 simple précision instructions par cycle

AMD Bobcat:

    1,5 double précision instructions par cycle
    4 simple précision instructions par cycle

AMD Jaguar:

    3 double précision instructions par cycle
    8 simple précision instructions par cycle

ARM11:

    1 double précision instructions par cycle
    2 simple précision instructions par cycle

ARM Cortex-A7:

    1 double précision instructions par cycle
    2 simple précision instructions par cycle

ARM Cortex-A9:

    1,5 double précision instructions par cycle
    4 simple précision instructions par cycle

ARM Cortex-A15/A32/A35/A53/A57/A72:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

Qualcomm Krait:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

Qualcomm Kryo:

    2 double précision instructions par cycle
    8 simple précision instructions par cycle

IBM PowerPC A2 (Blue Gene/Q), par coeur:

    8 double précision instructions par cycle
    les élements du simple précision sont étendus vers le double précision et sont traités sur les même unités

IBM PowerPC A2 (Blue Gene/Q), par tâche:

    4 double précision instructions par cycle
    les élements du simple précision sont étendus vers le double précision et sont traités sur les même unités

Intel Xeon Phi (Knights Corner), par coeur:

    16 double précision instructions par cycle
    32 simple précision instructions par cycle

Intel Xeon Phi (Knights Corner), par tâche (4 par coeur):

    8 double précision instructions par cycle
    16 simple précision instructions par cycle

Intel Xeon Phi (Knights Landing), par coeur:

    32 double précision instructions par cycle
    64 simple précision instructions par cycle

 

########### Cette liste ci-dessous, des résultats sont obtenus avec l'utilitaire obsolète pour des processeurs récents ###########

 

Alors pour des ordinateurs de bureau, des stations de travail et des serveurs sous Windows, il y a un utilitaire qui est très proche de Linpack. C'est Intel Linpack, son utilitaire se nomme IntelBurnTest.

Ca fonctionne sur des versions 32 bits et 64 bits (recommandé) et ça fonctionne aussi sur des processeurs AMD.

Le téléchargement se trouve sur ce site : http://www.majorgeeks.com/files/details/intelburntest.html (il y a des autres sites qui ont cet utilitaire bien sûr)

 

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

 

A vous de comparer avec vos processeurs pour voir que ça donne le résultat de la performance sur vos processeurs avec leur fréquence augmentée :yoda:

 

Laisser des réglages par défaut sauf sélectionner le nombre de thread ce que votre processeur a sous Windows.

 

Tableau des résultats

------------------------------

 

X-System

 

Intel Xeon E5-1607 v3 stock, 4 threads = 84,92 GFlops pointe (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 57,46 GFlops (custom stress level = 6,5 Go) (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 56,35 GFlops (very high stress level) (64-bit mode)

2x Intel Xeon X5355 stock, 8 threads = 51,5 GFlops pointe (64-bit mode)

Intel Core i3-6100T stock, 4 threads = 43,82 GFlops (64-bit mode)

2x Intel Xeon 5150 stock, 4 threrds = 34 GFlops pointe (64-bit mode)

Intel Pentium G2130 stock, 2 threads = 22,6 GFlops (64-bit mode)

Intel Core i3-3220T stock, 2 threads = 19,54 GFlops (32-bit mode)

Intel Core i3-3220T stock, 4 threads = 18,66 GFlops (32-bit mode)

Intel Core 2 Duo T9500 stock, 2 threads = 11,71 GFlops (64-bit mode)

2x Intel Xeon Irwindale LV 3 GHz stock, 4 threads = 8,55 GFlops (64-bit mode)

Intel Celeron N3150 stock, 4 threads = 7,54 GFlops (64-bit mode)

2x Intel Xeon Irwindale LV 3 GHz stock, 4 threads = 7,3 GFlops (32-bit mode)

AMD Athlon X2 4450B stock, 2 threads = 6,15 GFlops pointe (32-bit mode)

Intel Atom 330 stock, 4 threads = 1,07 GFlops pointe (32-bit mode)

 

Un membre d'un autre forum

 

2x Intel Xeon E5450 stock, 8 threads = 71,3 GFlops pointe (64-bit mode)

 

Charp@BHMag

 

Intel Core i7-3770K @ 3.9 GHz, 8 threads = 97,94 GFlops (64-bit mode)

Intel Core i7-2700K @ 3.9 GHz, 8 threads = 85,99 GFlops (64-bit mode)

 

chaps

 

Intel Core i7-950 stock, 8 threads = 37,5 GFlops (64-bit mode)

 

metro557

 

Intel Core i5-2500K @ 4.3 GHz, 4 threads = 97,77 GFlops (64-bit mode)

 

Kori

 

Intel Core i7-4770K @ 4.1 GHz, 8 threads = 102,91 GFlops (l'économie d'énergie étant active) (64-bit mode)

 

SiskoKorobase

 

Intel Core i7-3770K @ 4.6 GHz, 4 threads = 116 GFlops (120,45 GFlops pointe) (64-bit mode)

Intel Core i7-3770K @ 4.4 GHz, 4 threads = 115,82 GFlops (64-bit mode)

Intel Core i7-3770K @ 4.6 GHz, 8 threads = 103,73 GFlops pointe (64-bit mode)

Intel Core i7-3770K @ 4.4 GHz, 8 threads = 96,4 GFlops (64-bit mode)

 

John Shaft

 

Intel Core i7-2600K @ 4.10GHz, 8 threads = 89,1 GFlops (64-bit mode)

 

Aloyse57

 

Intel Core i7-3770K @ 4.4 GHz, 8 threads = 93,6 GFlops (64-bit mode)

 

El_muncho

 

AMD A10-6800K stock, 4 threads = 16,07 GFlops (64-bit mode)

 

UltrA

 

Intel Core i7-3930K @ 4.5 GHz, 8 threads exécutés sur 12 = 150,77 GFlops (64-bit mode)

Intel Core i7-3930K @ 4.5 GHz, 12 threads = 134,64 GFlops (64-bit mode)

 

-hardcorgamer-

 

Intel Core i5-2500K @ 4.3 GHz, 4 threads = 111,5 GFlops (64-bit mode)

 

Goghvan

 

Intel Core i5-3350P stock, 4 threads = 80,9 GFlops (81,49 GFlops pointe) (64-bit mode)

 

nikon56

 

Intel Core i7-2600K @ 4.2 GHz, 4 threads exécutés sur 8 = 113,5 GFlops (very high stress level) (64-bit mode)

Intel Core i7-2600K @ 4.2 GHz, 4 threads exécutés sur 8 = 95,1 GFlops (64-bit mode)

Intel Core i7-2600K @ 4.2 GHz, 8 threads = 82,5 GFlops (64-bit mode)

 

picoteras

 

Intel Core i7-5960X Extreme Edition @ 4 GHz, 8 threads (SMT désactivé) = 213,18 GFlops (64-bit mode)

Intel Core i7-5960X Extreme Edition @ 4 GHz, 16 threads (SMT activé) = 130,52 GFlops (64-bit mode)

 

Strimy

 

Intel Core i5-6500 stock, 4 threads = 91,26 GFlops (64-bit mode)

AMD Ryzen 7 1700X @ 3.7 GHz, 16 threads = 75,79 GFlops (64-bit mode)

 

N3cR0n0M1c0N

Intel Core i7-950 @ 4.12 GHz, 4 threads (SMT désactivé) = 57,85 GFlops (64-bit mode)

 

Les résultats de la performance des vieux processeurs en MFlops, exécutés par des autres personnes dans le monde : http://home.iae.nl/users/mhx/flops_4.tbl

Modifié par X-System

Partager cette publication


Link to post
Share on other sites

Intel Core-i7 950 @stock, HT activé et 8 Threads : 38.84 GFlops :chinois:

Partager cette publication


Link to post
Share on other sites

Core i7 2600K@4.1 Ghz avec HT : entre 58 et 59 Gflops selon les itérations du test.

Par contre

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

Là par contre, j'ai un doute. Il me semble que le TFlop n'a été atteint pour la première fois qu'en 1997 pour une puissance max aux alentours de 1.3 TFlops.

Partager cette publication


Link to post
Share on other sites

Le supercalculateur le plus rapide du monde en 1996 était le supercalculateur chez la NASA avec ses 9500 CPU Intel Pentium Pro à 200 MHz qui calculait 1,5 TéraFlops ^^

Là par contre, j'ai un doute. Il me semble que le TFlop n'a été atteint pour la première fois qu'en 1997 pour une puissance max aux alentours de 1.3 TFlops.

Je l'ai lu sur le livre du Guiness des records 1996 :-)

J'ai toujours ce livre (il doit être dans un carton de démenagement), je peux faire une capture APN si tu veux le lire :-)

Modifié par X-System

Partager cette publication


Link to post
Share on other sites

Vaut mieux se baser sur le Top500 ;)

:chinois:

Bizarre des chiffres pour le nombre de coeur. En plus, c'était en 1996 et non 1997.

Voici j'ai trouvé un article qui parle des parties du premier supercalculateur Pentium Pro qui dépasse le TéraFlops : http://news.bbc.co.uk/2/hi/technology/6354225.stm

Partager cette publication


Link to post
Share on other sites

Je voudrais savoir un détail. Sur des Core i5 et i7, pour obtenir MaxTurbo, c'est quand le processeur est 100% load ?

Je n'ai jamais eu des Core i5 et i7. Mon Core i3-3220T n'a pas MaxTurbo donc je ne peux pas le savoir :transpi:

C'est pour comparer avec Core i7-2600k @ 4.1 GHz mesuré par John Shaft :-)

Surtout quand Core i5 n'a pas de HT par rapport à Core i7.

Modifié par X-System

Partager cette publication


Link to post
Share on other sites

La fréquence turbo sur les i5 et i7 dépend du nombre de cores utilisés.

Partager cette publication


Link to post
Share on other sites

La fréquence turbo sur les i5 et i7 dépend du nombre de cores utilisés.

Alors quand un programme utilise tous les coeurs à fond, la fréquence Turbo ne sera pas activée, c'est ça ?

Partager cette publication


Link to post
Share on other sites

Le turbo est désactivé chez moi quoiqu'il arrive : toujours à 4.1 GHz :)

Il me semble qu'on ne peut pas OC et laisser le turbo activé. A vérifier, ça fait plus d'un 1 an et demi que j'ai pas touché à ce genre de réglages

(Mais sinon oui, l'idée du Turbo, c'est de filer plus de patate à un ou deux coeur si le reste n'est pas utilisé mais de rester à la fréquence "stock" si tout les coeurs le sont. Typiquement avec le Turbo, le 2600K peut monter à 3.9 Ghz sans OC mais sur un seul coeur. Si les 4 coeurs sont sollicités, la fréquence restera à 3.4 Ghz)

Bizarre des chiffres pour le nombre de coeur. En plus, c'était en 1996 et non 1997.

Voici j'ai trouvé un article qui parle des parties du premier supercalculateur Pentium Pro qui dépasse le TéraFlops : http://news.bbc.co.uk/2/hi/technology/6354225.stm

Le Top500 ne compile les résultats que tous les 6 mois. Le ASCI Red est "sorti" fin 1996, à priori trop tard pour se faire bencher comme il se doit en 11/96. Ceci explique sans doute cela ;)

Partager cette publication


Link to post
Share on other sites

Core 2 Duo T9500 stock = 16,5 GFlops

J'ai remarqué une chose. J'ai essayé de laisser de tester pour afficher plusieurs résultats dans la liste.

La performance en GFlops a baissé (environ -0,4 GFlops) à chaque résultat suivant quand le processeur chauffe de plus en plus.

Quand j'ai arrêté le test et j'ai laissé le processeur en repos pour refroidir.

Quand la température du processeur en repos est revenu normale. Là, le résultat de la performance est comme le début du test et ça rabaisse encore quand le processeur chauffe de plus en plus.

Ca se voit bien que la performance du processeur dégrade quand le processeur devient trop chaud :D

Partager cette publication


Link to post
Share on other sites

Ah, dans mon cas, la fluctuation est aléatoire (mon meilleur résultat était le 2 ou 3ème...).

Bon faut dire que je refroidis bien la bête aussi

Partager cette publication


Link to post
Share on other sites

Ah, dans mon cas, la fluctuation est aléatoire (mon meilleur résultat était le 2 ou 3ème...).

Bon faut dire que je refroidis bien la bête aussi

Mon Core 2 Duo T9500 est dans mon Lenovo ThinkPad T61p, ça chauffe bien quand le processeur est à fond :transpi:

Partager cette publication


Link to post
Share on other sites

Ahah, j'avais pas fais gaffe au "T" :)

Tiens, est-ce qu'il existe un bench gratuit pour mesurer la puissance d'un proc sur le calcul entier ? J'ai bien trouvé SPECint, mais bon c'est plusieurs centaines de $ la licence :roll:

Parce que c'est bien beau de comparer la taille de la sienne en GFLOPS, mais en MIPS ça serait pas mal aussi :D

Partager cette publication


Link to post
Share on other sites

Ahah, j'avais pas fais gaffe au "T" :)

Tiens, est-ce qu'il existe un bench gratuit pour mesurer la puissance d'un proc sur le calcul entier ? J'ai bien trouvé SPECint, mais bon c'est plusieurs centaines de $ la licence :roll:

Parce que c'est bien beau de comparer la taille de la sienne en GFLOPS, mais en MIPS ça serait pas mal aussi :D

7-Zip possède le benchmark en MIPS multithread.

J'ai trouvé un vieux article intéressant sur MFlops, MIPS et SPEC : http://www.sgidepot.co.uk/perf.html

:-)

Partager cette publication


Link to post
Share on other sites

Pour ma part :

i7 2600K : mini : 48.9055GFlops et maxi 50.6237

essayé en standard de base, 5 times.

prochaine réponse en maxi.

Partager cette publication


Link to post
Share on other sites

L'idéal serait de calculer la puissance de calcul totale d'un pc, cpu et gpu compris.

Mis à part Boinc, je ne connais rien qui le fasse. Et en parlant de ça, la team Boinc Osef a fait des tests et mit en évidence une puissance de calcul accrue sous Linux vs Windows.

Partager cette publication


Link to post
Share on other sites

2x Xeon 5150 sous Windows 64 bits = 34 GFlops

Je viens mettre à niveau des processeurs : 2x Intel Xeon X5355. Toujours la même fréquence mais le passage de 4 coeurs à 8 coeurs.

J'ai obtenu 49,5 GFlops.

EDIT : Je viens tester SiSoftware Sandra Lite 2011. J'ai obtenu 64 GFlops. Je pense qu'il y a un problème de calcul pour 8 coeurs sur IntelBurn Test. Ou alors, SiSoftware Sandra Lite 2011 ne calcule pas comme IntelBurn Test...

Modifié par X-System

Partager cette publication


Link to post
Share on other sites

i7 2700K à 3.9Ghz fait 55.81 Gflops pour ma part.

Par contre j'ai remarqué qu'il n'utilisait que 50% des 8 cœurs physiques + logiques en mode auto, quand par contre je mets en mode 8 threads les 8 cœurs sont bien utilisés à 100% mais le Gflops descends à 47.

Partager cette publication


Link to post
Share on other sites

Je viens relancer IntelBurn Test. J'ai obtenu 51,5 GFlops (toujours 8 coeurs 100% utilisés)

Partager cette publication


Link to post
Share on other sites

58,683 pour ma part avec un I7 3770K.....ça me semble faible par rapport au I7 2700K de Charp@BHMag......bon après j'ai pleins de truc qui tournent derrière (y compris l'anti-virus) donc ça doit jouer je pense.

Partager cette publication


Link to post
Share on other sites

J'avais l'antivirus aussi mais je suis à 3.9 Ghz c'est surement ca qui joue.

Le tiens est o/c ? Dans ta signature il y a 4.8 Ghz

Partager cette publication


Link to post
Share on other sites

Oui 4,8Ghz car le 5ghz ne sont pas stable en idle.....du coup je suis très surpris d'avoir ce type de score......ou alors c'est que le logiciel gère pas ?

Partager cette publication


Link to post
Share on other sites

Veuillez vous connecter pour commenter

Vous serez en mesure de laisser un commentaire après vous être connecté



Se connecter dès maintenant

×