Jump to content

[benchmark] Tableau de la performance des CPU en FLOPS


Recommended Posts

J'ai lancé en remote depuis TeamViewer, j'obtiens ça :
Double-Precision - 256-bit AVX - Add/Sub
    GFlops = 117.76

Double-Precision - 256-bit AVX - Multiply
    GFlops = 118.128

Double-Precision - 256-bit AVX - Multiply + Add
    GFlops = 209.136

Double-Precision - 256-bit FMA3 - Fused Multiply Add
    GFlops = 236.544

Pas la possibilité de tester sans le SMT actuellement.

Link to post
Share on other sites
  • Replies 165
  • Created
  • Last Reply

Top Posters In This Topic

Top Posters In This Topic

Popular Posts

Nan mais ça je sais bien, mais il est tellement simple de bidonner les résultats d'un benchmark rien qu'en changeant les paramètres du compilo (ou même en changeant de compilo) pour optimiser certaine

Je viens ajouter le nouveau résultat de ma nouvelle configuration montée aujourd'hui (2x Xeon E5-2630L v3 sur la carte mère Gigabyte MW70-3S0) : 541,15 GFLOPS 😄 (et 1,08 TeraFLOPS en simple précision

On peut voir la différence par rapport IntelBurnTest. Je crois que la compilation LINPACK d'IntelBurnTest est vieille.

J'ai testé IntelBurnTest sur mon PC boulot, j'ai obtenu 84,92 GFLOPS...

Là, avec la compilation faite par Mysticial, je pense que c'est plus sûr pour connaître la performance réelle sur des CPU récents par rapport IntelBurnTest (obsolète) :D

Il faut que j'ajoute une nouvelle liste des résultats avec ces compilations. Je vais mettre à jour ce topic.

Link to post
Share on other sites

Ca y est, j'ai mis à jour mon topic :D

Si des autres membres qui ont testé avec IntelBurnTest peuvent refaire son test (s'ils ont toujours leurs CPU sinon tester avec leurs nouveaux CPU) avec une de ces compilations pour mettre à jour dans la nouvelle liste des résultats :12_slight_smile:

Link to post
Share on other sites

Je viens ajouter mes autres résultats : Core i3-6100T, Xeon X5355, Core 2 Duo T9500 et Celeron N3150 (là, c'est un vrai veau :transpi: )

Je vois que des résultats donnés avec les compilations de Mysticial correspondent très proche du calcul de la puissance théorique (DP IPC) * (nCore) * (GHz) = GFLOPS max

Edited by X-System
Link to post
Share on other sites

Je viens ajouter le nouveau résultat de ma nouvelle configuration montée aujourd'hui (2x Xeon E5-2630L v3 sur la carte mère Gigabyte MW70-3S0) : 541,15 GFLOPS 😄 (et 1,08 TeraFLOPS en simple précision 256 bits AVX). Sa performance équivaut la carte graphique GeForce GTX 750 😄

  • Like 1
Link to post
Share on other sites

Je viens ajouter Core i7-7700 dans le tableau (il a remplacé mon ancien Core i3-6100T).

Pour des autres membres, si vous ne voulez pas taper des lettres et des chiffres pour poster ici. Vous pouvez faire un screenshot sur la partie des résultats 256-bit en multi-thread. Je m'occupe de copier vos chiffres du résultat à mettre dans le tableau. Et n'oublie pas de mentionner le modèle du processeur et sa fréquence si c'est overclocking 😉

Link to post
Share on other sites

:chisal:

 

J'ai modifié mon message initial. J'ai viré des autres résultats pour ne garder que les résultats plus rapides en double précision (128 ou 256 bits selon les CPU). Donc on ne copie plus tous les résultats du test, on copie seulement le résultat en double précision le plus rapide. Ca permet faciliter aux INpactiens de donner leurs résultats 🙂 

Et aussi, j'ai ajouté un autre lien à télécharger, il s'agit un benchmark LINPACK pour des vieux ordinateurs qui tournent sous MS-DOS 🙂 

Link to post
Share on other sites

Bonjour,

 

J'ai lancé par curiosité sur mon Ryzen 3400GE (4C/8T 3.3GHz base, 3.7GHz pendant le bench-35W):

  • Double-Precision - 256-bit FMA3 - Fused Multiply Add
        GFlops = 119.808
        Result = 7.59995e+06
Link to post
Share on other sites
Posted (edited)

8700K @ 5.1GHz

Double-Precision - 256-bit FMA3 - Fused Multiply Add
    GFlops = 485.76
    Result = 3.09183e+07

Edited by ashlol
Link to post
Share on other sites
Posted (edited)

Peut-être que c'est normal, mais tu fais 1 distinction entre Core2 et Sandy Bridge.

Mais pour la plateforme Nehalem, rien :transpi: pourtant ce sont les premiers i3 - i5 - i7, entre Core2 et Sandy Bridge

Parce que moi j'ai 1 Xeon L5520, et j'ai le même résultat que @chaps et son i7 950 (37 quelque chose) ... mais à 60W :mrgreen:

 

Donc, voila pour faire mon chieur :transpi:, même si Sandy Bridge c'est l'arrivée de l'AVX qui est la grosse révolution/ la grosse claque.

Autre chose que Nehalem et les prémices de ce qu'on a aujourd'hui (HT, QPI, turbo boost, SSE 4.2, suppression du pont nord ("North Bridge"), ... en plus de la nomenclature i3 - i5 - i7)

Edited by foetus
Link to post
Share on other sites
On 03/06/2020 at 21:59, foetus a écrit :

Peut-être que c'est normal, mais tu fais 1 distinction entre Core2 et Sandy Bridge.

Mais pour la plateforme Nehalem, rien :transpi: pourtant ce sont les premiers i3 - i5 - i7, entre Core2 et Sandy Bridge

Parce que moi j'ai 1 Xeon L5520, et j'ai le même résultat que @chaps et son i7 950 (37 quelque chose) ... mais à 60W :mrgreen:

 

Donc, voila pour faire mon chieur :transpi:, même si Sandy Bridge c'est l'arrivée de l'AVX qui est la grosse révolution/ la grosse claque.

Autre chose que Nehalem et les prémices de ce qu'on a aujourd'hui (HT, QPI, turbo boost, SSE 4.2, suppression du pont nord ("North Bridge"), ... en plus de la nomenclature i3 - i5 - i7)

Regarde la liste des chiffres de cycle du calcul pour chaque architecture (juste en dessous du tableau des résultats). Tu verras que Core 2 et Nehalem ont les mêmes cycles du calcul :

4 double précision instructions par cycle
8 simple précision instructions par cycle

Avec l'architecture de Sandy Bridge, c'est la double puissance du calcul du Core 2 / Nehalem à la même fréquence.

8 double précision instructions par cycle
16 simple précision instructions par cycle

Pareil pour Haswell, c'est la double puissance du calcul du Sandy Bridge et la quadruple puissance du calcul du Core 2 / Nehalem 🙂

Après Haswell, ça n'a rien changé à part des Core i7 Extreme / i9 Extreme (à partir de 7800X) avec leur AVX-512 🙂 (Des modèles précédents de 7800X n'ont pas AVX-512)

Rien à voir avec QPI, Turbo boost, suppression du pont nord, etc... Ce sont juste le calcul brut avec le nombre de précision par cycle par coeur.

Pour HyperThreading, ça n'a jamais été la double performance. C'est souvent entre 5% et 10% plus performant que sans HT (j'ai vérifié sur mes CPU Core i7 et Xeon E5 v3 avec HT activé / HT désactivé) 🙂 

Par contre, avec AVX-512, on n'atteint pas la fréquence maxi en turbo mode ce que tu vois sur le fiche technique simplifié (qui est pour AVX), la même chose pour la fréquence de base. Leurs fréquences sont "dégonflées". Pareil avec AVX-2.

Je n'ai pas trouvé le fiche des spécifications du 2e volume pour Core i7 / Core i9 Extreme mais j'ai trouvé pour Xeon Scalable 2e Gen qui utilise aussi AVX-512. Voici le fichier PDF (regarde les pages 11-13 pour AVX / AVX-2 / AVX-512) : https://www.intel.com/content/dam/www/public/us/en/documents/specification-updates/2nd-gen-xeon-scalable-spec-update.pdf

Mais pour l'instant, il n'y a pas du jeu vidéo qui gère AVX-512 😅 (afin je crois... DirectX 12 supporte AVX). AVX-512 est plutôt adapté pour des logiciels de calcul, 3D, etc... à la condition de pouvoir gérer AVX-512.

Au fait, après avoir fait quelques recherches, j'ai aperçu que 3DMark gère AVX-512 dans l'option CPU Test 😲

https://benchmarks.ul.com/downloads/3dmark-technical-guide.pdf (page 53)

Link to post
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now

×
×
  • Create New...