Aller au contenu

[CG] a propos du SLI


Messages recommandés

UltrA...à la base l'AFR de NVidia est copié sur celui d'ATI...les méthode de synchro entre les deux GPU utilisée par NVidia sont plus proches de celles utilisée par ATI dans sa MaXX que des méthodes de 3DFX...sinon, pour le score, non, je n'ai pas oublié de zéro...mais le FSAA de 24x c'est pas mal...cf explication ci-dessous (issue de Onversity)

Full Scene Anti-Aliasing. En français, anti-aliasing d'une scène complète. Comme son nom le suggère, la technique du FSAA est une technique d'anti-aliasing, mais au lieu de ne s'appliquer que sur un objet, elle s'applique sur une scène/image complète. Il existe deux techniques majeures de FSAA :

Multi-sampling

Technique mise au point par la société 3DFX. Elle consiste à générer plusieurs images de la scène, décalées d'un ou deux pixels par rapport à l'image de base. On assemble ensuite ces images pour fabriquer l'image finale.

Over-sampling

Cette technique consiste à générer une image avec une résolution supérieure, puis à la réduire à la taille désirée en utilisant la même technique d'anti-aliasing utiliser par les logiciels graphiques comme Photo-shop, ...

Il existe plusieurs niveaux de qualité de FSAA. En général, on parle de FSAA x 2, ou FSAA x 4. Pour le multi-sampling, le FSAA x 2 consiste à générer deux images pour produire l'image finale et pour le FSAA x 4 quatre images. Pour l'over-sampling, cela consiste à générer une image deux fois plus grande pour le FSAA x 2, et quatre fois plus grande plus le FSAA x 4 (exemple : pour obtenir une image 800x600 en FSAA x 2, il faut générer une image de 1131x848  (800x600x2 = 960 000 et 1131x848 = 959 088, d'ou les approximations que je vais utiliser), et pour du FSAA x 4 une image de 1600x1200).

Le problème général du FSAA est de générer un flou sur des parties de l'image qui contiennent soit de nombreux petits détails, soit du texte. Dans cette situation, le multi-sampling est la meilleure technique.

Source : http://www.onversity.com/cgi-bin/progarti/...lesmots&P=a0202

Donc vu que les cartes ATI utilisent le multisampling...on a :

  - 1280x1024 noFSAA ----> 1 310 720 pixels

  - 1280x1024 FSAA x2 ----> 1280x1024x2 = 2 621 440 pixels

  - 1280x1024 FSAA x4 ----> 1280x1024x4 = 5 242 880 pixels

  - 1280x1024 FSAA x8 ----> 1280x1024x8 = 10 485 760 pixels

  - 1280x1024 FSAA x24 ---> 1280x1024x24 = 31 457 280 pixels

La carte calcule donc 3x plus de pixels qu'en FSAA 8x...et 24x plus que sans FSAA...c'était prévisible, mais bon...puisqu'il faut donner les chiffres donnons les...

--PS1--

Pour une approx des perfs, je serais tenté de donner score d'une 9700Pro (en 1280x1024@noFSAA) x 4 / 24...ce qui est faux, vu qu'un FSAA x2 n'occasionne pas une chute de perfs de 50%...

--PS2--

Tu savais que les Radeon premières du nom supportaient les Pixels Shaders 1.0...mais que cette version n'avait jamais été implémentée par microsoft dans DX suite aux pressions de NVidia...c'est d'ailleurs pour cela que les GF3 et 4 supportent les Pixels Shaders 1.1 et non 1.0...donc no comment sur les techno volée de part et d'autre...ATI est souvent en avance sur NVidia d'un point de vue technologique...mais ce n'est que depuis le R300 qu'ils sont devant en terme de perfs...

Lien vers le commentaire
Partager sur d’autres sites

UltrA...à la base l'AFR de NVidia est copié sur celui d'ATI...les méthode de synchro entre les deux GPU utilisée par NVidia sont plus proches de celles utilisée par ATI dans sa MaXX que des méthodes de 3DFX...

D'accord, pas de fight. :D

Mais j'aimerais bien des infos supplémentaire qui te permerte d'affirmer ceci (sur le quote du dessus).

-----------------------------------------------------------------------------------------

Sinon pour le score....bein c'est pasque je te fait trop confiance. :D

Tu ma dis ça un jour....."lointain"..................

....si tu veux on peu aussi faire ATI (enfin la carte octo Radeon 9700Pro qui est utilisée dans certains similateurs de vols de l'armée US vs n'importe quelle carte fut elle une Realizm 3000...la octo 9700Pro fait 18000 points à 3Dmark 2K3...avec le FSAA 24x et aniso 16x le tout en format IMAX...une petite carte pour petit joueurs en somme... (powered by Charles.w)

18000pts avec AA24X sur 3D2K3....et moi évidament je t'ais cru. :fou:

--------------------------------------------------------------------------------

Sinon le record actuel "valide" est de 28003pts sur 3DM2003 (sans AA ni AF évidament).

Avec cette config:

First Phase-change run on Asus A8N SLI... Oldie 3800+ @ 11 x 279 -> 3080Mhz 1.6v... Cas 2.5, 4, 3, 5... 2 x Asus 6800 Ultra @ 600/1300 SLI... CPU @ -101C, GPU1 @ -52C, GPU2 @ -95C...

28k.JPG

sli1.JPG

....de qui....Shamino bien sur. :transpi:

PS: bonne chance pour tes révisions. :-D

Lien vers le commentaire
Partager sur d’autres sites

Sinon pour le score....bein c'est pasque je te fait trop confiance. :keskidit:

Tu ma dis ça un jour....."lointain"..................

18000pts avec AA24X sur 3D2K3....et moi évidament je t'ais cru. :D

Heu pour le score, UltrA est-tu sûre d'avoir lu le test (ok, faut passer par Google pour traduire le coréen en anglais, mais bon...j'ai pas vraiment mieux (du russe peut-être)) que je t'ai donné...il n'on testé qu'une "petite" version...deux cartes couplées comportant chacune 2 GPU...Et pour le score de la config à 255GPU, je confirme que c'est bien 18000points tout à fond...dans une résolution inaccessible (donc beaucoup plus que le 1280x1024 utilisé dans le test que je t'ai linké) avec des solution normale...donc je ne vois vraiment pas où est le problème...et pour la source du score de 18000 points, il me semble que c'est NVchips qui l'avait donné...

Et pour le record de shamino, il est relativement peu élevé si l'on tient compte du fait qu'il n'a utilisé que la résolution de base de 3DMark...et le tout sans aucun effet supplémentaire activé dans les drivers...une solution à 255GPU dans avec la config de base de 3DMark 2003 devrait, je pense optenir des score supérieur à 50000 points...malheureusement, l'armée américaine n'était pas super chaude pour me laisser bencher completement leur système...et E&S n'a pas voulu m'en preter un (je sais pas pourquoi :transpi:)...

--PS--

Pour le test des 2cartes à 2GPU, c'est ici :

http://www.darkcrow.co.kr/Review/Review_Co...5&contentpage=1

Lien vers le commentaire
Partager sur d’autres sites

Tu veux des sources pour ce que je disait ici...

UltrA...à la base l'AFR de NVidia est copié sur celui d'ATI...les méthode de synchro entre les deux GPU utilisée par NVidia sont plus proches de celles utilisée par ATI dans sa MaXX que des méthodes de 3DFX...

Pour l'AFR sur le SLI, de NVidia...juste une petite citation de l'article de tom's...

NVIDIA a actuellement trois modes SLI différents :

    * Mode compatibilité

    * Rendu d’image alterné (AFR pour « Alternate Frame Rendering »)

    * Rendu d’image partagé (SFR pour « Split Frame Rendering »)

Dans le mode « compatibilité », seule une des deux cartes gère le rendu. Il n’y a aucun gain de vitesse. En mode AFR, une des deux cartes calcule les images paires et l’autre les images impaires. Le travail de rendu est donc simplement réparti entre les deux cartes.

En mode SFR, l’écran est divisé en deux. La carte N°1 calcule la partie haute de l’écran et la carte N°2 la partie inférieure. Grâce à la répartition de charge, le driver se charge dans la mesure du possible d’équilibrer le traitement sur les des deux cartes.

Source : http://www.tomshardware.fr/article3d.php?I...e=775&NumPage=2

J'admet que j'ai été un peu vite en laissant sous tendre que NVidia n'utilisait que l'AFR...mais il faut bien admettre qu'en pratique, dans la majorité des cas, c'est ce qui se passe vraiment, pour faut d'applications non spécialement développées pour utiliser le SFR...qui au passage a été inventé par Metabyte (mais qui s'est finalement révélé être un gros vaporware, bien que des démonstrations aient été effectuées)...

Pour ce qui est de l'AFR, il a bel et bien été inventé par ATI et utilisé sur le Rage Fury MaXX...

L´avantage de faire fonctionner des chips, voir des cartes, en parallèle est simple : tout en se basant sur une technologie éprouvée, on peut atteindre de nouveau niveau de performances qui ne nécessitent pas le design d´un nouveau chip graphique. Jusqu´alors il existait deux techniques permettant de faire ceci. Chez 3dfx, on utilisait le SLI (Scan Line Interleave) pour faire travailler deux Voodoo 2 en même temps. La méthode était assez simple, puisque chacun des deux chips, ou des deux cartes, calculaient une ligne sur deux. Principal problème, la synchronisation n´etait parfois pas des meilleures lors de scènes rapides, d´ou un léger décalage.

Il y a quelques mois, c´est Metabyte qui avait fait parler de lui avec une nouvelle technologie appelée PGC (Parrallel Graphic Configuration). Cette technologie permettait de faire fonctionner deux cartes dotées d´un même chip graphique en parallèle, chacune des cartes calculant a peu près la moitié de l´image (selon la complexité de la scène). A l´époque tout le monde rêvait de TNT 2 Ultra ou de 3dfx Voodoo 3 utilisant cette technologie. Malheureusement il ne s´agissait en fait que d´un gros Vaporware relayé par certains gros sites anglophones. Ainsi, la technologie PGC n´a jamais vu le jour dans un produit vendu au public. Il faut dire que les problèmes de synchronisation était la encore présent, la séparation entre la partie de l´image calculée par une des cartes et l´autre moitié étant la plupart du temps nettement visible.

ATI à donc mis au point sa propre technologie, dénommée Multiple ASIC Technology. Cette fois ci, chacun des chip effectue successivement le rendu d´une image, ce qui permet en théorie d´éviter les problèmes de synchronisation rencontrés avec les technologies SLI & PGC. Chacun des deux chips dispose bien entendu de sa propre mémoire vidéo, qui stockera donc en double les textures.

1_mini.jpg 2_mini.jpg

3_mini.jpg schema_mini.jpg

lag.gif

Source : http://www.hardware.fr/articles/39/page1.html

Source connexe : http://www.hardware.fr/articles/15/page1.html

Que dire de plus si ce n'est que le SFR a été remis au gout du jour par AlienWare, puis par NVidia qui n'a mis que très peu de temps à développer le SLI (à priori moins d'un an), ce qui m'a fait émettre l'hypothèse que NVidia a baclé le travail pour être le premier à proposer ce type de solution sur le marché...tout en sachant très bien qu'ATI (via E&S) et AlienWare disposaient de technologies plus avancées et plus complexes à mettre en oeuvre...mais que ne ferait t'on pas pour faire croire que l'on possède le leaderchip en matière de technologie, ce qui n'est ici clairement pas le cas ...

NB : Le "SLI" ou VideoArray de AlienWare est plus complexe mettre en oeuvre, mais est universel...et l'équilibraque de charge est réalisé via un module externe (donc plus de lattence et moins de bande passante, qui est cruciale vu qu'il y a deux fois plus d'info a faire passer et a répartir)...d'où la différence de perfs entre le SLI et le VideoArray...

Lien vers le commentaire
Partager sur d’autres sites

--> Charles...tu m'avais dis pas de fight. :-D

...OK. :francais:

Pour le "SFR", tu a oublié quelques infos...

Si l’on regarde les solutions précédentes on se rend compte que le problème a toujours été plus ou moins bien esquivé. En ce qui concerne l’Infinite Reality pas de problème : les cartes s’occuppant de la géométrie et de la rastérization étant indépendantes tous les sommets transformés se retrouvent sur le Vertex Bus accessibles par tous les Raster Manager. En ce qui concerne la Voodoo2 c’est encore plus simple : le chipset de 3dfx étant dépourvu d’accélération géométrique la question n’a même pas lieu d’être. Si l’on regarde la Naomi 2 là encore Sega a évité le problème : un seul chip géométrique alimente les deux chips PowerVR. Approche imitée par 3DLabs avec sa Realizm 800. Si le P20 dispose bien de vertex shaders ces derniers se retrouvent tout simplement désactivés sur la Realizm 800, ils sont remplacés par un seul VSU, un chip séparé qui se charge d’effectuer les transformations et d’alimenter les 2 VPU. Ces derniers voient du même coup leur rôle se limiter à la rastérization. Cette solution permet certes à 3DLabs d’augmenter la puissance géométrique (le VSU dispose de deux fois plus d’unités géométriques que le VPU) mais à quel prix ! De plus elle ne peut être appliquée par nVidia qui doit pour sa part composer avec deux cartes dont il ne peut court-circuiter une partie du pipeline pour la faire effectuer par un autre chip.

On a donc longtemps pensé que la puissance géométrique ne serait pas augmentée en SFR : les mêmes calculs étant dupliqués sur chacun des GPU. Toutefois il semble finalement qu’une forme de culling soit appliqué au niveau du driver pour éviter de dupliquer entièrement le traitement de tous les sommets sur chaque GPU. nVidia reconnaît cependant que la technique a ses limites et que la charge ne peut être répartie totalement équitablement entre les GPU. Difficile d’effectuer des prédictions sur l’efficacité de cette méthode tant nVidia préfère rester discret sur le sujet : tout juste sait on qu’elle existe et qu’elle devrait s’affiner progressivement avec les nouvelles versions de drivers. Malgré tout dans les scènes limitées par la géométrie l’AFR se montrera plus efficace que le SFR.

Tout d'abord les Voodoo5 utilisé déja ce rendu (3DFX...c'est Nvidia maintenant...je le rappel). D'ailleur Metabyte a inventer le PGC (la théorie)...pas le SFR. Leur fonctionement est presque identique....il a seulement était rendu applicable par 3DFX. Et le Video Array est trés fortement inspiré du SLI de 3DFX. Autre choses....Nvidia est le premier à avoire un gain aussi intéréssant avec ce type de technologie....qui d'ailleur est beaucoup plus prométeuse que l'AFR. En décripté....Nvidia propose le rendu SFR le plus évolué du moment.

------------------------------------------------------------------------------------------------

Pour l'AFR,

Pour vérifier ce phénomène dans un jeu, j´ai utilisé le Graphic Performance Toolkit de Intel qui permet d´analyser le framerate image par image … voici un graphique représentant le framerate en 1024*768 32 bits entre les images 40 et 100 de la demo001 de Quake III, et ce sur un PIII 600 en VSYNC OFF. Comme vous pouvez le voir, le framerate sur une GeForce DDR (rouge) est assez "stable", contrairement a ce qui se passe avec une Rage Fury MAXX (bleu).
Lorsque l´on joue c´est bien entendu moins flagrant, mais cette sensation d´un affichage plus "saccadée" sur une Fury MAXX est légèrement présente. Solution à ce problème ? Passer en Triple Buffering afin de lisser cet effet.

Cette technologie n'était pas vraiment au point sur le Fury MAXX. Très performant mais légèrement "instable"...car le framrate varié de façon incessante.

graphafr.gif

(bleu = Fury MAXX, rouge = carte 3D simple").

...ce qui produisais un effet de scintillement assez gênant. C'est d'ailleurs sûrement pour cela que cette carte n'a finalement pas très bien marché. :D

D'ailleur énorment de cartes de ce type sont sortie utilisant plus ou moin bien ces technologie (Fury MaXX, Naomi 2, Realizm 800, P20)....même voir trés moyennement pour la plupart.

-------------------------------------------------------------------------------------

Aprés l'énumération de toutes ces technologies.....le point le plus important.

Le AFR et le SFR ne sont qu'un PRINCIPE de fonctionement.

Bein oui...c'est bien beau mais tout ça c'est de la théorie.

Mais l'élément le plus critique reste la sélection de la méthode de rendu d'une scène 3D. Il s'agit ici essentiellement d'une problématique logicielle qui concerne les seuls pilotes graphiques. Ceux-ci doivent en effet, par le biais d'algorithmes, choisir la meilleure option pour qu'en fonction du jeu et de son contenu les deux processeurs graphiques travaillent de concert et disposent chacun d'une charge aussi élevée que possible. Pour cela NVIDIA a développé ses propres algorithmes dont les détails ne sont pas forcément très précis puisqu'ils font l'objet d'un dépôt de brevet.

...et oui. L'efficacité du systéme dépend totalement de la programation employé et des solutions Hardware. :craint: Je doute que le produit basé sur le R300 d'ATI soit trés flexible d'un point de vue applications (comme tout produit industriel d'ailleur....).

Au niveau Hardware, Nvidia a du résoudre les problémes d'interconection des cartes. Le SLI de 3DFX utilisé une bande passante trés réduite.....ce qui n'est pas vraiment le cas sur du PCI-E.

Pour ATI, L'EPX-500 n'a une bande passante que de 9.6 Gpixel/sec. 12 Gpixel/sec pour le simFUSION. Ce qui n'est pas énorme en comparaison aux cartes actuelle (12.8Gpixel/s "théorique" pour un SLI de deux 6800Ultra).

Une grande bande passante engendre d'énorme problémes de propagation des signaux et de perturbations éléctromagnétique. Choses qu'Alienware a eu du mal à faire. Son Video Array posant encore quelques problémes. C'est d'ailleur pour cela qu'il se dévellope si peu!!!!!

Alienware qui, en juin dernier hésitait encore entre le SLI et sa technologie propriétaire Video Array fonctionnant avec toutes les marques de GPU PCI-Express, avait annoncé qu'il laisserait les benchmarks décider. "S'il est prouvé que la technologie SLI de NVIDIA est fin de compte plus rapide que le Video Array nous l'utiliseront dès qu'elle sera disponible commercialement" avait déclaré Frank Azor Vice-président Senior et directeur général d'Alienware.

"Bizarement" Alienware à choisie le SLI de Nvidia et non son Video Array pour faire son Area-51 ALX X2!!!! Sans commentaire........ :D

Pour tirer toute la quintessence d'une architecture matérielle basée sur deux processeurs graphiques, il faut tout d'abord leur offrir un lien de communication exclusif leur permettant d'échanger entre eux des informations sans engorger le reste du système. C'est pour répondre à cette problématique que NVIDIA a doté ses puces GeForce 6 d'un contrôleur MIO propriétaire qui agit comme une voie de communication dont le débit théorique maximal est de 10 Go/s. Cette connexion SLI, opérationnelle uniquement sur les processeurs de même classe et de même niveau, se matérialise sur les cartes graphiques qui en sont pourvues par un petit connecteur doré, baptisé par certains de nos confrères anglophones « Goldfinger ». D'après les informations communiquées par NVIDIA, tout type d'information peut transiter par la liaison MIO qu'il s'agisse de textures ou bien de données.

...évidament, le fonctionnement de ce lien "made in Nvidia" est trés secret. ;)

-------------------------------------------------------------------------------------------

Bon ben voilà....c'est déja plus claire. Il y a tout de même un gouffre entre ces tenchologie (AFR et SFR) et le SLI de Nvidia. Et à la lumiére de toutes ces infos....je comprend mieu pourquoi Humus s'intérresse tant au SLI de Nvidia. ;)

PS: Pour les sources --> Google. :-D

PS2: Moi je trouve le score de Shamino...trés impréssinant....puisqu'il n'a utilisé que des piéces trouvable par n'importe qui dans le commenrce.....et qui ne côute pas 20000$!!!

Lien vers le commentaire
Partager sur d’autres sites

UltrA...à la base l'AFR de NVidia est copié sur celui d'ATI...les méthode de synchro entre les deux GPU utilisée par NVidia sont plus proches de celles utilisée par ATI dans sa MaXX que des méthodes de 3DFX...sinon, pour le score, non, je n'ai pas oublié de zéro...mais le FSAA de 24x c'est pas mal...cf explication ci-dessous (issue de Onversity)

Source : http://www.onversity.com/cgi-bin/progarti/...lesmots&P=a0202

Donc vu que les cartes ATI utilisent le multisampling...on a :

La carte calcule donc 3x plus de pixels qu'en FSAA 8x...et 24x plus que sans FSAA...c'était prévisible, mais bon...puisqu'il faut donner les chiffres donnons les...

--PS1--

Pour une approx des perfs, je serais tenté de donner score d'une 9700Pro (en 1280x1024@noFSAA) x 4 / 24...ce qui est faux, vu qu'un FSAA x2 n'occasionne pas une chute de perfs de 50%...

--PS2--

Tu savais que les Radeon premières du nom supportaient les Pixels Shaders 1.0...mais que cette version n'avait jamais été implémentée par microsoft dans DX suite aux pressions de NVidia...c'est d'ailleurs pour cela que les GF3 et 4 supportent les Pixels Shaders 1.1 et non 1.0...donc no comment sur les techno volée de part et d'autre...ATI est souvent en avance sur NVidia d'un point de vue technologique...mais ce n'est que depuis le R300 qu'ils sont devant en terme de perfs...

Heureusement que les cartes ne calculent pas 2 fois plus de pixels pour du FSAA 2X, sinon les perfs seraient minables... C'était le cas au début du FSAA, mais maintenant ce n'est plus le cas...

Lien vers le commentaire
Partager sur d’autres sites

UltrA --> 3DFX n'utilisait que le Scan Line Interleave...

Et bien justement non. 3DFX a abandonné le Scan Line Interleave (SLI)....ils n'ont gardé que le nom. 3DFX ont utilisé le SFR sur le VSA-100 (Voodoo5 5500 et 6000). .(..et non le Voodoo2 comme je l'est marqué au dessus. :mdr: )

Cette technologie est légérement modifié...c'est en faite un mélange de "SLI " et de "SFR". 3DFX à intégret un systéme de maître-esclave. Le maître définit la répartition exacte des "lignes" des images en fonction de la rapidité de traitement de chaques GPU (ce n'est donc plus un simple découpement en 2 de l'image).

Un des deux chips se charge du rôle de maître, alors que le premier à le rôle de l´esclave. C´est le VSA-100 maître qui va se charger de découper chaque image en bande de plusieurs lignes (de 1 à 128 lignes, la technologie est flexible), et de repartir ces bandes équitablement avec VSA-100. Il va envoyer toutes les informations nécessaires au rendu de ces bandes au VSA-100 esclave, qui lui enverra après rendu les données à écrire dans le frame buffer (zone mémoire dans laquelle est stockée l´image finale), qui se situe dans les 32 Mo du VSA-100 Maître.

testv5voodoo55500agp.jpg

Le 3DFX Voodoo5 6000 embarqué 4 VSA-100.

3dfxvoodoo5_6000agp_profilethumb.jpg

sinon, pour le PCG, il est effectivement synonyme de SFR...ce n'est qu'un nom commercial...tout comme ATI a appelé l'AFR ASIC machin...

Megabyte n'a jamais réussie a exploité leur technologie. De la pure théorie.....

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...