Aller au contenu

Folding@home: la Team INpact qui guérit la planète


Will.

Messages recommandés

Bonsoir,

Quelques petites questions:

J'ai un C2D, donc j'ai créer 2 dossiers, ça ok :transpi:

Mais j'ai vu un Folding@home smp, donc optimisé dual core, faut-il lui créer 2 dossiers aussi?

Peut-on lancer sans probleme le fold cpu+gpu?

A oui, on est rajouté automatiquement dans le Classement interne de la miniTeam PC INpact?

Merci

:D

Bartelemix

Lien vers le commentaire
Partager sur d’autres sites

Salut,

Pour le client smp, pas besoin de deux dossiers, par contre il faut le lancer avec l'option -smp

Pour ce qui est du cpu+gpu, soit tu est sous windows XP, auquel cas lance un client cpu simple et assigne le au core qui ne travaille pas (un core est utilisé pour le client gpu), soit tu est sous vista,auquel cas tu peux lancer le client smp en meme temps que le client gpu (avec une nvidia tout du moins je sais pas pour les ATi).

Concernant le classement interne, à priori si tu te mets dans la team 51 et que tu précede bien ton pseudo de [inpact] ca devrais être le cas, mais à vrai dire je n'en sais rien ;)

De rien :D

Lien vers le commentaire
Partager sur d’autres sites

Merci :zarb:

Ma commande de lancement pour le smp: " -smp -local -verbosity 9

Donc c'est bon.

D'autres petites questions: 8)

Pour le cpu+gpu, je suis sous xp , je peux lancer le client smp+ client gpu, ou il faut obligatoirement un client 'simple'+ gpu?

J'ai cru voir que les dernières versions étaient 'auto assigment', dois-je toucher quelque chose dans la config?

Les PPD c'est quoi exactement, les calculs effectués? Quand vous dites X PPD, c'est en heures, par protéines, j'ai pas bien compris.Actuellement sous fahmon j'ai:

gpu:1630

smp:788

Et derniere, extrait de mon log smp:

[23:32:27] Completed 5000 out of 250000 steps  (2 percent)
[23:47:27] Timered checkpoint triggered.
[00:02:28] Timered checkpoint triggered.
[00:07:12] Writing local files
[00:07:12] Completed 7500 out of 250000 steps  (3 percent)
[00:22:14] Timered checkpoint triggered.
[00:37:14] Timered checkpoint triggered.
[00:52:16] Timered checkpoint triggered.
[00:57:09] Writing local files
[00:57:10] Completed 10000 out of 250000 steps  (4 percent)
[01:12:14] Timered checkpoint triggered.
[01:27:17] Timered checkpoint triggered.

Timered checkpoint triggered?

[inpact]_Bartelemix :51 , a rajouter :oops:

Merci d'avance pour les réponses, bonne nuit

Bartelelemix

Lien vers le commentaire
Partager sur d’autres sites

bonjour, j'ai un petit problème moi aussi, je viens de réinstaller mon Vista x64, et j'ai réinstallé F@H V6.22beta2 SMP MPICH et voilà ce qu'il me met :

--- Opening Log file [August 20 06:15:36 UTC] 


# Windows SMP Console Edition #################################################
###############################################################################

				   Folding@Home Client Version 6.22 SMP Beta2

					  http://folding.stanford.edu

###############################################################################
###############################################################################

Launch directory: C:\Program Files (x86)\Folding@Home Windows SMP Client V1.01
Executable: C:\Program Files (x86)\Folding@Home Windows SMP Client V1.01\Folding@home-Win32-x86.exe
Arguments: -verbosity 9 -smp -forceasm 

Warning:
By using the -forceasm flag, you are overriding
safeguards in the program. If you did not intend to
do this, please restart the program without -forceasm.
If work units are not completing fully (and particularly
if your machine is overclocked), then please discontinue
use of the flag.

[06:15:36] Configuring Folding@Home...


[06:16:16] - Ask before connecting: No
[06:16:16] - User name: [INpact]_Nemesis93_75 (Team 51)
[06:16:16] - User ID: 86676480CBA3368
[06:16:16] - Machine ID: 1
[06:16:16] 
[06:16:16] Work directory not found. Creating...
[06:16:16] Could not open work queue, generating new queue...
[06:16:16] - Preparing to get new work unit...
[06:16:16] + Attempting to get work packet
[06:16:16] - Autosending finished units... [August 20 06:16:16 UTC]
[06:16:16] - Will indicate memory of 4094 MB
[06:16:16] Trying to send all finished work units
[06:16:16] - Detect CPU.[06:16:16] + No unsent completed units remaining.
Vendor: AuthenticAMD, Family: 15, Model: 2, Stepping: 2
[06:16:16] - Autosend completed
[06:16:16] - Connecting to assignment server
[06:16:16] Connecting to http://assign.stanford.edu:8080/
[06:16:18] Posted data.
[06:16:18] Initial: 40AB; - Successful: assigned to (171.64.65.64).
[06:16:18] + News From Folding@Home: Welcome to Folding@Home
[06:16:18] Loaded queue successfully.
[06:16:18] Connecting to http://171.64.65.64:8080/
[06:16:23] Posted data.
[06:16:23] Initial: 0000; - Receiving payload (expected size: 4659162)
[06:17:52] - Downloaded at ~51 kB/s
[06:17:52] - Averaged speed for that direction ~51 kB/s
[06:17:52] + Received work.
[06:17:52] + Closed connections
[06:17:52] 
[06:17:52] + Processing work unit
[06:17:52] Work type a1 not eligible for variable processors
[06:17:52] Core required: FahCore_a1.exe
[06:17:52] Core not found.
[06:17:52] - Core is not present or corrupted.
[06:17:52] - Attempting to download new core...
[06:17:52] + Downloading new core: FahCore_a1.exe
[06:17:52] Downloading core (/~pande/Win32/x86/Core_a1.fah from www.stanford.edu)
[06:17:54] Initial: AFDE; + 10240 bytes downloaded
[06:17:54] Initial: AD21; + 20480 bytes downloaded
[06:17:54] Initial: CC38; + 30720 bytes downloaded
[06:17:54] Initial: 8501; + 40960 bytes downloaded
[06:17:55] Initial: F56A; + 51200 bytes downloaded
[06:17:55] Initial: ABAE; + 61440 bytes downloaded
[06:17:55] Initial: B6B0; + 71680 bytes downloaded
[06:17:55] Initial: 783A; + 81920 bytes downloaded
[06:17:55] Initial: B2A6; + 92160 bytes downloaded
[06:17:55] Initial: 1409; + 102400 bytes downloaded
[06:17:55] Initial: BBF0; + 112640 bytes downloaded
[06:17:55] Initial: 1861; + 122880 bytes downloaded
[06:17:55] Initial: 5950; + 133120 bytes downloaded
[06:17:55] Initial: 1081; + 143360 bytes downloaded
[06:17:55] Initial: 26BC; + 153600 bytes downloaded
[06:17:55] Initial: FE4A; + 163840 bytes downloaded
[06:17:55] Initial: C1C3; + 174080 bytes downloaded
[06:17:56] Initial: 9B49; + 184320 bytes downloaded
[06:17:56] Initial: 9EE5; + 194560 bytes downloaded
[06:17:56] Initial: D79D; + 204800 bytes downloaded
[06:17:56] Initial: 7801; + 215040 bytes downloaded
[06:17:56] Initial: 8B51; + 225280 bytes downloaded
[06:17:56] Initial: E26E; + 235520 bytes downloaded
[06:17:57] Initial: EDB0; + 245760 bytes downloaded
[06:17:57] Initial: 0919; + 256000 bytes downloaded
[06:17:57] Initial: CDDE; + 266240 bytes downloaded
[06:17:57] Initial: 7A7E; + 276480 bytes downloaded
[06:17:57] Initial: 034E; + 286720 bytes downloaded
[06:17:57] Initial: 88D0; + 296960 bytes downloaded
[06:17:57] Initial: D66D; + 307200 bytes downloaded
[06:17:57] Initial: 6A52; + 317440 bytes downloaded
[06:17:57] Initial: B478; + 327680 bytes downloaded
[06:17:57] Initial: CF8A; + 337920 bytes downloaded
[06:17:57] Initial: 8407; + 348160 bytes downloaded
[06:17:57] Initial: 2246; + 358400 bytes downloaded
[06:17:58] Initial: 1C69; + 368640 bytes downloaded
[06:17:58] Initial: 1287; + 378880 bytes downloaded
[06:17:58] Initial: 19B3; + 389120 bytes downloaded
[06:17:58] Initial: 1AD1; + 399360 bytes downloaded
[06:17:58] Initial: 5791; + 409600 bytes downloaded
[06:17:58] Initial: 76C5; + 419840 bytes downloaded
[06:17:58] Initial: 9B77; + 430080 bytes downloaded
[06:17:58] Initial: E82F; + 440320 bytes downloaded
[06:17:58] Initial: D0D3; + 450560 bytes downloaded
[06:17:58] Initial: 0F5E; + 460800 bytes downloaded
[06:17:58] Initial: D743; + 471040 bytes downloaded
[06:17:58] Initial: 0B7C; + 481280 bytes downloaded
[06:17:59] Initial: FAFD; + 491520 bytes downloaded
[06:17:59] Initial: 0E14; + 501760 bytes downloaded
[06:17:59] Initial: 4048; + 512000 bytes downloaded
[06:17:59] Initial: 21A5; + 522240 bytes downloaded
[06:17:59] Initial: C1A5; + 532480 bytes downloaded
[06:17:59] Initial: F716; + 542720 bytes downloaded
[06:17:59] Initial: DD98; + 552960 bytes downloaded
[06:17:59] Initial: 9F7B; + 563200 bytes downloaded
[06:17:59] Initial: 1CC0; + 573440 bytes downloaded
[06:17:59] Initial: 4D37; + 583680 bytes downloaded
[06:17:59] Initial: 222A; + 593920 bytes downloaded
[06:17:59] Initial: 8E33; + 604160 bytes downloaded
[06:17:59] Initial: D3C9; + 614400 bytes downloaded
[06:17:59] Initial: 9821; + 624640 bytes downloaded
[06:17:59] Initial: 236E; + 634880 bytes downloaded
[06:18:00] Initial: 1A7A; + 645120 bytes downloaded
[06:18:00] Initial: 6D64; + 655360 bytes downloaded
[06:18:00] Initial: 4ADC; + 665600 bytes downloaded
[06:18:00] Initial: 3854; + 675840 bytes downloaded
[06:18:00] Initial: CB5C; + 686080 bytes downloaded
[06:18:00] Initial: 2A88; + 696320 bytes downloaded
[06:18:00] Initial: 1199; + 706560 bytes downloaded
[06:18:00] Initial: 0512; + 716800 bytes downloaded
[06:18:00] Initial: 316E; + 727040 bytes downloaded
[06:18:00] Initial: D89D; + 737280 bytes downloaded
[06:18:00] Initial: E6A3; + 747520 bytes downloaded
[06:18:00] Initial: B488; + 757760 bytes downloaded
[06:18:00] Initial: BAFD; + 768000 bytes downloaded
[06:18:00] Initial: 34A0; + 778240 bytes downloaded
[06:18:00] Initial: DD6C; + 788480 bytes downloaded
[06:18:00] Initial: D2E9; + 789667 bytes downloaded
[06:18:00] Verifying core Core_a1.fah...
[06:18:01] Signature is VALID
[06:18:01] 
[06:18:01] Trying to unzip core FahCore_a1.exe
[06:18:01] Decompressed FahCore_a1.exe (2035712 bytes) successfully
[06:18:06] + Core successfully engaged
[06:18:11] 
[06:18:11] + Processing work unit
[06:18:11] Work type a1 not eligible for variable processors
[06:18:11] Core required: FahCore_a1.exe
[06:18:11] Core found.
[06:18:11] Using generic mpiexec calls
[06:18:11] Working on queue slot 01 [August 20 06:18:11 UTC]
[06:18:11] + Working ...
[06:18:11] - Calling 'mpiexec -np 4 -channel auto -host 127.0.0.1 FahCore_a1.exe -dir work/ -suffix 01 -checkpoint 15 -forceasm -verbose -lifeline 6080 -version 622'

[06:18:11] 
[06:18:11] *------------------------------*
[06:18:11] Folding@Home Gromacs SMP Core
[06:18:11] Version 1.74 (March 10, 2007)
[06:18:11] 
[06:18:11] Preparing to commence simulation
[06:18:11] - Ensuring status. Please wait.
[06:18:19] - Starting from initial work packet
[06:18:19] 
[06:18:19] Project: 2665 (Run 1, Clone 649, Gen 6)
[06:18:19] 
[06:18:20] Assembly optimizations on if available.
[06:18:20] Entering M.D.
[06:18:40]  on if available.
[06:18:40] Entering M.D.
[06:18:46] Rejecting checkpoint
[06:18:48] 
[06:18:48] Writing local files
[06:18:49] 
[06:18:49] Writing local files
[06:18:50] Going to send back what have done.
[06:18:50] logfile size: 0
[06:18:50] Warning: Core could not open logfile.
[06:18:50] - Writing 536 bytes of core data to disk...
[06:18:50]   ... Done.
[06:18:50] - Failed to delete work/wudata_01.bed
[06:18:50] - Failed to delete work/wudata_01.sas
[06:18:50] - Failed to delete work/wudata_01.goe
[06:18:50] Warning:  check for stray files
[06:18:50] 
[06:18:50] Folding@home Core Shutdown: EARLY_UNIT_END
[06:18:50] Finalizing output

Merci d'avance de votre aide ^^

Lien vers le commentaire
Partager sur d’autres sites

@Bartelemix : apparement, d'apres les forums de folding at home, sous XP il vaut mieux lancer gpu + single cpu.

Les PPD représentent les "Point Per Day" que tu peux obtenir avec chaque client (chaque unité de travail rapportant un certain nombre de points. Tes PPD semblent correct pour ce qui est de ton cpu en tout cas (je sais pas quel est ton gpu), pour info j'obtiens 2400PPD avec mon Q6600@3.8hz et 5249 avec la 8800 GT. Sinon pour les timered checkpoint triggered ca j'ai aucune idée de ce que ca peut bien être

@nemesis : la seule fois où j'ai eu ce genre d'erreur c'est à un moment où mon overclock n'était pas stable ... Si tu n'overclock pas par contre je ne vois pas

Lien vers le commentaire
Partager sur d’autres sites

bartelemix : bin de deux choses l'une, soit l'un de tes cores est utilisé à 100% par le client gpu auquel cas ca ne sert à rien de lancer une 2eme thread cpu, soit il n'utilise pas plus de quelques pourcents auquel cas autant lancer le client smp à coté :cartonrouge:

Apparement il y a pas mal de messages sur le forum de fah laissant penser que sous Windows XP le client gpu est ralenti si on lance un client smp en meme temps, d'ou le fait de ne lancer qu'un client cpu simple par coeur libre (3 pour les quads, et un seul pour les dual). Dans mon cas particulier (quad + nvidia + vista) il se trouve que celà reviens au meme au niveau des PPD du GPU que je lance le client smp à coté ou pas (à peine 2-3% d'utilisation cpu par le client gpu), du coup je ne me suis pas pris la tête à installer 3 clients cpu ... à toi de voire ce qui te donnera les meilleures perfs dans ton cas précis en essayant plusieurs cas de figure :reflechis:

Pour ton client gpu vérifie les droits d'acces aux fichiers dans son répertoire, ca peut venir d'un probleme pour enregistrer les résultats de l'unité de travail ... ou pas (pense aussi au fait que le client gpu termine beaucoup plus vite ses unités de travail) :D Sinon essaye de le lancer avec l'option -verbosity 9 afin de voire ou se trouve le problème :cartonrouge:

Lien vers le commentaire
Partager sur d’autres sites

Encore une tite question, j'ai lancé un jeux (grid), avec le client cpu derriere, j'arrete le jeux et:

20:54:22] Completed 22%
[20:56:19] Completed 23%
[20:58:16] Completed 24%
[21:00:11] Completed 25%
[21:02:05] Completed 26%
[21:03:45] Completed 27%
[21:05:18] Completed 28%
[21:05:18] mdrun_gpu returned -1
[21:05:18] Going to send back what have done.
[21:05:19] logfile size: 24687 info=24687 bed=0 hdr=25
[21:05:19] - Writing 25225 bytes of core data to disk...
[21:05:19] Done: 24713 -> 6028 (compressed to 24.3 percent)
[21:05:19]   ... Done.
[21:05:22] 
[21:05:22] Folding@home Core Shutdown: UNSTABLE_MACHINE
[21:05:25] CoreStatus = 7A (122)
[21:05:25] Sending work to server
[21:05:25] Project: 4715 (Run 4, Clone 20, Gen 17)


[21:05:25] + Attempting to send results [August 20 21:05:25 UTC]
[21:05:27] + Results successfully sent
[21:05:27] Thank you for your contribution to Folding@Home.
[21:05:31] - Preparing to get new work unit...
[21:05:31] + Attempting to get work packet
[21:05:31] - Connecting to assignment server
[21:05:33] - Successful: assigned to (171.64.65.103).
[21:05:33] + News From Folding@Home: GPU folding beta
[21:05:33] Loaded queue successfully.
[21:05:35] + Closed connections
[21:05:40] 
[21:05:40] + Processing work unit
[21:05:40] Core required: FahCore_11.exe
[21:05:40] Core found.
[21:05:40] Working on queue slot 07 [August 20 21:05:40 UTC]
[21:05:40] + Working ...
[21:05:40] 
[21:05:40] *------------------------------*
[21:05:40] Folding@Home GPU Core - Beta
[21:05:40] Version 1.10 (Tue Aug 12 10:03:11 PDT 2008)
[21:05:40] 
[21:05:40] Compiler  : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 14.00.50727.762 for 80x86 
[21:05:40] Build host: amoeba
[21:05:40] Board Type: AMD
[21:05:40] Core	  : 
[21:05:40] Preparing to commence simulation
[21:05:40] - Looking at optimizations...
[21:05:40] - Created dyn
[21:05:40] - Files status OK
[21:05:40] - Expanded 43420 -> 236913 (decompressed 545.6 percent)
[21:05:40] Called DecompressByteArray: compressed_data_size=43420 data_size=236913, decompressed_data_size=236913 diff=0
[21:05:40] - Digital signature verified
[21:05:40] 
[21:05:40] Project: 4736 (Run 0, Clone 35, Gen 3)
[21:05:40] 
[21:05:40] Assembly optimizations on if available.
[21:05:40] Entering M.D.
[21:05:46] Working on 544 p4736_fip35_ww_domain
[21:05:46] Client config found, loading data.
[21:05:46] Starting GUI Server
[21:10:19] Completed 1%
[21:10:19] mdrun_gpu returned -1
[21:10:19] Going to send back what have done.
[21:10:20] logfile size: 16103 info=16103 bed=0 hdr=25
[21:10:20] - Writing 16641 bytes of core data to disk...
[21:10:20] Done: 16129 -> 5328 (compressed to 33.0 percent)
[21:10:20]   ... Done.
[21:10:20] 
[21:10:20] Folding@home Core Shutdown: UNSTABLE_MACHINE
[21:10:24] CoreStatus = 7A (122)
[21:10:24] Sending work to server
[21:10:24] Project: 4736 (Run 0, Clone 35, Gen 3)


[21:10:24] + Attempting to send results [August 20 21:10:24 UTC]
[21:10:25] + Results successfully sent
[21:10:25] Thank you for your contribution to Folding@Home.
[21:10:29] EUE limit exceeded. Pausing 24 hours.

J'ai eu cette erreur hier 'mdrun_gpu returned -1' , on overcloquant la cg. Donc retour aux valeurs d'origine.

Ect-ce normal que dans le gestionnaire j'ai 4 fahcore_a1.exe alors que j'ai un dualcore, 2 folding@home-win32-gpu.exe ??

Merci :)

Lien vers le commentaire
Partager sur d’autres sites

Faut mettre le client GPU en pause quand on joue ... c'est mieux, ca évite les plantages des WU.

Par contre si tu as qu'un dual core et une 4850 je ne comprends pas du tout tes choix de clients ... tu devrais avoir un client GPU et un client CPU (ou un SMP si tu es sous Vista) ... :craint:

Lien vers le commentaire
Partager sur d’autres sites

Yo

Je peux ENFIN m'y remettre...

Got a question though...

J'utilise le client SMP sous Debian 4.0r4 (en fait deux en lançant deux VMWares sous Vista 64), et quand il finit une WU, il se bloque et ne passe pas à la suivante. Ca s'arrête à "[...] Thank you for your contribution to Folding@Home. [...] Starting local stats count at 1", puis plus rien. J'ai dû le relancer. Entre temps j'ai remarqué que l'horloge était désynchronisée (2 heures d'avance) donc j'ai corrigé ça, est-ce que ça peut venir de là ? Les WU suivantes ne sont pas encore terminées donc je ne sais pas. Que faire si ça se reproduit ? Et le log de FAH affiche l'heure sans le décalage horaire, c'est normal ça ?

Thanks :francais:

Lien vers le commentaire
Partager sur d’autres sites

Les deux SMP dans des VMware étaient plus performants sur les p2653 et p30xx ... qui étaient des WU prévue pour des dual cores ... mais maintenant plus ca va, et plus cette configuration devient inutile.

Sinon Samolax tu as attendu combien après le "starting local count" ? Parce que ca peut prendre jusqu'à 5 minutes pour continuer et enchainer.

Lien vers le commentaire
Partager sur d’autres sites

Les deux SMP dans des VMware étaient plus performants sur les p2653 et p30xx ... qui étaient des WU prévue pour des dual cores ... mais maintenant plus ca va, et plus cette configuration devient inutile.

Sinon Samolax tu as attendu combien après le "starting local count" ? Parce que ca peut prendre jusqu'à 5 minutes pour continuer et enchainer.

Une heure. Mais maintenant ça marche. Donc le problème devait être la désynchro.

Pour VMWare, je testerai avec un seul VMWare au lieu de deux quand je serai présent lors d'un changement de WU. Car je suppose que c'est d'en lancer deux qui est inutile, pas de le lancer sous Linux, n'est-ce pas ? Car j'avais 2500 ppd avec un SMP sous Vista, et c'est passé à 1800+2100 (sur le même projet, 2605) avec la solution des 2 VMWare.

Lien vers le commentaire
Partager sur d’autres sites

La recommandation, c'est un fahcore par core physique ... dans ton cas tu es à 2 fahcore par core, tant que tu plies sur le core A1 ca reste plus performant, mais le core A2 s'adapte mieux au nombre de cores, donc quand il sera largement réparti, les deux VM ne seront plus la meilleure solution ...

Lien vers le commentaire
Partager sur d’autres sites

  • 4 semaines après...
  • 2 semaines après...

les serveurs gpu sont encore en carafe (171.64.122.74) mes clients gpu font dodo et les wus restent au frigo!

ca commence a devenir une habitude chez stanford

je croyais que tout le code des serveurs avait etait réecrit?

j'ai fait un petit tour sur leur forum et ca n'a pas l'air d'etre le top! une sombre histoire de pare feu ...mais moi et l'anglais!

ca fait plus de 4 heures que ca dure

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...