Jump to content

Folding@home: la Team INpact qui guérit la planète


Will.
 Share

Recommended Posts

Sisi ... dans FAHLog.txt tu as tout ... il suffit de savoir où chercher ;)

Par exemple :

[09:31:34] *------------------------------*

[09:31:34] Folding@home Gromacs Core

[09:31:34] Version 1.67 (July 13, 2004)

[09:31:34]

[09:31:34] Preparing to commence simulation

[09:31:34] - Looking at optimizations...

[09:31:34] - Files status OK

[09:32:00] - Expanded 3884336 -> 22162021 (decompressed 570.5 percent)

[09:32:01]

[09:32:01] Project: 1302 (Run 0, Clone 31, Gen 6)

[09:32:01]

[09:32:01] Assembly optimizations on if available.

[09:32:01] Entering M.D.

[09:32:26] (Starting from checkpoint)

[09:32:26] Protein: p1302_1ryp_AAAA_free

blabla

[23:34:25] Writing local files

[23:34:26] Completed 46000 out of 100000 steps  (46)

[23:47:52] Quit 101 - Fatal error:

[23:47:52] Step 46504, time 46.504 (ps)  LINCS WARNING

[23:47:52] relative constraint deviation after LINCS:

[23:47:52] max 0.299032 (between atoms 45939 and 45940) rms 0.001709

[23:47:52]

[23:47:52] Simulation instability has been encountered. The run has entered a

[23:47:52]  state from which no further progress can be made.

[23:47:52] If you often see other project units terminating early like this

[23:47:52]  too, you may wish to check the stability of your computer (issues

[23:47:52]  such as high temperature, overclocking, etc.).

[23:47:52] Going to send back what have done.

[23:47:52] logfile size: 49586

[23:47:52] - Writing 50270 bytes of core data to disk...

[23:47:52]  ... Done.

[23:47:52]

[23:47:52] Folding@home Core Shutdown: EARLY_UNIT_END

[23:47:55] CoreStatus = 72 (114)

[23:47:55] Sending work to server

J'ai mis en gras ce qui est important : les références de la WU, et l'erreur ... il te suffit de trouver les mêmes infos (je précise que c'est une WU qui date d'hier ... donc ya quand même les infos ... si tu trouve rien, elle sont peut être sauvées dans FAHlog-prev ou FAHlog2) :francais:

Link to comment
Share on other sites

moi en ce moment, j'ai du mal à comprendre pourquoi je me choppe des protéines à 23 ou 44 pts qui mettent plus d'une journée à être pliées sur mon PC alors que d'hab j'en aurais fait 2 ou 3 comme ça dans la journée....

exemple en ce moment:

Project: 543 (Run 11, Clone 42, Gen 185)

BBA5_ext pour 44 pts (core gromacs 1.68)

18 minutes environ par frame

et pourtant 100% usage cpu ou presque avec un benchmark folding de 7280

:pastaper::mad2::pleure:

Link to comment
Share on other sites

Le Benchmark du client veut pas dire grand chose ... :pleure:

As tu mis le client v5 ? utilise tu un flag quelconque ? le paramètre pour les grosses WU est activé ou non ? :duel1:

La série des BBA5 est relativement ancienne, c'est peut être pour ca que tu la trouve pas très performante ... vérifie aussi que les optimisations soient bien activée ... :D

Link to comment
Share on other sites

Le Benchmark du client veut pas dire grand chose ... :transpi:

As tu mis le client v5 ? utilise tu un flag quelconque ? le paramètre pour les grosses WU est activé ou non ? :ouioui:

La série des BBA5 est relativement ancienne, c'est peut être pour ca que tu la trouve pas très performante ... vérifie aussi que les optimisations soient bien activée ... :non:

il y a un paramètre pour chopper des "grosses" ? c'est pas en indiquant que l'on ne veut que des Wu avec deadlines ?

Link to comment
Share on other sites

Le Benchmark du client veut pas dire grand chose ... :pleure:

As tu mis le client v5 ? utilise tu un flag quelconque ? le paramètre pour les grosses WU est activé ou non ? :craint:

La série des BBA5 est relativement ancienne, c'est peut être pour ca que tu la trouve pas très performante ... vérifie aussi que les optimisations soient bien activée ... :fumer:

Il s'agit d'une "ancienne" config que je viens de remonter (BARTON2500+@3200+) qui a "bien" fonctionné pd une semaine et là je ne comprends pas ce qui se passe. J'ai imaginé un moment que le cpu ne soit pas utilisé à fond d'où la valeur bench pour info

Je n'ai rien changé comme paramères (la machine bosse 24/24 7/7) et le client est en servie via firedeamon. La seule chose que j'ai fait c'est de passer du client 4 au 5.02

La seule commande qui était activée est -verbosity 9

J'ai repassé -config pour tout vérifier bien entendu et tout est ok (optimisations a priori, usage cpu 100%, etc..... L'occupation du cpu est de 98-99% four FAHcore78

Je viens de rajouter -advmethods pour chopper autre chose et voir mais si ça reste pareil, je remets le client 4 !

Avec cette même config, le BBA5 je les faisait en 5 heures avant :censored:

Link to comment
Share on other sites

tenez, le log me donne ça:

--- Opening Log file [August 31 17:07:55]

# Windows Console Edition #####################################################

###############################################################################

Folding@Home Client Version 5.02

http://folding.stanford.edu

###############################################################################

###############################################################################

Launch directory: D:\Program Files\Fold@Home

Executable: D:\Program Files\Fold@Home\FAH502-Console.exe

Arguments: -verbosity 9 -advmethods

[17:07:55] - Ask before connecting: No

[17:07:55] - User name: [inpact]_Cbyoyo (Team 51)

[17:07:55] - User ID: 5DB5C7392B97C45C

[17:07:55] - Machine ID: 1

[17:07:55]

[17:07:55] Loaded queue successfully.

[17:07:55] + Benchmarking ...

[17:07:57] The benchmark result is 7084

[17:07:57]

[17:07:57] - Autosending finished units...

[17:07:57] Trying to send all finished work units

[17:07:57] + No unsent completed units remaining.

[17:07:57] - Autosend completed

[17:07:57] + Processing work unit

[17:07:57] Core required: FahCore_78.exe

[17:07:57] Core found.

[17:07:57] Working on Unit 01 [August 31 17:07:57]

[17:07:57] + Working ...

[17:07:57] - Calling 'FahCore_78.exe -dir work/ -suffix 01 -checkpoint 30 -verbose -lifeline 2332 -version 502'

[17:07:57]

[17:07:57] *------------------------------*

[17:07:57] Folding@Home Gromacs Core

[17:07:57] Version 1.68 (August 18, 2004)

[17:07:57]

[17:07:57] Preparing to commence simulation

[17:07:57] - Ensuring status. Please wait.

[17:08:14] - Read to use standard loops

[17:08:14] - Previous termination of core was improper.

[17:08:14] - Files status OK

[17:08:14] - Expanded 349735 -> 1761865 (decompressed 503.7 percent)

[17:08:14]

[17:08:14] Project: 543 (Run 11, Clone 42, Gen 185)

[17:08:14]

[17:08:15] Entering M.D.

[17:08:35] (Starting from checkpoint)

[17:08:35] Protein: p543_BBA5_ext

[17:08:35]

[17:08:35] Writing local files

[17:08:35] Completed 45000 out of 500000 steps (9)

[17:26:44] Writing local files

[17:26:44] Completed 50000 out of 500000 steps (10)

[17:44:26] Writing local files

[17:44:26] Completed 55000 out of 500000 steps (11)

[18:02:08] Writing local files

[18:02:08] Completed 60000 out of 500000 steps (12)

[18:19:46] Writing local files

[18:19:46] Completed 65000 out of 500000 steps (13)

[18:37:21] Writing local files

[18:37:21] Completed 70000 out of 500000 steps (14)

[18:54:59] Writing local files

[18:54:59] Completed 75000 out of 500000 steps (15)

[19:12:37] Writing local files

[19:12:37] Completed 80000 out of 500000 steps (16)

[19:30:15] Writing local files

[19:30:15] Completed 85000 out of 500000 steps (17)

[19:47:54] Writing local files

dans le doute, j'ai remis -forceSSE

Edited by Cbyoyo
Link to comment
Share on other sites

bon, -forceasm et ça marche: j'ai le boost SSE

Merci Totow, mais j'ai quand même du mal à comprendre ce qui s'est passé et pourquoi ça ne s'activait pas

Au passage, j'ai vu que la console 5.02 avait l'option de mise en service: ça change quoi avec firedeamons ????

Link to comment
Share on other sites

Tu as l'explication ici (core mal arrété ...) :

[17:07:57] Preparing to commence simulation

[17:07:57] - Ensuring status. Please wait.

[17:08:14] - Read to use standard loops

[17:08:14] - Previous termination of core was improper.

Terminou> ca te concerne aussi :craint:

Rappel : dans le client v5, le paramètre -forceSSE n'exite plus ... il faut utiliser -forceasm comme à l'époque du client v3 :censored:

La mise en service de la v5 permet de se passer de logiciels annexes comme firedaemon ... par contre il faut aller mettre les paramètre en dur dans la base de registres une fois la fonction de mise en service activée ...

Edited by toTOW
Link to comment
Share on other sites

Dis nous en plus : Early-Unit-End je suppose ? quel projet ? c'est la première fois ? ca se reproduit régulièrement ? :censored:

Effectivement :

[23:35:29] Assembly optimizations on if available.

[23:35:29] Entering M.D.

[23:35:36] Protein: p219_c21Murea

[23:35:36]

[23:35:36] Writing local files

[23:35:40] Extra SSE boost OK.

[23:35:40] Writing local files

[23:35:40] Completed 0 out of 1000000 steps  (0)

[00:07:34] Writing local files

[00:07:35] Completed 10000 out of 1000000 steps  (1)

[00:37:25] Writing local files

[00:37:25] Completed 20000 out of 1000000 steps  (2)

[01:08:30] Writing local files

[01:08:31] Completed 30000 out of 1000000 steps  (3)

[01:37:09] Writing local files

[01:37:09] Completed 40000 out of 1000000 steps  (4)

[02:00:27] Gromacs cannot continue further.

[02:00:27] Going to send back what have done.

[02:00:27] logfile size: 9693

[02:00:27] - Writing 10229 bytes of core data to disk...

[02:00:27]  ... Done.

[02:00:27]

[02:00:27] Folding@home Core Shutdown: EARLY_UNIT_END

Cela se produisait assez régulièrement surement à cause d'un o/c pas stable, j'ai remis la fréquence par défaut et là ça semble fonctionner correctement.

Par contre je voulais savoir aussi si certains tournent avec des P4 HT et si c'est bénéfique de faire tourner 2 F@H (un sur chaque processeur logique). Actuellement j'ai un client à 43 mins par frame et l'autre à 23 mins.

J'utilise la console 4.00 en -service -local -advmethods. Y'aurait des flags à rajouter ou pas ?

Edited by nonas
Link to comment
Share on other sites

Il faut considérer le P4 HT comme un bi-CPU (même si s'en est pas vraiment un) et donc installer deux consoles ... je te laisse chercher (site ou forum de l'alliance) comment faire :pleure:

C'est déjà fait :D (-local)

Par contre le -forceSSE est-il nécessaire pour les P4 ? (J'ai un client qui tourne avec : Version 1.68 (August 18, 2004) SSE Enabled et l'autre non, c'est la même configuration pour les deux clients pourtant :chinois: )

edit: les deadline ça fonctionne comment exactement ? Par exemple, mon client 1 travaille sur p1090_RN24_extended et FAH LogStats m'indique 19.00 comme deadline, ça correspond à quoi ? Et que se passe-t-il si on envoie les résultats après la deadline ?

Edited by nonas
Link to comment
Share on other sites

Le -forceSSE n'exite plus dans le client v5 ... et n'est de toutes façons plus utile (il servait sur AMD à une époque) ... il faut utiliser -forceasm qui restaurera le SSE en cas de plantage de la machine, c'est ca seule utilité.

La deadline est indiquée en jours, ca veut dire que tu as dans ton cas 19 jours pour calculer et renvoyer la WU ... passé ce délais la client l'effacera, considérant le WU comme périmée. Si par hazard il la renvoie, tu n'aura simplement pas de points pour son calcul ... ;)

Link to comment
Share on other sites

slt !

g un tit pb avec on 2e pc

g change le ventilo donc je le remet au boulot (il est aussi passe de 2200+ a 2500+)

seulement il arrive pas a chopper de WU :(

g fait un copier coller de min dossier FAH pour l envoyer sur l autre pc, puis g juste change le n° du CPU

WinXP SP1 sur mes 2 PC

NTFS sur les 2 (pas d autre partition sur ce pc pour essayer de le mettre autre part)

norton 2004 pour le firewall (acces autorise)

je vois pas ce ki merde... et je me casse 3 mois lundi prochain alors s il est pas fonctionnel d ici la je perd 3 mois de calculs (c pas moi ki me sert de ce pc)

--- Opening Log file [August 31 22:30:42]

# Windows Console Edition #####################################################

###############################################################################

Folding@Home Client Version 5.00

http://folding.stanford.edu

###############################################################################

###############################################################################

Launch directory: C:\Program Files\FAH

Executable: C:\Program Files\FAH\FAH500-Console.exe

Arguments: -local

[22:30:42] - Ask before connecting: No

[22:30:42] - Use IE connection settings: Yes

[22:30:42] - User name: [inpact]_TiTan91 (Team 51)

[22:30:42] - User ID: 4A29B43568379FC0

[22:30:42] - Machine ID: 2

[22:30:42]

[22:30:42] Loaded queue successfully.

[22:30:42] + Benchmarking ...

[22:30:45] - Preparing to get new work unit...

[22:30:45] + Attempting to get work packet

[22:30:45] - Connecting to assignment server

[22:30:45] Couldn't send HTTP request to server (wininet)

[22:30:45] + Could not connect to Assignment Server

[22:30:45] Couldn't send HTTP request to server (wininet)

[22:30:45] + Could not connect to Assignment Server 2

[22:30:45] + Couldn't get work instructions.

[22:30:45] - Error: Attempt #1 to get work failed, and no other work to do.

Waiting before retry.

[22:31:01] + Attempting to get work packet

[22:31:01] - Connecting to assignment server

[22:31:01] Couldn't send HTTP request to server (wininet)

[22:31:01] + Could not connect to Assignment Server

[22:31:16] Couldn't send HTTP request to server (wininet)

[22:31:16] + Could not connect to Assignment Server 2

[22:31:16] + Couldn't get work instructions.

[22:31:16] - Error: Attempt #2 to get work failed, and no other work to do.

Waiting before retry.

[22:31:28] + Attempting to get work packet

[22:31:28] - Connecting to assignment server

[22:31:43] Couldn't send HTTP request to server (wininet)

[22:31:43] + Could not connect to Assignment Server

[22:31:58] Couldn't send HTTP request to server (wininet)

[22:31:58] + Could not connect to Assignment Server 2

[22:31:58] + Couldn't get work instructions.

[22:31:58] - Error: Attempt #3 to get work failed, and no other work to do.

Waiting before retry.

Folding@Home Client Shutdown.

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

 Share

×
×
  • Create New...