sylvain1970
-
Compteur de contenus
461 -
Inscription
-
Dernière visite
Messages posté(e)s par sylvain1970
-
-
Salut,
encore moi avec des soucis....
3 fois de suite plantage à 77% (version linux smp)
[12:20:28] Completed 3850000 out of 5000000 steps (77 percent)[12:27:06] Warning: long 1-4 interactions
[12:27:10] CoreStatus = 0 (0)
[12:27:10] Client-core communications error: ERROR 0x0
(c'est pas une blague, 3 fois de suite à 77%, mystère)
-
Sous nux ? normalement il marche relativement bien sous Linux ... (et il devrait pas être distribué ailleurs)
Oui, sous linux.
Je vais bien voir la suivante (quoique, jamais 2 sans 3 dit-on).
-
Arf,
quelques soucis avec le core smp a2 !?
2 WU supprimées après calcul à 100% d'affilées !
core status = 1 (1)Client-core communications error: ERROR 0x1
ben zut alors....
-
Bonsoir,
Je ne sais pas si elles sont de nouveau mises à jour automatiquement.
je m'occupe de la MAJ de la mienne, mais je peux / pourrais le faire pour la team si besoin. Mais il faudrait / faudra m'aider pour configurer tout çà.
vu que mon ordi tourne 24/24.
enfin, voilà, je lance l'idée si besoin.
-
Enfin dans les deux cas ce sont des erreurs rare et difficilement débuguables ... enfin si ca se reproduit pas systématiquement, bah tant pis ignore les
Juste pour rire :
pas si rare que çà
encore une.[23:19:18] Completed 500000 out of 500000 steps (100 percent)[23:19:20] Writing final coordinates.
[23:19:22] Past main M.D. loop
[23:19:26] Will end MPI now
[23:20:26]
[23:20:26] Finished Work Unit:
[23:20:26] - Reading up to 3724560 from "work/wudata_03.arc": Read 3724560
[23:20:28] - Reading up to 1782076 from "work/wudata_03.xtc": Read 1782076
[23:20:28] goefile size: 0
[23:20:28] logfile size: 16911
[23:20:28] Leaving Run
[23:20:33] - Writing 5527947 bytes of core data to disk...
[23:20:33] ... Done.
[23:23:51]
[23:23:51] Folding@home Core Shutdown: INTERRUPTED
[23:23:58] CoreStatus = 12 (18)
[23:23:58] Client-core communications error: ERROR 0x12
[23:23:58] Deleting current work unit & continuing...
[23:29:45] - Preparing to get new work unit...
-
Salut,
dans la série qu'est-ce qui se passe,ou pas de bol :
[00:21:32] Completed 500000 out of 500000 steps (100 percent)[00:21:33] Writing final coordinates.
[00:21:35] Past main M.D. loop
[00:21:39] Will end MPI now
[00:22:39]
[00:22:39] Finished Work Unit:
[00:22:39] - Reading up to 3721776 from "work/wudata_07.arc": Read 3721776
[00:22:39] - Reading up to 1774880 from "work/wudata_07.xtc": Read 1774880
[00:22:40] goefile size: 0
[00:22:40] logfile size: 16911
[00:22:40] Leaving Run
[00:22:44] - Writing 5517967 bytes of core data to disk...
[00:22:44] ... Done.
[00:26:02]
[00:26:02] Folding@home Core Shutdown: INTERRUPTED
[00:26:07] CoreStatus = 12 (18)
[00:26:07] Client-core communications error: ERROR 0x12
[00:26:07] Deleting current work unit & continuing...
[00:31:17] - Preparing to get new work unit...
çà c'est pour cette nuit.
et
[00:27:16] Completed 500000 out of 500000 steps (100 percent)[00:27:16] Writing final coordinates.
[00:27:17] Past main M.D. loop
[00:27:22] CoreStatus = 0 (0)
[00:27:22] Client-core communications error: ERROR 0x0
[00:27:22] Deleting current work unit & continuing...
[00:31:49] - Preparing to get new work unit...
pour la nuit dernière.
pas de bol...
entre les deux, des WU sont passées quand même.
-
Il y a des soucis en ce moment pour retourner les WU ?
J'ai un résultat qui est prêt depuis le 02/03 mais toujours non retourné :
(serveur 171.64.65.106:8080 et 171.65.103.100:8080, pour info).
Bonjour,
c'est bon, c'est passé.
-
Il y a des soucis en ce moment pour retourner les WU ?
J'ai un résultat qui est prêt depuis le 02/03 mais toujours non retourné :
(serveur 171.64.65.106:8080 et 171.65.103.100:8080, pour info).
-
Oui, tout à fait.
Peut importe le client (console, GPU, smp, autres ?) du moment que la configuration est ok (team 51, nom : xxxx).
-
Bonsoir,
connexion internet filaire.
-
Bonjour,
petit test :
hier, j'ai rebooté l'ordi, donc fah à été coupé (3 fois, changement ram, nettoyage, etc. ).
cette nuit, même erreur que l'autre fois à savoir :
[02:17:21] Writing local files[02:17:21] Completed 495000 out of 500000 steps (99 percent)
[02:23:56] Writing local files
[02:23:57] Completed 500000 out of 500000 steps (100 percent)
[02:23:57] Writing final coordinates.
[02:23:57] Past main M.D. loop
[02:24:02] CoreStatus = 0 (0)
[02:24:02] Client-core communications error: ERROR 0x0
[02:24:02] Deleting current work unit & continuing...
[02:28:29] - Preparing to get new work unit...
[02:28:29] + Attempting to get work packet
[02:28:29] - Connecting to assignment server
[02:28:30] - Successful: assigned to (171.64.65.64).
[02:28:30] + News From Folding@Home: Welcome to Folding@Home
[02:28:30] Loaded queue successfully.
[02:28:39] + Closed connections
fah n'aime pas être coupé ?
-
Cà doit être çà.
La suivante est passée.
-
linux 64 bits.
répertoire FAH dans mon /home
EDIT : ah oui, important, entre cette erreur et celle d'avant, d'autres WU sont passées sans pb.
2e EDIT : et puis pour 500000 points atteind ce jour.
-
Bonjour,
non, ce n'est pas un portable, c'est l'ordi avec le Q6600.
quand çà veut pas, çà veut pas :
cette nuit
[02:33:18] Completed 485000 out of 500000 steps (97 percent)[02:40:12] Writing local files
[02:40:12] Completed 490000 out of 500000 steps (98 percent)
[02:47:04] Writing local files
[02:47:04] Completed 495000 out of 500000 steps (99 percent)
[02:54:01] Writing local files
[02:54:01] Completed 500000 out of 500000 steps (100 percent)
[02:54:01] Writing final coordinates.
[02:54:01] Past main M.D. loop
[02:54:07] CoreStatus = 0 (0)
[02:54:07] Client-core communications error: ERROR 0x0
[02:54:07] Deleting current work unit & continuing...
[02:58:33] - Preparing to get new work unit...
[02:58:33] + Attempting to get work packet
[02:58:33] - Connecting to assignment server
[02:58:34] - Successful: assigned to (171.64.65.64).
[02:58:34] + News From Folding@Home: Welcome to Folding@Home
.
.
.
WU finie mais supprimée avant transfert des résultats.
-
Oui, j'avais vu la même page que toi (et d'autres mais avec une option que je n'ai pas eu dans le message), et à l'heure du 2e plantage, je dormais (le 1er, je mangeais et j'ai relancé ni plus ni moins, lors du 2e aussi d'ailleurs).
Bon, la WU est finie depuis mais c'est dommage de perdre quelques heures suite à un plantage inopiné.
Et surtout, j'aime bien comprendre pourquoi çà plante, mais parfois, il n'y a rien à comprendre.
Je n'avais jamais eu çà avant, on verra bien si çà se reproduit (WU suivante à 20% sans plantage).
EDIT : j'avais déjà eu quelques erreurs avant, mais après des coupures volontaires (faites par moi !), donc là je savais pourquoi
-
Bonjour,
@ toTOW :
fah smp a planté 2 fois depuis hier soir en indiquant :
Folding@home core Shutdown : INTERRUPTEDCoreStatus = 66 (102)
+Shutdown requested by user. Exiting.
(mais pas de .***** Got a SIGTERM signal (15) après)
Pourtant, je ne lui ai pas demandé de s'arrêter...
D'après ce que j'ai lu (surtout tes réponses), j'aurai peut-être un PB avec ma ram.
Ai-je bien compris, tu peux confirmer, svp ?
-
Oui c'est MPI qui ouvre un port (ou plusieurs je sais po trop) sur localhost (lo) pour les communication interprocess ...
Bonjour,
merci de l'info.
EDIT : ah ben, je comprends mieux pourquoi lo en est à 13 TB de transfert.
2e EDIT : heu, les ports ouverts, je les vois de mon autre PC, c'est normal pour des ports ouverts en local ?
(c'est juste une question pour être moins bête en me couchant ce soir)
-
Bonsoir,
je viens de remarquer un truc par hasard :
fah ouvre des ports sur ma machine :
sylvain@ubuntu64:~$ sudo fuser -n tcp xxxxx (n° du port)xxxxx/tcp: 11428
sylvain@ubuntu64:~$ ps ax| grep 11428
11428 pts/0 SNl 175:52 ./FahCore_a1.exe -dir work/ -suffix 03 -checkpoint 15 -lifeline 6452 -version 601
12607 pts/2 S+ 0:00 grep 11428
sylvain@ubuntu64:~$
j'ai 4 port ouverts, les 4 process de FahCore_a1....
c'est normal, çà ?
-
http://doc.ubuntu-fr.org/fah
t'es une boulet hein???
tttsssss, c'est pas bien de parler à une dame comme cela !
-
Bonne année à tous les plieurs.
Je fête mes 350000 points en ce début d'année.
-
Petite question :
çà sert à quoi au juste l'option -verbosity ?
a afficher un nivea + ou - detaillé des log
Merci.
-
Petite question :
çà sert à quoi au juste l'option -verbosity ?
-
J'ai renommer le rep work en work.old, de toute façon, j'avais dépassé la due time :
pour le retour de la WU avec cette panne du serveur.Current Work Unit-----------------
Name: Protein in POPC
Tag: P2605R13C225G12
Download time: December 21 07:01:04
Due time: December 25 07:01:04
Progress: 100% [||||||||||]
Du coup, c'est reparti (je ne sais pas si c'est une nouvelle ou la même mais bon.... c'est reparti, c'est le principal).
EDIT : ce n'est pas la même :
Current Work Unit-----------------
Name: Protein in POPC
Tag: P2605R13C183G13
Download time: December 25 12:01:14
Due time: December 29 12:01:14
Progress: 0% [__________]
-
Salut,
çà marche toujours pas :
:56:03] - Attempt #1 to get work failed, and no other work to do.Waiting before retry.
[11:56:23] + Attempting to get work packet
[11:56:23] - Connecting to assignment server
[11:56:23] - Successful: assigned to (171.64.65.56).
[11:56:23] + News From Folding@Home: Welcome to Folding@Home
[11:56:23] Loaded queue successfully.
[11:56:31] - Attempt #2 to get work failed, and no other work to do.
Waiting before retry.
[11:56:41] + Attempting to get work packet
[11:56:41] - Connecting to assignment server
[11:56:42] - Successful: assigned to (171.64.65.56).
[11:56:42] + News From Folding@Home: Welcome to Folding@Home
[11:56:42] Loaded queue successfully.
[11:56:43] - Attempt #3 to get work failed, and no other work to do.
Waiting before retry.
[11:57:17] + Attempting to get work packet
[11:57:17] - Connecting to assignment server
[11:57:18] - Successful: assigned to (171.64.65.56).
[11:57:18] + News From Folding@Home: Welcome to Folding@Home
[11:57:18] Loaded queue successfully.
[11:57:25] - Attempt #4 to get work failed, and no other work to do.
Waiting before retry.
Folding@home: la Team INpact qui guérit la planète
dans Débats et Discussions
Posté(e)
Salut,
et une de plus toujours à 77%.
bon, j'ai tout viré et relancé (repris le client, etc.....).
merci de l'info toTOW.