Jump to content

[problème] code calcul et corruption ram ?


Recommended Posts

(posté en double de hfr, la question étant très technique je suis pas sûr d'avoir de réponse ...)

je suis thésard et je dois faire tourner un code de calcul sur une station redhat, dont je suis seul user. le pc a été installé/configuré par les responsables infos à paris (suis à orléans. je me logue sous un profil user mais j'ai le mdp root si besoin. L'interface graphique est fluxbox et très peu de logiciels sont installés, je débutte sous nux. ça c'est pour le décors :mdr:

il se trouve que depuis qq temps le sys se comporte de manière bizarre (symptomes non présents au début) : la semaine dernière il me désactive le lancement de nedit qd je lui dit "ouvrir en fichier texte". qd je lance une édition de texte via un xterm et que je quite nedit avec un ctrl+Q, <parfois> il me rend pas la main dans le xterm. ça c'est pour les problèmes annexes :yes:

plus chiant : il m'envoie boullé mon code de calcul à peine les boucles enclanchées (5-6 tours et zou eject, en temps normal faut bien 10 000 boucles), et ce aussi bien pour les nouvelles versions du script que pour les anciennes qui marchaient. j'ai tenté le reboot, boot à froid etc... rien n'y fait donc c pas une corruption de prg en ram. certes qd je monte trop haut en résolution maillage je tombais sur une erreur type 'gemat error ...' typique. mais là me renvoie "erreur d'écriture fichier de débordement 9 1 ...". la version du script ue j'utilise m'occupe mm pas 600Mo de ram sur 2Go total, tjrs au moins 1,2Go libre. place disque dispo très largement libre : occupe 10% des 120Go.

il me semble avoir localisé, qd je fais un "top" dans xterm, des valeur anormales pour les lignes suivantes :

in_c 15 128 ko

in_d 3 740 ko

avant, au début des calculs sur le pc il me disait

in_c 488 420 ko

in_d 35 260 ko

kezaco de ces in_c et in_d ? est-ce la cause de mes pbs ? comment le code (dont je n'ai accès qu'à la partie script) peut-il corrompre mon sys ?

help please :D

Link to comment
Share on other sites

as tu bien désactivé le plug&play OS dans le BIOS ? la gestion de l'ACPI ces deux trucs la foutent un peut le bordel (j'en ai fait l'experience plusieurs fois), as tu des droits "root" sur ta session user ? les mêmes pb en root ?

quel est ta version de kernel ?

Link to comment
Share on other sites

PnP je sais pas faut déjà que je vois si j'ai accès au bios ... mais bon à priori c'est pas ça puisque le pc est prévu pour tourner pendant des jours entiers à full load. et il l'a déjà fait, j'ai une précédente version du code qui a tourné pendant une semaine non stop. là 5 minutes et eject :D

j'ai pas les droits root dans mon user de base mais je peux passer en root (su + pass dans xterm) sans pb si besoin. mon code génére des fichiers dont le user de base est le proprio.

faire tourner en root j'ose pas trop tenter en fait car vu le comportement du sys et la hierarchisation nux il ne peut s'agir au choix que d'une corruption du programme compilé (autocorruption) ou d'un fichier de config. je voudrais eviter de lui ouvrir grand les portes du système en le faisant tourner en root ...

kernel 2.4.2 . j'ai pas trop le droit de toucher à ça normalement, vu qu'en plus je suis pas hyper agéri à nux donc installer le code de calcul et le toutim me ferait perdre plus de temps qu'à un expert d'une part et d'autre part je suis payé pour généré des résultats/amméliorer la physique introduite dans le code, donc si je suis bloqué faut que je me justifie autrement que "le truc a planté donc je bidouille ...". en plus si c'était un pc standard, avec un peu d'aide pkoi pas, mais là c'est une grosse bestiolle (scsi raid, bi xeon, ram à gogo (2Go), et mobo dell, swap desactivée pour tourner plus vite etc ... )

Link to comment
Share on other sites

mm pas il est pas connecté au net. je pige pas comment le configurer exactement pour qu'il accède au net (apparemment j'ai plusieurs paserelles à passer). j'arrive déjà le faire dialoguer en ftp avec mon pc bureautique win2k c'est déjà beau :keskidit: . c'est con en effet car ça fait un moment que je veux lui faire tourner folding, surtout que le code de calcul ne pige pas le multi proc donc au minima il y aurait un xeon2 2.8GHz qui tournerai en permanence :keskidit: . je vous passerai les lignes que mon frangin m'a fait rentrer dans rc pour que vous vooyez d'où peut venir mon pb de config réseau/net .

un spécialiste nux est venu et à modifié une valeur à priori sans rapport (nb de track dispo pour le prog) avec le bug, mais tjrs est il que ça semble corriger et remarcher. enfin je prend des pincettes geantes, car maintenant le menu contextuel "ouvrir un xterm ici" ne marche pas :keskidit: ... va chercher à comprendre charles.

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Create New...