Aller au contenu

Reboot aleatoire de mon serveur linux, help me!


BudG4

Messages recommandés

Bonjour à tous,

Je vous explique mon problème, je possède un serveur ibm ou il y a comme système d'exploitation mandriva corporate server 3 avec toutes les mises à jours, je lui ai installé Kolab2 (groupware) sur le /kolab qui lui même est via une carte fibre channel relier a un SAN. J'ai egalement Tivoli v5r3 ainsi que cbmr de Cristie (image systeme dans tivoli).

Mais je ne sais pas pourquoi mon serveur reboot aleatoirement, et je ne sais pas trop ou chercher d'ou viens le probleme, sauriez vous me donner quelques pistes ???

Merci de vos réponses.

Lien vers le commentaire
Partager sur d’autres sites

Salut

Deja fouille tes logs .

Verifie que tu as dit a linux d'etre bavard (ça peut etre tres bavard un manchot, faut même faire attention dans un cluster ça peut devenir une veritable cacophonie :francais::transpi:) en editant ton fichier /etc/syslog.conf .

Sinon regarde l'activité, la monté en charge grâce a des logiciels utilisant snmp comme Cacti (assez facil a mettre en place) ou nagios .

Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat .

n'oublie pas la date dans ton script :) .

Voila mes quelques indices :)

a+

Lien vers le commentaire
Partager sur d’autres sites

Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat .

Régulièrement, pas récursivement :zarb:

Lien vers le commentaire
Partager sur d’autres sites

Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat .

Régulièrement, pas récursivement ;)

Salut

Tu joue sur les Mots tuXXX Capelo :chinois::byebye::byebye::zarb:;)

mais c'est vraie ;)

On dira que j'etais mal reveillé ;)

a+

Lien vers le commentaire
Partager sur d’autres sites

Re a tous, je n'arrive pas a faire marcher lm_sensors :-/

[root@mail log]# sensors-detect

This program will help you determine which I2C/SMBus modules you need to

load to use lm_sensors most effectively. You need to have i2c and

lm_sensors installed before running this program.

Also, you need to be `root', or at least have access to the /dev/i2c/*

files, for most things.

If you have patched your kernel and have some drivers built in, you can

safely answer NO if asked to load some modules. In this case, things may

seem a bit confusing, but they will still work.

Bad VPD checksum (0x7E)! Please report.

System vendor: IBM

BIOS version: APE121AUS

Sorry, we won't let you go on. IBM systems are known to have

serious problems with lm_sensors, resulting in hardware failures.

For more information, see README.thinkpad or

http://www2.lm-sensors.nu/~lm78/cvs/lm_sen...README.thinkpad.

Not all IBM systems are affected, and we plan to establish a

"white list" of safe systems soon. Stay tuned!

dans les logs, je ne vois pas grand chose d'anormal a part que, à chaque fois avant qu'il reboote j'ai ce log dans postfix:

Nov 10 22:04:05 mail <info> postfix/smtpd[16693]: disconnect from unknown["ipdemonrouteur"]

Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max connection rate 1/60s for (25:"ipdemonrouteur") at Nov 10 22:02:05

Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max connection count 1 for (25:"ipdemonrouteur") at Nov 10 22:02:05

Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max cache size 1 at Nov 10 22:02:05

mais je ne sais pas si ca peut avoir un rapport.

j'ai essayé un memtest tout un week end et je n'ai pas eu de reboot et pas d'erreur.

merci à tous de vos réponses.

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...