BudG4 Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 Bonjour à tous, Je vous explique mon problème, je possède un serveur ibm ou il y a comme système d'exploitation mandriva corporate server 3 avec toutes les mises à jours, je lui ai installé Kolab2 (groupware) sur le /kolab qui lui même est via une carte fibre channel relier a un SAN. J'ai egalement Tivoli v5r3 ainsi que cbmr de Cristie (image systeme dans tivoli). Mais je ne sais pas pourquoi mon serveur reboot aleatoirement, et je ne sais pas trop ou chercher d'ou viens le probleme, sauriez vous me donner quelques pistes ??? Merci de vos réponses. Lien vers le commentaire Partager sur d’autres sites More sharing options...
zoto Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 Salut Deja fouille tes logs . Verifie que tu as dit a linux d'etre bavard (ça peut etre tres bavard un manchot, faut même faire attention dans un cluster ça peut devenir une veritable cacophonie ) en editant ton fichier /etc/syslog.conf . Sinon regarde l'activité, la monté en charge grâce a des logiciels utilisant snmp comme Cacti (assez facil a mettre en place) ou nagios . Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat . n'oublie pas la date dans ton script :) . Voila mes quelques indices :) a+ Lien vers le commentaire Partager sur d’autres sites More sharing options...
theocrite Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 Je dirais que tu peux regarder dans les /var/log/kern[el]. Pas perduadé à 100%, mais bon, c'est là que je chercherais. Wooo : Je fais pale figure après la réponse de zoto... Lien vers le commentaire Partager sur d’autres sites More sharing options...
tuXXX Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat . Régulièrement, pas récursivement Lien vers le commentaire Partager sur d’autres sites More sharing options...
zoto Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 Regarde aussi si ton serveur est bien ventilé, si lm-sensor fonctionne dessus, installe le configure le et si il faut fait un petit script que tu lance recursivement avec la contrab, qui fait appel a lm-sensors et redirige le resultat ver un autre fichier qui stock ce résultat . Régulièrement, pas récursivement Salut Tu joue sur les Mots tuXXX Capelo mais c'est vraie On dira que j'etais mal reveillé a+ Lien vers le commentaire Partager sur d’autres sites More sharing options...
Dark26 Posté(e) le 11 novembre 2005 Partager Posté(e) le 11 novembre 2005 je pencherais vers un problème hard , sauf si ça marchait avant ... quoique un ventilo qui tourne plus, et c'est vite arrivé.... Lien vers le commentaire Partager sur d’autres sites More sharing options...
BudG4 Posté(e) le 11 novembre 2005 Auteur Partager Posté(e) le 11 novembre 2005 Re a tous, je n'arrive pas a faire marcher lm_sensors :-/ [root@mail log]# sensors-detect This program will help you determine which I2C/SMBus modules you need to load to use lm_sensors most effectively. You need to have i2c and lm_sensors installed before running this program. Also, you need to be `root', or at least have access to the /dev/i2c/* files, for most things. If you have patched your kernel and have some drivers built in, you can safely answer NO if asked to load some modules. In this case, things may seem a bit confusing, but they will still work. Bad VPD checksum (0x7E)! Please report. System vendor: IBM BIOS version: APE121AUS Sorry, we won't let you go on. IBM systems are known to have serious problems with lm_sensors, resulting in hardware failures. For more information, see README.thinkpad or http://www2.lm-sensors.nu/~lm78/cvs/lm_sen...README.thinkpad. Not all IBM systems are affected, and we plan to establish a "white list" of safe systems soon. Stay tuned! dans les logs, je ne vois pas grand chose d'anormal a part que, à chaque fois avant qu'il reboote j'ai ce log dans postfix: Nov 10 22:04:05 mail <info> postfix/smtpd[16693]: disconnect from unknown["ipdemonrouteur"] Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max connection rate 1/60s for (25:"ipdemonrouteur") at Nov 10 22:02:05 Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max connection count 1 for (25:"ipdemonrouteur") at Nov 10 22:02:05 Nov 10 22:07:25 mail <info> postfix/anvil[16694]: statistics: max cache size 1 at Nov 10 22:02:05 mais je ne sais pas si ca peut avoir un rapport. j'ai essayé un memtest tout un week end et je n'ai pas eu de reboot et pas d'erreur. merci à tous de vos réponses. Lien vers le commentaire Partager sur d’autres sites More sharing options...
Messages recommandés
Archivé
Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.