Aller au contenu

DD ou cable ? Comment identifier le bon.


Krapace

Messages recommandés

Bonsoir. Un soucis sur un DD dans mon serveur.

 

Vous vous en doutez je pourrais résoudre le soucis si je savait lequel, je n'ai pas trouvé de moyen de l'identifier.

 

J'ai 8 DD dans ce boitier et je voudrais éviter des heures et des heures de remplacement de cable, c'est un peu le bordel :transpi:

 

J'ai remarqué le soucis en faisant des copies sur le réseau. Les transferts montaient a 60-80Mo/s et puis coupaient pendant 30-40 secondes.

 

Quand je regarde /var/log/messages je suis floodé par ceci

ec 31 00:09:53 debian kernel: [640083.776604] ata2: hard resetting linkDec 31 00:09:53 debian kernel: [640084.095942] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:09:53 debian kernel: [640084.112422] ata2.00: configured for UDMA/33Dec 31 00:09:53 debian kernel: [640084.112478] ata2: EH completeDec 31 00:10:26 debian kernel: [640116.755766] ata2: hard resetting linkDec 31 00:10:26 debian kernel: [640117.075026] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:26 debian kernel: [640117.091481] ata2.00: configured for UDMA/33Dec 31 00:10:26 debian kernel: [640117.091532] ata2: EH completeDec 31 00:10:26 debian kernel: [640117.127429] ata2.00: configured for UDMA/33Dec 31 00:10:26 debian kernel: [640117.127473] ata2: EH completeDec 31 00:10:57 debian kernel: [640147.689516] ata2: hard resetting linkDec 31 00:10:57 debian kernel: [640148.008870] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:57 debian kernel: [640148.025329] ata2.00: configured for UDMA/33Dec 31 00:10:57 debian kernel: [640148.025374] ata2: EH completeDec 31 00:10:57 debian kernel: [640148.136494] ata2: hard resetting linkDec 31 00:10:57 debian kernel: [640148.452264] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:57 debian kernel: [640148.468729] ata2.00: configured for UDMA/33Dec 31 00:10:57 debian kernel: [640148.468772] ata2: EH completeDec 31 00:11:32 debian kernel: [640182.585967] ata2: hard resetting linkDec 31 00:11:32 debian kernel: [640182.905318] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:11:32 debian kernel: [640182.921769] ata2.00: configured for UDMA/33Dec 31 00:11:32 debian kernel: [640182.921828] ata2: EH completeDec 31 00:11:50 debian kernel: [640200.677540] ata2.00: configured for UDMA/33Dec 31 00:11:50 debian kernel: [640200.677597] ata2: EH completeDec 31 00:11:58 debian kernel: [640208.990191] ata2.00: configured for UDMA/33Dec 31 00:11:58 debian kernel: [640208.990209] ata2: EH completeDec 31 00:12:04 debian kernel: [640215.381524] ata2.00: configured for UDMA/33Dec 31 00:12:04 debian kernel: [640215.381551] ata2: EH completeDec 31 00:12:27 debian kernel: [640238.031442] ata2: hard resetting linkDec 31 00:12:27 debian kernel: [640238.349725] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:12:27 debian kernel: [640238.366215] ata2.00: configured for UDMA/33Dec 31 00:12:27 debian kernel: [640238.366258] ata2: EH completeDec 31 00:13:43 debian kernel: [640313.479602] ata2: hard resetting linkDec 31 00:13:43 debian kernel: [640313.798956] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:13:43 debian kernel: [640313.815421] ata2.00: configured for UDMA/33Dec 31 00:13:43 debian kernel: [640313.815472] ata2: EH completeDec 31 00:14:48 debian kernel: [640378.702986] ata2.00: configured for UDMA/33Dec 31 00:14:48 debian kernel: [640378.703031] ata2: EH complete

Et bien sur c'est aléatoire.

 

Un moyen d'identifier le DD en question histoire que je le change ? (si je trouve un spare evidement...)

Lien vers le commentaire
Partager sur d’autres sites

"Et bien sur c'est aléatoire."

 

Tu veux dire que selon les reboots c'est jamais le même ataX dans tes logs ? Tu as essayé de voir si tu pouvais relier le ataX à un UUID (commande blkid ? ou le dossier /dev/disk/by-uuid avec les liens symboliques pour faire le lien avec /dev/sdY)

 

J'imagine que les disques ont la même taille et qu'ils sont en RAID sinon tu saurais facilement dire qui est qui. MDADM du coup ? Quel version de Debian par curiosité ? Chez moi ça bouge pas, c'est numéroté de manière fixe à partir des numérotations des ports physiques de la carte mère (mais c'est Ubuntu et CentOS donc ...)

Lien vers le commentaire
Partager sur d’autres sites

Tout les DD sont en SATA. Et je ne reboot jamais ce serveur donc je pense que c'est toujours le meme DD qui mer**

 

Et mdadm ne m'aide pas beaucoup non plus :craint:

Personalities : [raid6] [raid5] [raid4] md1 : active raid5 sda[3] sdg1[2] sdf1[1] sdc1[0]      1464757248 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [uUUU]      bitmap: 1/4 pages [4KB], 65536KB chunkmd0 : active raid5 sdd1[3] sde1[4] sdb[5]      156113920 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [uUU]

Je pourrait etre tenté de dire que le ata2 est le /dev/sdg1 [2] mais il ya deux [3] donc je pense pas que ce soit ca.

Lien vers le commentaire
Partager sur d’autres sites

Je pense qu'on peut récupérer des infos sur le disque à partir de son UUID c'est pour ça que je te parlais de la commande blkid

 

Sinon, a priori tu peux relier les différentes notations ataX et /dev/sdY grace aux liens symboliques dans le dossier /sys/block (ll /sys/block/sd*); Sur mon Nas sous ubuntu ça fonctionne

sysblock.png

 

A partir de là je pense qu'on doit pouvoir dire que les infos que tu trouves correspondent aux ports physiques de ton contrôleur disque dans l'ordre.

 

[Edit] Dans le titre tu parles de câble et tu as tout à fait raison. J'ai eu beaucoup de pb de connexion/déconnexion avec des câbles SATA défectueux. Une fois que tu as trouvé le fameux disque, je serai toi je changerai aussi le câble, juste pour être sûr [/Edit]

Lien vers le commentaire
Partager sur d’autres sites

Ca confirme ce que je vient de regarder sur gsmartcontrol

184 End-to-End_Error        0x0033   001   001   099    Pre-fail  Always   FAILING_NOW 146 

Je connaissait pas /sys/block/sdX Merci :)

root@serv_debian:~# ls -la /sys/block/sdalrwxrwxrwx 1 root root 0 déc.  25 14:50 /sys/block/sda -> ../devices/pci0000:00/0000:00:14.4/0000:03:06.0/ata2/host1/target1:0:0/1:0:0:0/block/sda

Je vais tenter un changement de cable a chaud, mais j'y croit pas beaucoup :pleure:

Lien vers le commentaire
Partager sur d’autres sites

[Edit] Dans le titre tu parles de câble et tu as tout à fait raison. J'ai eu beaucoup de pb de connexion/déconnexion avec des câbles SATA défectueux. Une fois que tu as trouvé le fameux disque, je serai toi je changerai aussi le câble, juste pour être sûr [/Edit]

 

Et bien :incline: !

En lisant le fil, je me suis demandé si un problème aléatoire de refus de boot d'un de mes vieux PC ne venait pas d'un câble Sata pourri.

J'avais démonté, nettoyé, testé, interverti à peu près tout, mais pas les câbles SATA.

Bingo : un était en court-circuit quand on le bougeait, juste un poil, mais suffisamment pour boguer la machine au complet.

J'avais jamais rencontré le cas, maintenant je vais surveiller la qualité des câbles que j'achète.

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...