Jump to content

Archived

This topic is now archived and is closed to further replies.

Krapace

DD ou cable ? Comment identifier le bon.

Recommended Posts

Bonsoir. Un soucis sur un DD dans mon serveur.

 

Vous vous en doutez je pourrais résoudre le soucis si je savait lequel, je n'ai pas trouvé de moyen de l'identifier.

 

J'ai 8 DD dans ce boitier et je voudrais éviter des heures et des heures de remplacement de cable, c'est un peu le bordel :transpi:

 

J'ai remarqué le soucis en faisant des copies sur le réseau. Les transferts montaient a 60-80Mo/s et puis coupaient pendant 30-40 secondes.

 

Quand je regarde /var/log/messages je suis floodé par ceci

ec 31 00:09:53 debian kernel: [640083.776604] ata2: hard resetting linkDec 31 00:09:53 debian kernel: [640084.095942] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:09:53 debian kernel: [640084.112422] ata2.00: configured for UDMA/33Dec 31 00:09:53 debian kernel: [640084.112478] ata2: EH completeDec 31 00:10:26 debian kernel: [640116.755766] ata2: hard resetting linkDec 31 00:10:26 debian kernel: [640117.075026] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:26 debian kernel: [640117.091481] ata2.00: configured for UDMA/33Dec 31 00:10:26 debian kernel: [640117.091532] ata2: EH completeDec 31 00:10:26 debian kernel: [640117.127429] ata2.00: configured for UDMA/33Dec 31 00:10:26 debian kernel: [640117.127473] ata2: EH completeDec 31 00:10:57 debian kernel: [640147.689516] ata2: hard resetting linkDec 31 00:10:57 debian kernel: [640148.008870] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:57 debian kernel: [640148.025329] ata2.00: configured for UDMA/33Dec 31 00:10:57 debian kernel: [640148.025374] ata2: EH completeDec 31 00:10:57 debian kernel: [640148.136494] ata2: hard resetting linkDec 31 00:10:57 debian kernel: [640148.452264] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:10:57 debian kernel: [640148.468729] ata2.00: configured for UDMA/33Dec 31 00:10:57 debian kernel: [640148.468772] ata2: EH completeDec 31 00:11:32 debian kernel: [640182.585967] ata2: hard resetting linkDec 31 00:11:32 debian kernel: [640182.905318] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:11:32 debian kernel: [640182.921769] ata2.00: configured for UDMA/33Dec 31 00:11:32 debian kernel: [640182.921828] ata2: EH completeDec 31 00:11:50 debian kernel: [640200.677540] ata2.00: configured for UDMA/33Dec 31 00:11:50 debian kernel: [640200.677597] ata2: EH completeDec 31 00:11:58 debian kernel: [640208.990191] ata2.00: configured for UDMA/33Dec 31 00:11:58 debian kernel: [640208.990209] ata2: EH completeDec 31 00:12:04 debian kernel: [640215.381524] ata2.00: configured for UDMA/33Dec 31 00:12:04 debian kernel: [640215.381551] ata2: EH completeDec 31 00:12:27 debian kernel: [640238.031442] ata2: hard resetting linkDec 31 00:12:27 debian kernel: [640238.349725] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:12:27 debian kernel: [640238.366215] ata2.00: configured for UDMA/33Dec 31 00:12:27 debian kernel: [640238.366258] ata2: EH completeDec 31 00:13:43 debian kernel: [640313.479602] ata2: hard resetting linkDec 31 00:13:43 debian kernel: [640313.798956] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)Dec 31 00:13:43 debian kernel: [640313.815421] ata2.00: configured for UDMA/33Dec 31 00:13:43 debian kernel: [640313.815472] ata2: EH completeDec 31 00:14:48 debian kernel: [640378.702986] ata2.00: configured for UDMA/33Dec 31 00:14:48 debian kernel: [640378.703031] ata2: EH complete

Et bien sur c'est aléatoire.

 

Un moyen d'identifier le DD en question histoire que je le change ? (si je trouve un spare evidement...)

Share this post


Link to post
Share on other sites

"Et bien sur c'est aléatoire."

 

Tu veux dire que selon les reboots c'est jamais le même ataX dans tes logs ? Tu as essayé de voir si tu pouvais relier le ataX à un UUID (commande blkid ? ou le dossier /dev/disk/by-uuid avec les liens symboliques pour faire le lien avec /dev/sdY)

 

J'imagine que les disques ont la même taille et qu'ils sont en RAID sinon tu saurais facilement dire qui est qui. MDADM du coup ? Quel version de Debian par curiosité ? Chez moi ça bouge pas, c'est numéroté de manière fixe à partir des numérotations des ports physiques de la carte mère (mais c'est Ubuntu et CentOS donc ...)

Share this post


Link to post
Share on other sites

Tout les DD sont en SATA. Et je ne reboot jamais ce serveur donc je pense que c'est toujours le meme DD qui mer**

 

Et mdadm ne m'aide pas beaucoup non plus :craint:

Personalities : [raid6] [raid5] [raid4] md1 : active raid5 sda[3] sdg1[2] sdf1[1] sdc1[0]      1464757248 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [uUUU]      bitmap: 1/4 pages [4KB], 65536KB chunkmd0 : active raid5 sdd1[3] sde1[4] sdb[5]      156113920 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [uUU]

Je pourrait etre tenté de dire que le ata2 est le /dev/sdg1 [2] mais il ya deux [3] donc je pense pas que ce soit ca.

Share this post


Link to post
Share on other sites

Je pense qu'on peut récupérer des infos sur le disque à partir de son UUID c'est pour ça que je te parlais de la commande blkid

 

Sinon, a priori tu peux relier les différentes notations ataX et /dev/sdY grace aux liens symboliques dans le dossier /sys/block (ll /sys/block/sd*); Sur mon Nas sous ubuntu ça fonctionne

sysblock.png

 

A partir de là je pense qu'on doit pouvoir dire que les infos que tu trouves correspondent aux ports physiques de ton contrôleur disque dans l'ordre.

 

[Edit] Dans le titre tu parles de câble et tu as tout à fait raison. J'ai eu beaucoup de pb de connexion/déconnexion avec des câbles SATA défectueux. Une fois que tu as trouvé le fameux disque, je serai toi je changerai aussi le câble, juste pour être sûr [/Edit]

Share this post


Link to post
Share on other sites

Ca confirme ce que je vient de regarder sur gsmartcontrol

184 End-to-End_Error        0x0033   001   001   099    Pre-fail  Always   FAILING_NOW 146 

Je connaissait pas /sys/block/sdX Merci :)

root@serv_debian:~# ls -la /sys/block/sdalrwxrwxrwx 1 root root 0 déc.  25 14:50 /sys/block/sda -> ../devices/pci0000:00/0000:00:14.4/0000:03:06.0/ata2/host1/target1:0:0/1:0:0:0/block/sda

Je vais tenter un changement de cable a chaud, mais j'y croit pas beaucoup :pleure:

Share this post


Link to post
Share on other sites

J'ai perdu un DD dans mes manipulations a l'intérieur du boitier :transpi:

 

C'est vraiment le bordel la dedans...8 DD avec alim+données ca en fait du cuivre !!

Share this post


Link to post
Share on other sites

J'ai perdu un DD dans mes manipulations a l'intérieur du boitier :transpi:

RIP !

Share this post


Link to post
Share on other sites

Non non ca va, j'ai reussi à le remplacer à chaud et la reconstruction du RAID s'est bien passée ;)

Share this post


Link to post
Share on other sites
[Edit] Dans le titre tu parles de câble et tu as tout à fait raison. J'ai eu beaucoup de pb de connexion/déconnexion avec des câbles SATA défectueux. Une fois que tu as trouvé le fameux disque, je serai toi je changerai aussi le câble, juste pour être sûr [/Edit]

 

Et bien :incline: !

En lisant le fil, je me suis demandé si un problème aléatoire de refus de boot d'un de mes vieux PC ne venait pas d'un câble Sata pourri.

J'avais démonté, nettoyé, testé, interverti à peu près tout, mais pas les câbles SATA.

Bingo : un était en court-circuit quand on le bougeait, juste un poil, mais suffisamment pour boguer la machine au complet.

J'avais jamais rencontré le cas, maintenant je vais surveiller la qualité des câbles que j'achète.

Share this post


Link to post
Share on other sites

Tcheu ce détérage de topic d'une année oO

 

:humour:

 

du coup finalement c'était que le disque ou le cable S-ata aussi?

Share this post


Link to post
Share on other sites

×
×
  • Create New...