今朝職場に着いて掃除をしていたら、内線で「サーバが1台止まってます」との連絡が来た。
とりあえず部下に電源ユニットを持たせて現地に行かせたが、電源ユニットの障害では無かった。
そうなるとマザーかCPU辺りの故障となるが、生憎代わりになるマザーが無いので、HDDの壊れたPCからマザーを摘出して交換した。
このマザーはメーカー製PCに入っていたものなので、フロントパネルのコネクタが独自設計でピンアサインが判らない(ボード上のシルク印刷も無い)。
少なくとも電源SWを接続するピンが判らないと困る(電源を入れられない)ので、フロントパネルから延びているケーブルに付いているコネクタの導通をテスタでチェックして電源SWとリセットSWのピンを特定した。
HDD-LEDのピンは外部から見ても判ったので、こちらは問題なく接続できた。
後は死んだサーバに入っていたHDD2本を移植したところ無事にOS(Linux)が起動してきたが、パーティション1つが見つからないというエラーでOSの起動が完了しない。
これはHDDを接続しているIDEチャネルを間違えた為で、正しく接続し直したところ今度はきちんと起動した。
これでめでたしめでたしと思ったが、危惧したとおりネットワークアダプタが認識されない。
/etc/sysconfig/network-scripts/にあるifup-ethXを使ってもエラーになってしまうので、どうも正しいドライバが入っていないようだ。
そこで古いチップを使ったPCIのカードを用意して取り付けたがやはり起動時にLANに接続できない。
lsmodで見るとドライバはモジュールとして組み込まれているので、ifup-ethXを手動で動かすとLANに接続できるようになったので一安心。
その後もルーティングの設定がstatic-routesに記述してあるようにはならなかったり、名前解決が出来なかったりしたが、それぞれ手動で設定して、どうにか業務に復帰させることが出来た。
それにしても休みの日の夜に止まらないで欲しいよなぁ(笑)。
#後で壊れたマザーをチェックしたところ、CPU周りのキャパシタが液漏れを起こしていたので、マザーの障害ということだったようだ。