More from: linux

時計が進まない?????

ここ数日サーバの一台でトラブルが続いている。
一部のサービスがいきなり止まってしまうようで、クライアントからのアクセスを拒否するようになってしまう。
このサーバは最近マザーボードのキャパシタが壊れてしまったので、応急処置として他のPCのマザー(チップセットは同じもの)を入れたところ、その数日後から現象が出るようになった。

止まるサービスが一つならばそのサービスを見直せば良いのだろうが、複数のサービスが止まってしまう上、これまで全く問題無く動作していたqpopperまでが接続を拒否するようになってしまったので訳が判らない。
不思議なことにtelnetやsshのサービスは動作するので、外部からログインして操作することは可能。

最初に「おかしいな?」と思ったのは時計が進んでいないこと。
dateコマンドで時刻を見ると12時間以上遅れていたので、正しい時刻に合わせてもそこから時刻が進まない、それどころか時刻が戻っては進むというのを繰り返してしまう。
マザーボード上の電池が消耗しているのは判っていたので、交換して起動したところ問題無く動作を始めたが、その二日後にまた同じ現象でサービスが止まってしまった。
今度は再起動だけで済んだが、電池の消耗が原因ではなかったということが判明した。
うーん、何が原因なのだろう?交換したマザーが関係しているとは思うけど、なにをどうすれば解決できるのだろう?
カーネルの時計関係の部分が交換したマザーの時計モジュールに対応していないのかな?

←クリックしてくれると嬉しいです。

サーバが止まってた(爆)

今朝職場に着いて掃除をしていたら、内線で「サーバが1台止まってます」との連絡が来た。
とりあえず部下に電源ユニットを持たせて現地に行かせたが、電源ユニットの障害では無かった。
そうなるとマザーかCPU辺りの故障となるが、生憎代わりになるマザーが無いので、HDDの壊れたPCからマザーを摘出して交換した。
このマザーはメーカー製PCに入っていたものなので、フロントパネルのコネクタが独自設計でピンアサインが判らない(ボード上のシルク印刷も無い)。
少なくとも電源SWを接続するピンが判らないと困る(電源を入れられない)ので、フロントパネルから延びているケーブルに付いているコネクタの導通をテスタでチェックして電源SWとリセットSWのピンを特定した。
HDD-LEDのピンは外部から見ても判ったので、こちらは問題なく接続できた。

後は死んだサーバに入っていたHDD2本を移植したところ無事にOS(Linux)が起動してきたが、パーティション1つが見つからないというエラーでOSの起動が完了しない。
これはHDDを接続しているIDEチャネルを間違えた為で、正しく接続し直したところ今度はきちんと起動した。

これでめでたしめでたしと思ったが、危惧したとおりネットワークアダプタが認識されない。
/etc/sysconfig/network-scripts/にあるifup-ethXを使ってもエラーになってしまうので、どうも正しいドライバが入っていないようだ。
そこで古いチップを使ったPCIのカードを用意して取り付けたがやはり起動時にLANに接続できない。
lsmodで見るとドライバはモジュールとして組み込まれているので、ifup-ethXを手動で動かすとLANに接続できるようになったので一安心。
その後もルーティングの設定がstatic-routesに記述してあるようにはならなかったり、名前解決が出来なかったりしたが、それぞれ手動で設定して、どうにか業務に復帰させることが出来た。

それにしても休みの日の夜に止まらないで欲しいよなぁ(笑)。

#後で壊れたマザーをチェックしたところ、CPU周りのキャパシタが液漏れを起こしていたので、マザーの障害ということだったようだ。

←クリックしてくれると嬉しいです。

sambaでの接続が回復した・・・・・・・

しばらく前からsambaでアクセス出来ないと言われて預かっていたサーバで、ようやくアクセスが可能になった(と思う)。
正確には起動直後はアクセス可能なのだが、時間が経過するとアクセスが遮断されるようになっていた。
いろいろ調べていてlog.nmbdを見るとマスターブラウザになろうとしてなれないというエラーが出ていた。
同じセグメントにはWindowsサーバもあり、そちらがマスターになっているようでリクエストを遮断しているように思えた。
まぁマスターブラウザにする必要も無いので、smb.confを修正してマスターブラウザにならないようにしたが、それでもエラーは出ていたが、とりあえずこの件は無視。

http://www.samba.gr.jp/ にあった文書を参考に、
smbclient -L サーバ名
でlinuxサーバ自身から接続しようとすると
Receiving SMB: Server stopped responding
session request to “サーバ名” failed (Call timed out: server did not respond after 20000 milliseconds)
とタイムアウトを起こしてしまいアクセス出来無い。
さらにsambaのログにも残らないので、これはリクエストがsmbdに渡っていないということだ。

そこで
netstat -a
コマンドでnetbios-ssn ポートが「LISTEN」状態になっているかを確認すると、それさえ表示されない(あれ?)。
ps -ax
でプロセスを確認すると
smbd -D
は動いているから、その前になにか障害があるようだ。

気になったのは
/var/log/samba/log.nmbd
に停止時のログとして
Packet send failed to 192.168.122.255(138) ERRNO=無効な引数です
というエラーが記録されているが、こんなIPアドレスを設定した覚えは無い。

nmbdが正しく動作しているかを確認するために、
nmblookup -B “サーバ名” __SAMBA__
を実行すると、正しいIPアドレスが帰ってくるから少なくともnmbdは動作していて、リクエストも受け取ってくれている。

次にクライアントのアドレスも返してくれるか、
nmblookup -B 192.168.xxx.255 “クライアントPC名”
を実行すると、こちらもIPアドレスが帰ってくる。

さらにブロードキャストへの応答を確認しようと
nmblookup -d 2 ‘*’
を実行したところ、
added interface virbr0 ip=192.168.122.1 bcast=192.168.122.255 netmask=255.255.255.0
added interface eth0 ip=xxx.xxx.xxx.xxx bcast=xxx.xxx.xxx.255 netmask=255.255.255.0
querying * on 192.168.122.255
Got a positive name query response from 192.168.122.1 ( 192.168.122.1 )
192.168.122.1 *<00>
と出力された。

interfaceのeth0は設定してあるが、もう一つの”virbr0″というのは設定した覚えは無い。
ところがこのIPアドレスには見覚えがある。
そう!log.nmbdにあった謎のブロードキャストアドレスと同じネットワークのアドレスだ。
そもそも”virbr0″というinterfaceは設定していないのだが、何故に出て来ているのだろうと思って、”virbr0″でググって見ると、どうも(XENとかで使う)ヴァーチャルマシン用のブリッジデバイスのことらしい。
この”virbr0″というinterfaceはlibvirtをインストールすると勝手に作られるらしく、どうもこれが本来のeth0の邪魔をしている感じだ。

/sbin/ifconfig
でネットワークの設定を見ても立派にネットワークインターフェースとして設定されている。
なので、このインターフェースを
/etc/sysconfig/network-scripts/ifdown virbr0
として止めようとしたが、
使い方: ifdown <デバイス名>
と出てしまい止められない(そりゃそうだ、実在のデバイスでは無いのだから)。

XENをインストールした覚えは無いが念のため
ps -ax | grep xen
としてみたが、当然ながら何も出てこない。
やけっぱちで
ps -ax | grep vir
としてみたら、
2189 ? S 0:00 libvirtd –daemon
というのが出てきたでは無いか。
仮想マシンを使うつもりは毛頭無いので、これを動かす必要も無く、早速止めることにした。

止めるには
/etc/rc.d/init.d/
の下にある”libvirtd”スクリプトを使えば良く、
/etc/rc.d/init.d/libvirtd stop
で簡単に止まった。
そうしたところ、virbr0というインターフェースは消滅し、smbclientでの接続も可能になり、クライアントPCからの接続も可能になった(はぁー、長かった・・・)。
ただ、このままではサーバの起動時に自動でlibvirtdが起動してしまうので、
/sbin/chkconfig –level 345 libvirtd off
として、自動起動を止めた。
しっかし、なんでlibvirtなんて入っていたのかなぁ?

←クリックしてくれると嬉しいです。

CUPSの設定が?

職場でプリンタサーバにしているサーバが挙動不審になってきた(Windows機からプリンタへ接続出来なくなってきた)ので、別のサーバにプリンタを追加してプリンタサーバとしても使うことにした。
プリンタを追加するにはCUPSの設定を変更して(というか全くの未設定状態なので)、まずは外部のPCからブラウザ経由で設定できるようにしなくてはならない。
デフォルトでは外部から設定画面へのアクセスを拒否するようになっているので、「サーバのIPアドレス:631/」でアクセスしても「403 Forbidden」となってしまうが、2009/10/31の記事「CUPSの設定」のように設定ファイルを修正すればアクセスが許可される。
実は最初
Order deny,allow
の行を反対の順番
Order allow,deny
と書いてしまっていて、いくら試しても拒否されてしまった。
あとはsambaの設定にプリンタの公開を追加したところ、なんとかWindowsのクライアント機からの印刷が可能になったが、少々エラーが出るので、さらに調査中。

←クリックしてくれると嬉しいです。

mountできないディスク

一度強制的にumountした後、再mountが出来なかったディスクだが、fsckでチェックしても新たなエラーは発見できないにも関わらず相変わらずmount出来ないままだった。
mountしようとすると、
「既にマウントされているか、使われています」
というようなメッセージが出てしまう。
クライアントがftpでのアップロード先として使用するディレクトリと、httpdのDocument Rootを含んでいるパーティションなので、そのどちらも稼動しないようにしていたが、意外なところにディレクトリを使用しているプロセスがいた。
なんとsmbdが問題のパーティション上のディレクトリをクライアントに対して公開していた。
それまでfsckでチェックしても最初以外エラーも出なかったので、意を決してディスクのセクターチェック(e2fsckを-cオプション付きで実行)まで実行してみたが、それでも特にエラーは出なかった。
もしかしてシステムのログになにか出てないかと思って/var/log/messagesを見たところ、sambaからのメッセージが出ていたのでそこで初めてsambaを使っていたことに気付いた。
すぐにsmbdを止めてmountを実行すると問題なくmount出来、中のファイルを見ることが出来るようになった。
普段はファイルサーバとしては使っていないサーバだったので、sambaのことをすっかり忘れていて思わぬ時間を取られてしまった。

←クリックしてくれると嬉しいです。

強制的にumount

Linuxサーバーのファイルシステムがroになったので、rwにしようとしてumountコマンドでマウントを解除しようとしたが、busyになってしまってumountできないので、強制的にumountした。
やりかたをメモ
umount ‘マウントポイントorデバイスファイル名’ -l (LAZYオプション)
これで強制的にマウント解除できたが、再度マウントすると中身が何も見えない状況。
ファイルシステムにエラーがありそうなので、
fsck ‘デバイスファイル名’
でチェックすると
”contains a file system with errors, check forced.”
のメッセージが出たので、やはりエラーが有り一応修復されたらしい。
どうもディスクそのものにエラーがあるみたいだなぁ、、、、、、、

←クリックしてくれると嬉しいです。

設定が終わった筈なのに・・・・・・・

一昨日設定をしたサーバーを現地に設置したら何故か必要なサービスが動作しない・・・・・・
設置に行った部下からの連絡では起動直後にはXが正常に起動しなかったらしい(Xか?それともGNOMEか?)。
sambaが機能しないのでログを見るとCUPSに接続しようとしてはじかれている(デフォルトの631番ポートに接続しようとして失敗している)。
CUPSのポートを変更していたのを元に戻しても状態は改善されないので、結局再度回収ということになってしまった。
変えたのはネットワークパラメータだけなので、そこらへんに原因があると思うのだが・・・・・・・・

←クリックしてくれると嬉しいです。

サーバー設定完了

朝から取り掛かっていたサーバーの設定はとりあえず完了した。
提供するサービスは多くないが意外と手間取ってしまった。
CUPSの設定画面を他のPCから使えるようにしたり、ポート番号をデフォルト(631)以外にしたりするのに戸惑った。
こんな時はネットが便利だなー、ちょっと検索するだけで情報が集まるのだから。
後はFTPサーバーの設定でアクセスを拒否されるのを直した程度。
今回のサーバーはFTPサービスをxinetd経由で起動するので、「/etc/vsftpd/vsftpd.conf」ファイル中の「Listen=YES」を「Listen=NO」に書き換え、さらにtcp_wrappers経由でアクセス制限をするために「/etc/hosts.deny」「/etc/hosts.allow」の2つのファイルに修正を加えた。
そうそう、「/etc/xinetd.d」ディレクトリに「vsftpd」ファイルを他のサーバーからコピーしてきた。
これが無いとxinetdがvsftpdを起動してくれない。
これで必要なサービスを提供できそうなので、後は現地に設置してくるだけだな。

←クリックしてくれると嬉しいです。

sambaで接続できないサーバー

部下にファイル&プリンタサーバとして使うLinuxサーバーを一台仕立てさせたが、クライアントPC(Windows Xp or 7)から接続できない。
他の案件がいろいろあって手をつけずにいたがようやく落ち着いてきたので、ちょっと設定を手伝うことにした。
#つーか自分で出来ないからやってくれと頼まれた(苦笑)。
まずサーバを起動してsmbが動作しているかを見てみるとプロセスがいない。
あれ?と思って「/sbin/chkconfig –list | grep smb」で起動設定を見るとランレベル2-5はonになっている。
sambaサービスは起動されているはずなのだが、動いていないのでX上のsmb設定ツールを起動して設定を確認してみると、多少設定に(システム上ではなく運用上の)問題があったので修正してサービスの再起動をしようとしたところ、SElinuxからの警告が出た。
なんてことはない、SElinuxが有効になっていたのでサービスの起動が出来ず、外からのアクセスも制限されていただけだった。
「/usr/sbin/getenforce」でSElinuxの状態を確認すると「Enforcing」と出たので、間違いなくSElinuxが有効になっていた。
とりあえず一時的にSElinuxを無効化するために、「/usr/sbin/setenforce 0」を実行してSElinuxの動作を止め(実際には「permissive(警告は出すがアクセス制限はしないモード)」になるだけで、完全には無効にはなっていない)、クライアントからの接続を試したところ無事に接続できた。
やはりSElinuxが動作していたのが原因だったようなので、動作させないように設定することにして、
「/etc/sysconfig/selinux(/etc/sysconfig/selinux/configへのシンボリックリンク)」という設定ファイルの中の
SELINUX=enforcing
となっている行を修正し、
SELINUX=disabled
に変更し、再起動するとSElinuxは無効化されていて、クライアントからの接続も問題無く可能になっていた。

←クリックしてくれると嬉しいです。

TCPパケットを送出していないわけではなかった、、、、、、

先日ここに書いた特定のサーバーにTCPパケットを遅れないサーバーにhping2をインストールして調べたところ、TCPパケットの送出は出来ていた。
出来ていたというか、きちんと応答パケットが来ていた。
SYNフラグを立てて80番ポート宛になるようにオプションで指定しても、きちんとACKが返って来ている。
tcpdumpでパケットをキャプチャしてもackフラグが立ったパケットをキャプチャ出来るので、間違いなく相手先サーバーから返事が返って来ている。
とすれば、何故telnet等で80番ポートに接続できないのだろうか?謎は深まるばかりだ・・・・・・

←クリックしてくれると嬉しいです。