More from: サーバ

さてと、パーティション構成をどうするかな?

職場のファイルサーバ用に外付けHDDユニットを買ってきたけど、どのように分割するかで悩んでいる。
スペース効率を考えると1つの大きなパーティションだけを作って、その中に各部門用のディレクトリを作れば無駄なく使えるんだけど、そうすると特定の部門が大容量のデータを置いてしまい、他の部門で使える容量が減ってしまう危険がある。
かといって細かく分割すると空きが点在する形になり、効率が悪くなる。
うーん、どうしようかなぁ?
とりあえず、自分達用のパーティションだけは最初に確保しようっと(爆)。

fdisk->mkfsの順だっけか?(爆)
fstabも書き換えなくては・・・・・・・・・

←クリックしてくれると嬉しいです。

メールは受信するものだよね(笑)

職場でとあるユーザーから、
「特定のお客様(10人中6人くらい)からのメールが届かない。他の人のところには届いているが、私のところには来ない。おかげでお客様に怒られた。どうしてくれるんだ。(多少脚色あり)」
というクレーム(?)があった。
考えられる原因は複数あるので、調査するために部下を現場に行かせて送信元のメールアドレスや送信日時等を調べさせた。
戻ってきた部下に調査結果を聞くと、
「受信できないアドレスは1つだということです。そのアドレスと日時はメールで送っておきました。」
とのこと。
おいおい、10人中6人じゃなかったのかよ?と心の中で突っ込みをいれ、早速調査に取り掛かった。
サーバのログを見てみると問題のアドレスからのメールは問題無く届いており、問題のPCに設定しあるアカウント宛に配信されていることが判明。
ということはPC側の受信動作に問題がある可能性が高くなったので、popのログを見るとなんと問題のメールの受信時以降は一度もpopアクセスのログが見当たらない。
え?これって、もしかすると一度もメーラで受信動作をしていないのか?
という疑いが強まったので再度部下に問題のPCを見に行かせると、案の定一度も受信動作をさせていなかったことが判明。
メーラで受信ボタンを押すと溜まっていたメール(実に約2か月分)が全て受信されて問題は解決したが、まさか本当に受信動作をさせていなかったとは思わなかった(笑)。
携帯のメールと違って勝手には送られてこないので、自分で(もしくはメーラの自動受信機能を使って)受信させなければならないということを説明しなくてはならなかった。
クレームをつけてきたユーザーは以前から同じメーラを使っていた筈なので、使い方を知らないとは思えないんだけどねー。
まぁ直属の上司に突っ込まれたとのことなので、こちらから突っ込みは入れなかったけど、同じことで二度と問い合わせて欲しくはないね(笑)。

←クリックしてくれると嬉しいです。

遅いHDD・・・・・・・

職場で使っているレンタルのサーバーの応答が異常に遅くなり、メールの配信が1時間遅れ、2時間遅れになってきたので、保守会社に連絡して調べてもらった。
各症状からHDDの故障と思われたが、syslogを見てもエラーは出ていないとのこと。
それでもI/Oウェイトが非常に多いとのことなので、HDDかRAIDコントローラの応答がかなり遅くなっていると思われたので、ハードウェアベンダーに連絡してHDD等を手配して貰い、手配が付き次第交換作業を行ってもらうことになった。
交換作業の前にDIAGを走らせて不調箇所を調べてくれたが、特にエラーになるハードウェアは無かったとのこと。
ただアクセスに非常に時間がかかるHDDがあったとのことなので、そのHDDを交換してRAIDのリビルドをしてくれた。
それらの作業が終わったとの連絡が来た後でメールの配信をしてみたが、作業前とは比べ物にはならないくらい応答が速くなったので、思ったとおりHDDの1本が全体の足を引っ張っていたようだ。
それにしても件のHDDは読み書きでエラーにこそならないが、リトライを繰り返していたのだろうか?
素直にエラーを吐いてくれたほうが原因究明が早く出来たんだけどなぁ(笑)。

←クリックしてくれると嬉しいです。

メモ:aliasのチェック

sendmailでaliasを使用している場合の設定のチェック方法のメモ。
#sendmail -bv alias名
これを実行すると指定したalias名がどのように展開されるかが分かる(-bvはベリファイモードの指定)。
aliasesファイル内に記述してあっても、上記コマンドで出て来ない場合は
#newaliases
でエイリアスデータベースを作り直してみる。

←クリックしてくれると嬉しいです。

-Fもしくは–flushオプションだったのね

一個前の記事「fetchmailで取得済みのメールを削除するには?」に書いたことは、-Fもしくは–flushオプションを付けてfetchmailを起動することで実現出来た。
man fetchmailでオプションを調べたときにこのオプションにも気付いてはいたんだけど、-kもしくは–nokeepと同じだと思っていた。
Manpageをよく読むと
-k or –nokeep
「取得したメッセージをリモートのメールサーバから削除します。」
-F or –flush
「新しいメッセージを取得する前に、古い (以前に取得した) メッセージをメールサーバから削除します。」
となっており、この二つの意味は違うことに気付いた(良く嫁!<自分)
試しに
fetchmail -Fv
を実行したところ、数千通ものメールがサーバから削除されていく様子を見ることが出来、終了後にホームディレクトリにあった「.fetchids」ファイルも消えていた。
うーん、最初にManpageを見たときに気付いていれば悩まずに済んだのになぁ(汗)。

#「.fetchids」ファイルは取得済みでサーバに残してあるメールのエントリを記録しているファイル。

←クリックしてくれると嬉しいです。

停電だあ?

今朝早く電話があり未明に停電があり復旧後も社内システムが使えないとのこと。
状況を聞くと午前3時頃から午前4時半頃まで停電し、復電後は端末の電源は入るが社内システムのサーバが応答してこないとのこと。
サーバの電源はUPSから取っているが流石に1時間半もの停電には対応できず、電源が落ちてしまったようだ。
いつもなら私が現場に行って対応するのだが、あいにく帯広にいてどんなに急いでも3時間以上かかるので、早朝だったが札幌にいる人間に電話をして対応を依頼した。
現場からの連絡によると大半のサーバは無事だったとのことだが、肝心のサーバを含め数台の電源が復旧していないとのこと。
それでも電源を入れただけで殆ど復旧したので助かった。
残った分は明日の朝の対応でも間に合うので、とりあえず復旧することが出来て一安心だ。

それにしても最近滅多に停電なんて無いのに、私が札幌を離れている時に起きるなんて間が悪いなぁ(汗)。

←クリックしてくれると嬉しいです。

LANカードがやられるとは”想定外”だった

今日の朝早くにビルの電気工事(点検?)が入るとかで、昨日の内に連絡が入った。
そのビルにはPCをベースにしたサーバを2台置いてあり、停電に備えてUPSを設置してあるが悪いことにバッテリーが寿命で交換用バッテリーを注文したばかり。
しかも停電予想時間が30分ほどなのでUPSに頼るわけにはいかない。
なので、昨夜の営業終了後にサーバー2台の電源を切りに行き、翌朝出勤してきた人に電源を入れるように頼んできた。
さらに2台の内1台は以前電源を再投入したときに素直に起動しなかったことがあるので、念のため電源を入れたら連絡して貰う様に頼んできた。
今朝になって電源を入れたとの連絡があったので、そのサーバに向かってpingを打ち始めたが20分以上経過してもpingが返ってこないので、これは起動途中でハマっているなと思い現地に行った。
現地に付いてコンソールを見ると恐れていたHDDのエラーは出ていなかったが、その代わりLANインターフェースが応答してこないとのエラーが出ていた。
つまりpingに対する応答が無かったのはLANカードが正しく動作していなかったためだったのだが、何故正しく動作していないのかは不明。
とにかくネットワークに繋がらないとサーバの存在する意味が無いので、代わりに同じ型番のLANカードを複数用意して再度現地に行き交換してみた。
用意したのが手持ちの中古品だったせいか最初に交換した1枚はドライバすらロードされず使えない状態。
少々焦ったが用意した別のカードに再度交換したところ無事にドライバがロードされネットワークにも接続できた。
今回トラブったサーバは全体的に古いもので、今でも動作していること自体が不思議なくらい。
#CPUがPentiumIIIの550MHzというくらい古いが、電源ユニット以外は無交換。
それでも稼働中は特に問題を起こさないのでそのまま使っていたが、まさか電源の再投入でLANカードが死ぬとは思っていなかった。
幸い同じLANカードが何枚か手元にあったので復旧させることが出来たが、今後はなんらかの対策を講じないとならないなぁ。

←クリックしてくれると嬉しいです。

48コア対応のマザー

サーバー用のマザーボードを発売しているSupermicroから48ものCPUコアに対応したマザーボードが発売になった。
このマザーボードは「H8QG6+-F」という製品で、12コアのOpteronを最大4個搭載可能になっているので、最大で48コア対応と言うことになる。
実売価格が約13万円と高価なうえ、搭載できるCPUも高価なので一般的とは言い難いが、「とにかく多コア!」という人には気になる製品だろう。
4基のCPUソケット(ソケットG34)と共に32基ものメモリスロットを備え、最大で512GB(DDR3 Registered ECCの場合、Unbufferedの場合は最大128GB)ものメモリを搭載できるもの凄い。
ストレージインターフェースはSATA2が6基と普通だが、それに加えて6Gbps SASが8基というのがいかにもサーバー向けといった感じ。
ともにRAID 0,1,10対応で、SASはオプションでRAID 5に対応との事。
サーバー向けと言うことでVGA出力用のチップがMatroxのG200という、ある意味鉄板とも言える仕様になっているのも面白い(久々にMatroxの名前を見た気がする)。

実際に触れる機会は無いと思うけど、フルにCPUとメモリを搭載したらどんなパフォーマンスを発揮するのか興味深いな。

http://www.supermicro.com/Aplus/motherboard/Opteron6100/SR56x0/H8QG6_-F.cfm(製品ページ)

←クリックしてくれると嬉しいです。

ネットワークの分離

職場のネットワークを分離するのに安いブロードバンドルーターを買ってきて試したが、あっさりと分離できてしまった。
単にルーターの設定で「アドレス変換をしない」「WAN接続はIPアドレスを手動で設定」の2点を設定しただけ。
あとは元のネットワーク上に存在するサーバ類にstatic routeを設定すれば今までどおりにサーバーへのアクセスも可能だし、プリンタへの印刷も問題なく行えた。
サーバーへのstatic route設定は最初に手動で行い、再起動後も設定がされるように設定ファイルにも書いておいた。
linuxでのroute設定は、
/sbin/route add -net 192.168.xxx.0/24(追加したネットワークアドレス) gw 192.168.yyy.zzz(ルーターのIPアドレス)
設定ファイルは
/etc/sysconfig/static-routes
なので、そのファイルに
any net 192.168.xxx.0 netmask 255.255.255.0 gw 192.168.yyy.zzz
の記述を追加すると、起動時に自動でルーティング情報が設定される。
もしもこのファイルが無ければ新しく作ればOK!

ちなみに今回使ったルーターはこれ。
BUFFALO BBR-4MG 有線BroadBandルータ BroadStation エントリーモデル
B0000DJLOE
2千円ちょっとで買えるけど、複雑なルーティングとかをせずに、単にネットワークを分離するくらいならばそこそこ使えると思う。

←クリックしてくれると嬉しいです。

先日止まっていたDNSサーバ

先週末の土曜日にサービスが止まっていたDNSサーバに駄目元でリクエストを出したらきちんと名前解決が出来た。
ということは、12/11はなんらかの理由で一時的にサービスが止まっていたということか?
ま、なんにせよ復活してくれて良かった良かった。
だけど、また止まったら困るので、参照順位は最後にしてあるけどね。

←クリックしてくれると嬉しいです。