ESXiサーバーのNICが不調2013年12月20日 20:09

ここ一週間くらい、名前解決に失敗する事象がときどき発生する。DNSサーバを動かしている、ESXiのネットワークが不調の様子。サーバーのNICのランプや、スイッチのLinkのランプを見ても異常は無い。ところが、ふと、pingも通らなくなる。vSphere Clientの管理画面から、NICの付け直しなどしてみるが改善せず。

無いとは思いつつも、ESXiの脆弱性のせいかとちょっと気になる。vSphere ClientでESXiのBuildをみると、新しいパッチも随分出ている。これを機にと、最新のBuildに更新したが、しばらくすると事象は再発。

ESXiネットワーク正常
vSphere Clientの管理画面から見た、正常なときの様子。仮想スイッチに2つのNICが繋がっている。


管理ネットの再起動
繋がらなくなり、コンソールから、管理ネットワークの復旧を試みる。ESXiは、コンソールからは、全体の再起動と管理ネットワークの再起動くらいしかできない。ネットワークの不調には手こずる。


ESXi ネットワーク不調
pingが通るようになったあと、改めて管理画面を確認すると、vmnic0がダウンしている。右の赤い×印。


ESXi イベントのログ
イベントのログも確認してみる。確かにダウンのイベントが記録されている。警告?レベルなのが気になる。チーミングしているので扱いが軽いのか。

さて、あらためて状況を考えると、素直に、マザーボード上のNICが壊れかけている、というのが妥当なところ。2010年の初めの導入だから、4年弱。ほぼ24時間稼働してきたのだから、壊れてもおかしくない時期ではある。部品の中では、ネットワークまわりは壊れやすい部位でもある。

そうなると、更改ということになるが、気持ち的には、AtomのC2000シリーズを待ちたいところ。今は、XeonのL3406 30Wで運用しているので、同じくらいの性能で、より低消費電力をねらってみたい。E3-1220Lv3 13Wというのも捨てがたいが、この世代のCPUはデスクトップで使っているので避けたい。その点、2014年早々にも搭載製品が出そうなC2750は、コアの数もクロックも魅力的だ。
※IntelのCPUスペックを探すのはこちらが便利
http://ark.intel.com/

必然的に、当面は、NICを増設してしのぐことになる。ところが、ネットワークインタフェースカードの入手性が随分と落ちている。標準で2つ搭載するマザーも増えていることだしやむを得ないところか。秋葉原のショップでも取り扱いが寂しい。そうなると、Amazonの出番となるが、ついにNICもロングテール商品か。

ESXiのパッチ適用をPowerCLIから行う2013年12月21日 22:01

ESXiの不調は、どうもNICらしいのだが、手当の過程で行ったパッチ適用をメモしておく。esxcliコマンドを用いるのだが、PowerCLIから行う手順を見つけるのは、少々苦労した。
※VMwareのコミュニティサイト他に情報はいくつかある

使用中のESXiのバージョンは、5.1。5.5にバージョンアップする手もあるのだが、変更点も多く、安定稼働中なので、今回は、パッチ適用にとどめる。

VMwareのサイトから、ISO版のファイルを落として、CDかUSBに設定すればいいのだろう、と思っていたら、パッチはZIPでの提供。大がかりな環境では、Update Managerを使うのだろうが、ESXiが1台の環境では、シンプルに済ませたい。esxcliコマンドからも実行できるようなので試す。
以前、無償版のvSphere Hyperviserでは、CLIからのバックアップは機能外とわかって残念な思いをした。パッチ適用は、無事に実施できるようだ。

普段使いのデスクトップには、vSphere PowerCLIをセットアップしてあるので、ここから実行する。あらかじめ、リモートのESXiサーバとの接続を確立しておく。ESXiサーバの方は、メンテナンスモードに移行しておく。


Get-ESXCli
最初に行うのは、esxcliコマンドをPowerCLIから呼び出すための設定。Get-ESXCliコマンドが提供されているので、使いやすいように別名を設定しておく。実行すると、使用できる機能一覧が表示される。


esx.software.vib
パッチ適用に使用するのは、softwareの先のvibの機能。一覧の中にupdateがある。
VIBは、ESXiでいうところのソフトウェアのパッケージのこと。


esx.software.vib.update
updateの引数は、9つ。省略はできない。設定しない箇所は、$nullで埋める。


vSphere Client Storage
vmwareのサイトからダウンロードしたZIPファイルは、ESXiサーバ上のストレージに格納しておく必要がある。管理用のPCのディレクトリを指示したら、そこじゃない、と怒られた。ESXiサーバ上のストレージに持っていくには、vSphere Clientでホストの構成のタブを選び、表示されるデータストアを参照すると、データストアブラウザが起動するので、ここからファイルのアップロードを行う。


vib update dryrun
ZIPファイルに含まれるパッチを全部適用するには、引数のdepotにZIPファイルを指定すればよい。個々のVIBを指定しないので、VIBを指定する引数は、$nullにする。最初は、dryrunを$trueで実行する。実際のパッチ適用はしていない旨と、適用するパッチの一覧が表示される。


vib update
問題が無いようなら、dryrunの引数を$falseにして実行する。updateに成功した、というメッセージが表示されて一安心。指示に従い、ESXiサーバを再起動する。


vSphere version
再起動終了後、vSphere Clientを起動して、バージョンを確認すると、Buildが上がっていることが確認できた。


esx.software.vib.list
適用したパッチの一覧は、listで表示できる。そうは思ったものの、数が多すぎて、確認しきれない。ここでは、引数にnullを忘れないのがポイント。

明日は有馬記念、前日の今日は中山大障害2013年12月21日 23:04


明日は有馬記念
明日は有馬記念。難しい競走なので、応援馬券で、ちょっとだけ参加する。以前は、大きな勝負もしたが、堅実な勝負は他のところで行った方がわりがいい。

・季節柄、体調管理が難しい
・ジャパンカップなどで激走して見えない疲れが溜まっていることがある
・近走不調だが、ここを目指して仕上げてくる馬がいる

有力馬が失速して、穴が開く理由はこんなところか。引退レースで久しぶりの勝利、なんて劇的な競走も生まれやすい。馬を見る目がないとこのあたり見抜けない。


中山大障害アポロマーベリック
そんな有馬記念の前日は、中山大障害。好きな競走の一つ。場内があたたかく盛り上がる。難所をクリアするたびに会場からは拍手。今日の優勝馬は、2番、アポロマーベリック。5番人気。五十嵐騎手は大障害は初勝利。レース序盤でベテラン13歳のメルシーエイタイムが落馬したのは残念だったが、好レース。


中山競馬場のツリー
この時期は、中山競馬場は、クリスマスの飾り付けもきれい。ツリーは、夜はライトアップされる。
それでは、明日は、radikoで実況を聴きながらといこう。

Weihnachtsoratorium2013年12月24日 20:40


Bach Weihnachtsoratorium
クリスマスには、クリスマスの曲を静かに聞く。お気に入りは、Dresdner Kreuzchor(ドレスデン聖十字架合唱団)のクリスマスオラトリオ(J.S.Bach)。はじめて聴いたころは、まだ東独だった。解説の日付は1976年。元来、クリスマスの日から新年にかけて演じるものとのことだが、まあ、一息に聴くのも許してもらおう。テノールのペーター・シュライヤーの福音史家の語りが好ましい。Kreuzchorには、マタイ受難曲の録音もあるが、そこでも福音史家を勤める。解説によると、ルカの福音書とマタイの福音書から、イエスの誕生にまつわる部分を歌詞に取り入れている。聖書の該当部分を開きながら聴くのもよい。


Schütz Weihnachtshistorie
J.S.Bachに遡ること、ほぼ1世紀前のHeinrich Schützにもクリスマスの曲がある。こちらもなかなかよい。Bachの曲がどちらかというとダイナミックなのに対し、厳かな感じ。

せっかくなので、Amazonで調べると、サン=サーンスにもクリスマスオラトリオがある。早速注文する。船便なので、到着は2月の上旬の見込み。ClassicやEarly Musicでは、日本のAmazonのほうが品揃えがよいことも多いが、今回はUSのAmazonの方が充実。

ESXiにNICを2枚追加2013年12月25日 07:46

ESXiのNICの調子が悪かったが、日に一度はダウンするようになり、増設を決断。年末年始にはまるのは避けたい。油断すると、だいたいトラブルはこの時期に発生する。出掛けていって店頭に在庫が無いといけないので、通販で頼む。到着は24日夕方。よく考えるとクリスマスイブ。配達の方には忙しいときに頼んで申し訳なかったかも。当日や翌日に確実に届けてもらえるのは、こういった機器故障のときには重宝するのだけど。

ESXi Network Adapters
NICを2枚追加したところ。何もせずともきちんと認識。マザー上のNICと同じコントローラでもあるし。実のところ、家に取り置きのPCIのNICを一度付けてみたのだが、認識せず。一昔前のIntel 82540EM。おそらくデスクトップでは問題ないはずだが、ESXiは対応ハードウェアが限られる。


ESXi vSwitch0
マザー上のNICは、仮想スイッチに接続せず、新規のNICを登録。チーミングを設定して一安心。一晩経ったが、問題なく稼働中。しばらく注視する。


Intel CT Adapter
追加したのは、Intel Gigabit CT Desktop Adapter。定番。2008年から息の長い製品。
チーミングを設定するので、サーバ用のデュアルポートと悩んだが、今回のマザーのように同時に2ポートが不調になるのはいやなので、あえて、2枚にする。

あと、改良するとなると電源まわりか。それなりの電源は積んでいるが、最近の80 PLUS GOLD/PLATINUMにすると、電力使用量は軽減できるのか。

再開、西葛西のやしま2013年12月26日 18:15


再開、西葛西やしま
地下鉄東西線橋脚の耐震工事のために、西葛西を離れていた立ち食いそばのやしまが再開していた。寒空の下、散歩の途中で立ち寄る。12月のはじめの頃だったよう。看板や箸入れなど、若干のリニューアル。さっそく、温かいそばを頼む。相変わらず、よいだしが効いている

それにしても、寒い中、熱いそばをすするのは、実においしい頂きかたなのではないか。だしの香る湯気に目の前を真っ白にしながら、一時の暖をとる風情がいい。杉浦日向子の江戸の本ではないが、当時の屋台の風景も斯様であったのでは、と思う。


ESXiでNICのTeaming2013年12月27日 06:48


Failover & Load-Balancing Option
ESXiにNICを2枚増設したが、Ciscoのスイッチで見てみると、Teamingがうまく機能していない。調べてみると、うまくいく設定は限られるようだ。上図がvSwitchのデフォルトポリシーに記載されたフェイルオーバーとロードバランシングの設定。

・ロードバランシング:IPハッシュ
・ネットワークの障害検出:リンク状態のみ

この2つの設定のみが許されるとのこと。
こちら、VMwareのKB。わかりやすくはあるのだが、落とし穴がある。


src-dst-ip
問題は、対応するCisco側の設定は何になるのか。ロードバランシングのIPハッシュは、上図のsrc-dst-ipの設定になる。この対応を見つけるのに苦労してしまった。


port-channel load-balance
使用しているSwitchは、src-dst-macが最初に設定されており、整合していなかった。デスクトップのIntel NICやQNAPのときは問題なかったのだが、ESXiは限定される。それにしても、用語はわかりにくい。IPハッシュから、どれが正解か導くのはちょっと難しい。


int g0
次は、interfaceの設定。上図は、port-channel 1 で束ねる2つのインタフェースの設定。channel-groupのmode設定がポイント。


channel-group mode
KBには、LACPと出てくるので、activeを設定したのが失敗。KBの設定例では、onを設定しているので、そのまま従うべき。activeでは、束ねようとするものの、結局、stand aloneに戻ってしまう。


show etherchannel protocol
設定後のetherchannelのprotocolとload-balanceの設定。


show etherchannel summary
こちらが、summary。無事設定完了。


ESXi NICのパフォーマンス
vSphere Clientのパフォーマンスのグラフ。トラフィックは小さいが、それぞれ働いているようだ。

KBは、わかりやすく書こうとしているが、熟知した人が書くと往々にしてこうなる、という記述。自戒自戒。

80 PLUS GOLD電源への交換2013年12月27日 08:42

サーバのNICメンテナンスに続き、電源もメンテナンスしてみる。年末は、この手の作業がしたくなる不思議な季節。

ablecom sp420-rp

玄人志向KRPW-SS350W

・交換前:Ablecom SP420-RP
・交換後:玄人志向 KRPW-SS350W/90+

Ablecomは、Supermicroのケースに付いてきた電源。サーバ用でそれなりに高性能なはず。今更ながら調べてみると2004年ころの製品。ケースはそのままに中身を取り替えてきたので意識しなかったが、10年ほど経つ。確かに交換してもいい頃合い。玄人志向は、まあ、80 PLUS GOLDで小容量のものがこのくらいしか見つからなかった。

電源については、2013年の初めにTom's Hardwareで興味深い記事があったのを覚えている。
製造者、設計者、製品のラベル表記、の関係についてである。要は、ブランド名で購入しても、製造者や設計者はまちまち。よい電源を手に入れたければ、よく見ないといけない、という話。玄人志向は、国産というわけでは無いが、以下の記事など共感できる。壊れることのある部品なので、入手性も大事。

電力使用状況の変化をUPSのモニタを使って確認する。

交換前の電力
電源交換前の状況。少々上下に変動する。落ち着いたところで見ると、出力電力は、270W。


交換後の電力
電源交換後の状況。255W。15Wほど、減じている。出力電圧が一定なのは、インバータ方式のUPSを用いているため。


対象を外したときの電力
UPSには、他にも装置が繋がっているので、電源交換対象のサーバのみ外してみる。200W。先ほどの数値から減じて、実際の効果をみる。

電源交換前:70W
電源交換後:55W
削減量:15W
交換前後の比率:約80%

15Wという数値自体は、それほど多くないが、比率の80%は期待以上。電源自体の容量が小さくなったことはあるが、動かしている機材は同じなので、それだけ効率が上がったと言える。古い機材を動かしている場合、高効率の電源に交換する意義はそれなりにあると言える。毎月の電気料金にどう反映されるかは、また別の問題。

なお、CPUは、Xeon L3406 TDP 30W。デスクトップの方は、同じように測ると66W。CPUは、Xeon E3-1275V2 TDP 77W。両方ともSSDだが、デスクトップは外付けのグラフィックカード(Quadro410)を載せている。こうみると、新しいCPUの電力制御が随分進んできたのが窺える。平穏に動かしているときは随分と省電力で済む。