...

問題判別とヒント 1 Edge Components V7 ガイド

by user

on
Category: Documents
246

views

Report

Comments

Transcript

問題判別とヒント 1 Edge Components V7 ガイド
Edge Components V7 ガイド
問題判別とヒント
1
Agenda
„
„
„
„
まず確認すべきサイト
Load Balancer構成の注意点
Windows環境の注意点
問題判別のための情報収集
2
2
まず確認すべきサイト
3
3
まず確認すべきサイト
„
Edge Components InfoCenter
‹
‹
„
TroubleShooting: EDGE Load Balancer for Version 6.0, 6.1, and 7.0
‹
‹
„
‹
‹
Technoteや既知の障害情報
http://www-306.ibm.com/software/webservers/appserv/was/support/
WebSphere デベロッパー・ドメイン
‹
‹
„
Load BalancerのiFix情報
http://www-06.ibm.com/software/jp/websphere/download/ifix/was/edge/
WASサポート・サイト
‹
„
トラブルシューティングのための基本情報集(英語)
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21321596
Edge Components Load Balancer iFix情報
‹
„
製品マニュアル
http://publib.boulder.ibm.com/infocenter/wasinfo/v7r0/index.jsp?topic=/com.ibm.web
sphere.edge.doc/welcome.html
日本語の技術情報や連載記事、ワークショップ資料
http://www-6.ibm.com/jp/software/websphere/developer/
テクニカル・サポート検索
‹
‹
過去のQA情報
http://www-1.ibm.com/support/jp/search/
4
4
Load Balancer構成の注意点
5
5
Load Balancer と NTP
„
Load BalancerマシンではNTPを無効にすることを推奨
‹
‹
„
HA構成時に、ハートビートにより相互監視を行うロジックの中でシス
テム時間が使われており、NTPにより時間の調整が行われると、予
期せぬテイクオーバーの原因となることがあります
NTPをやむを得ず使用する場合には、sleuthモードで許容される時間
の変更幅を0.1秒以内に設定し稼動させるようにしてください。また、
それでも問題が発生した場合には、Best Effortでのサポートとなりま
す。なお、問題判別のために、NTPを停止した状態で再現テストを実
施していただく必要がありますのでご注意ください
予期せぬテイクオーバーへのその他の対処方法
‹
Heartbeat間隔を広げ、 Heartbeatの断絶の可能性を減らす
¾
¾
‹
Heartbeatを2重化し、Heartbeatの断絶の可能性を減らす
¾
„
dscontrol executor set hatimeout <断絶を許容する秒数(デフォルト2)>
広げすぎると障害発生時の検知が遅くなりますので注意が必要です
Heartbeatを2重化した際にはReachabilityの設定が必要になります
詳細はノートのリンク先をご確認ください
6
Network Time Protocol support with WebSphere Edge Components
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21178386
6
Load Balancer と NIC チーミング
„
Load BalancerマシンではNICのチーミングはサポートされま
せん
‹
‹
„
„
Fault Tolerance(フェイルオーバー構成)とPort Aggregation(アクティ
ブ-アクティブ構成)のネットワーク構成がサポートされないことがシス
テム要件に明記されています
Windows teaming、Linux bonding、AIX NIB(Network Interface
Backup)などがこのネットワーク構成に該当します
NIC障害に関しては、Load Balancerがテイクオーバーし、
バックアップ機が処理を行う事で可用性を確保します
詳細はノートのリンク先をご確認ください
7
【注意事項 - Edge Components Load Balancer V6.1/V7.0】サポート情報の更新について (WAS09-025)
http://www-06.ibm.com/jp/domino01/mkt/cnpages1.nsf/page/default-000A6F6C
7
Load Balancer と仮想化テクノロジー
„
„
WAS製品はAIXのDLPARやVMwareといった仮想化テクノロ
ジーを一般的にはサポートしています
ただし、Load Balancerのようなカーネルに依存する製品につ
いては、特別の考慮事項が必要です
‹
‹
‹
„
Load Balancer製品は仮想化環境でテストされているわけではないた
め、必ず、テスト環境で十分なテストを実施して下さい
問題が発生した場合、仮想化環境ではない環境で同様の問題が発
生するか、テストを依頼する場合があります
Load Balancerの正副機を物理的に同一のマシンに配置すると、マシ
ン障害時のケースではSingle Point of Failureとなりますのでご注意く
ださい
詳細はノートのリンク先をご確認ください
8
仮想化テクノロジーに対するサポート
http://www-06.ibm.com/software/jp/websphere/support/virtualization/
Virtualization support for WebSphere Application Server Network Deployment Load Balancer
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21265712
8
IHS/WAS 以外のサーバーへの割り振りについて
„
„
基本的にLoad BalancerはWAS環境への振り分けを行う製品
です
WAS環境以外への振り分けもサポートされますが、WAS環
境の場合でも同一の問題が発生することが前提となります
‹
„
HTTP/HTTPS以外のプロトコルについても、技術的に振り分けは可
能ですが、やはりWAS環境でも同一も問題が発生することがサポー
トの条件となります
詳細はノートのリンク先をご確認ください
9
Support of Edge Components of IBM WebSphere Application Server V6.0.2 and V6.1
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21305987
IBM WebSphere Application Server Network Deployment V 7.0 license agreement
http://www03.ibm.com/software/sla/sladb.nsf/displaylis/F28DEEC36644E9FE002574BF0060D8E8
9
Windows 環境の注意点
10
10
メディア検出
„
ネットワーク障害の際に正常にTakeoverを行うためには、
Windowsの「メディア検出」機能を無効にする必要があります
‹
メディア検出を無効にしていない場合、ネットワークがリンクダウンし
た場合に、Windowsがそれを検知し、インターフェースからIPアドレス
が除去されてしまいます
C:¥Documents and Settings¥Administrator>ipconfig
Windows IP Configuration
Ethernet adapter ローカル エリア接続:
Media State . . . . . . . . . . . : Media disconnected
C:¥Documents and Settings¥Administrator>
‹
dscontrolコマンドはdsserverと通信しますが、IPアドレスが除去され
てしまっていると正しく通信ができません
C:¥Documents and Settings¥Administrator>dscontrol
java.rmi.ConnectIOException: Exception creating connection to: 9.188.198.196; ne
sted exception is:
java.net.NoRouteToHostException: No route to host: connect
エラー: サーバーが応答していません。
11
C:¥Documents and Settings¥Administrator>
11
メディア検出の無効化
„
メディア検出を無効化の設定はレジストリエディタにより行い
ます
‹
レジストリ エディタ (Regedt32.exe) を使用して、レジストリにある次の
キーを表示します
¾
‹
HKEY_LOCAL_MACHINE¥System¥CurrentControlSet¥Services¥Tcpip¥Paramet
ers
次のレジストリ値を追加し、コンピューターを再起動します
¾
¾
¾
値の名前 : DisableDHCPMediaSense
データの種類 : REG_DWORD -Boolean
値のデータ範囲 : 0、1 (False、True)、デフォルト値 : 0 (False)
12
Windows で TCP/IP のメディア検出機能を無効にする方法
http://support.microsoft.com/kb/239924/ja
12
TCP/IP オフロードと RSS
„
TCP/IPオフロードやRSSが有効になっていると、LBが正常
に機能しない場合があるため、無効化する必要があります
‹
TCP/IPオフロードはパケットのチェックサムの計算などをOSではなく
ネットワーク・アダプターで行う機能です
¾
‹
‹
„
製品によって異なる名称で呼ばれますのでご注意下さい
RSSは複数CPUでパケットの処理を分散して行う機能です
対応したネットワーク・アダプターを使用しているコンピューターに
Windows Server 2003 Service Pack 2(SP2)またはWindows Server
2003 Scalable Network Pack(SNP)をインストールすると、これらの
機能が使用可能になります
Broadcom社製ネットワーク・アダプターを使用している場合
‹
‹
Ethernet@Wirespeed機能も同様に問題を引き起こす可能性がありま
す
この機能が使用可能なアダプターを使用している場合、無効に設定
して下さい
13
13
TCP/IP オフロードと RSS の無効化
„
以下のいずれかの方法で無効化します
1.
2.
3.
ネットワーク・アダプター・ドライバーのReceive Side Scalingおよび
TCPオフロードを手動で無効にする
レジストリでRSSおよびTCPオフロードを手動で無効にする
SNPをオフにするWindowsの修正プログラムをインストールする
例)Broadcom
9
IPv4 Checksum Offload
9
IPv4 Large Send Offload
9
Receive Side Scaling
など
例)Intel
9
TCPセグメンテーションのオフロード
9
受信IPチェックサムのオフロード
9
受信TCPチェックサムのオフロード
9
送信IPチェックサムのオフロード
9
送信TCPチェックサムのオフロード
など
14
Windows Server 2003 ベースおよび Small Business Server 2003 ベースの既定の SNP 機能をオフ
にする更新プログラム
http://support.microsoft.com/kb/948496/ja
14
TCP/IP フィルタリング
„
LBは割り振り先サーバーのヘルスチェックにpingも使用して
います。このため、ICMPプロトコルが許可されている必要が
あります。IP プロトコルの Protocol 1(icmp) が許可されてい
ることを確認してください
15
15
アダプタとバインド
„
割り振り先サーバーでMicrosoft Loopback Adapterをインス
トールした場合、ネットワーク・アダプターの優先順位を確認
してください
‹
‹
MAC転送の割り振り先となるWindowsサーバーでは、ループバック・
アダプターをインストールしますが、このアダプターの優先順位が通
常のネットワーク・アダプターよりも高い優先順位になっていると、
ルーティングに問題をもたらします
ループバック・アダプターに対応する接続の優先順位を一番下にして
ください
ループバックに対応するアダプタの
優先順位を一番下にする
16
16
Load Balancer の問題判別に必要な情報
17
17
Load Balancer の問題判別に必要な情報
1.
現行構成ファイル
‹
‹
dscontrol file save <ファイル名>
以下の箇所に指定したファイル名で保管される
¾
2.
スクリプトファイル
„
以下のディレクトリにあるserverDownなどのスクリプトファイル
¾
3.
<EDGE_ROOT>/ulb/servers/bin
Load Balancerの詳細バージョン
‹
‹
‹
‹
4.
<EDGE_ROOT>/ulb/servers/configurations/dispatcher
以下の方法で確認
[AIX] lslpp –l | grep ibmulb
[Linux] rpm -qa | grep ibmulb
[Windows] dscontrol executor report
Javaの詳細バージョン
‹
java -version
18
18
Load Balancer の問題判別に必要な情報
5.
LBと割り振り先サーバーのネットワークインターフェース設
定情報
‹
[Unix] ifconfig -a
[Windows] ipconfig –all
bronze:[/]# ifconfig -a
en0: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,
64BIT,PSEG,CHAIN>
inet 9.188.198.215 netmask 0xffffff00 broadcast 9.188.198.255
inet 9.188.198.214 netmask 0xffffff00 broadcast 9.188.198.255
lo0: flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT>
inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255
inet6 ::1/0
tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1
6.
LBと割り振り先サーバーのルーティング・テーブル
‹
7.
[Unix] netstat –rn
[Windows] route print
LBと割り振り先サーバーの接続テーブル
„
[Unix] netstat –an
[Windows] netstat –an
19
19
Load Balancer の問題判別に必要な情報
8.
各種ログ
„
‹
‹
ログ・レベルを5に設定します
ログ・サイズも適切に設定します
server.log
¾
¾
‹
manager.log
¾
¾
‹
¾
dscontrol manager reach set loglevel 5
dscontrol manager reach set logsize unlimited
アドバイザー・ログ
¾
¾
‹
dscontrol manager loglevel 5
dscontrol manager logsize unlimited
reach.log
¾
‹
dscontrol set loglevel 5
dscontrol set logsize unlimited
dscontrol advisor loglevel <アドバイザー名> <ポート> 5
dscontrol advisor logsize <アドバイザー名> <ポート> unlimited
ログの出力先
¾
<EDGE_ROOT>/ulb/servers/logs/dispatcher
20
20
Load Balancer の問題判別に必要な情報
9.
ネットワーク・トレース
‹
最終的にログなどから問題が切り分けることができない場合は、
ネットワーク・トレースを採取
¾
¾
¾
‹
[AIX] iptrace -a -b <出力ファイル名>
[Linux] tcpdump -w <出力ファイル名>
[Windows] Wiresharkなどパケット・トレース・ツールを使用
IPトレースの使用法については以下を参照
¾
http://publib.boulder.ibm.com/infocenter/pseries/index.jsp?topic=/com.ibm.aix.d
oc/cmds/aixcmds3/iptrace.htm
21
21
(参考)Wireshark
„
様々なOSで使用可能なネットワークモニタリング・ツール
‹
http://www.wireshark.org/からダウンロード可能
22
22
Fly UP