Comments
Description
Transcript
問題判別とヒント 1 Edge Components V7 ガイド
Edge Components V7 ガイド 問題判別とヒント 1 Agenda まず確認すべきサイト Load Balancer構成の注意点 Windows環境の注意点 問題判別のための情報収集 2 2 まず確認すべきサイト 3 3 まず確認すべきサイト Edge Components InfoCenter TroubleShooting: EDGE Load Balancer for Version 6.0, 6.1, and 7.0 Technoteや既知の障害情報 http://www-306.ibm.com/software/webservers/appserv/was/support/ WebSphere デベロッパー・ドメイン Load BalancerのiFix情報 http://www-06.ibm.com/software/jp/websphere/download/ifix/was/edge/ WASサポート・サイト トラブルシューティングのための基本情報集(英語) http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21321596 Edge Components Load Balancer iFix情報 製品マニュアル http://publib.boulder.ibm.com/infocenter/wasinfo/v7r0/index.jsp?topic=/com.ibm.web sphere.edge.doc/welcome.html 日本語の技術情報や連載記事、ワークショップ資料 http://www-6.ibm.com/jp/software/websphere/developer/ テクニカル・サポート検索 過去のQA情報 http://www-1.ibm.com/support/jp/search/ 4 4 Load Balancer構成の注意点 5 5 Load Balancer と NTP Load BalancerマシンではNTPを無効にすることを推奨 HA構成時に、ハートビートにより相互監視を行うロジックの中でシス テム時間が使われており、NTPにより時間の調整が行われると、予 期せぬテイクオーバーの原因となることがあります NTPをやむを得ず使用する場合には、sleuthモードで許容される時間 の変更幅を0.1秒以内に設定し稼動させるようにしてください。また、 それでも問題が発生した場合には、Best Effortでのサポートとなりま す。なお、問題判別のために、NTPを停止した状態で再現テストを実 施していただく必要がありますのでご注意ください 予期せぬテイクオーバーへのその他の対処方法 Heartbeat間隔を広げ、 Heartbeatの断絶の可能性を減らす ¾ ¾ Heartbeatを2重化し、Heartbeatの断絶の可能性を減らす ¾ dscontrol executor set hatimeout <断絶を許容する秒数(デフォルト2)> 広げすぎると障害発生時の検知が遅くなりますので注意が必要です Heartbeatを2重化した際にはReachabilityの設定が必要になります 詳細はノートのリンク先をご確認ください 6 Network Time Protocol support with WebSphere Edge Components http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21178386 6 Load Balancer と NIC チーミング Load BalancerマシンではNICのチーミングはサポートされま せん Fault Tolerance(フェイルオーバー構成)とPort Aggregation(アクティ ブ-アクティブ構成)のネットワーク構成がサポートされないことがシス テム要件に明記されています Windows teaming、Linux bonding、AIX NIB(Network Interface Backup)などがこのネットワーク構成に該当します NIC障害に関しては、Load Balancerがテイクオーバーし、 バックアップ機が処理を行う事で可用性を確保します 詳細はノートのリンク先をご確認ください 7 【注意事項 - Edge Components Load Balancer V6.1/V7.0】サポート情報の更新について (WAS09-025) http://www-06.ibm.com/jp/domino01/mkt/cnpages1.nsf/page/default-000A6F6C 7 Load Balancer と仮想化テクノロジー WAS製品はAIXのDLPARやVMwareといった仮想化テクノロ ジーを一般的にはサポートしています ただし、Load Balancerのようなカーネルに依存する製品につ いては、特別の考慮事項が必要です Load Balancer製品は仮想化環境でテストされているわけではないた め、必ず、テスト環境で十分なテストを実施して下さい 問題が発生した場合、仮想化環境ではない環境で同様の問題が発 生するか、テストを依頼する場合があります Load Balancerの正副機を物理的に同一のマシンに配置すると、マシ ン障害時のケースではSingle Point of Failureとなりますのでご注意く ださい 詳細はノートのリンク先をご確認ください 8 仮想化テクノロジーに対するサポート http://www-06.ibm.com/software/jp/websphere/support/virtualization/ Virtualization support for WebSphere Application Server Network Deployment Load Balancer http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21265712 8 IHS/WAS 以外のサーバーへの割り振りについて 基本的にLoad BalancerはWAS環境への振り分けを行う製品 です WAS環境以外への振り分けもサポートされますが、WAS環 境の場合でも同一の問題が発生することが前提となります HTTP/HTTPS以外のプロトコルについても、技術的に振り分けは可 能ですが、やはりWAS環境でも同一も問題が発生することがサポー トの条件となります 詳細はノートのリンク先をご確認ください 9 Support of Edge Components of IBM WebSphere Application Server V6.0.2 and V6.1 http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21305987 IBM WebSphere Application Server Network Deployment V 7.0 license agreement http://www03.ibm.com/software/sla/sladb.nsf/displaylis/F28DEEC36644E9FE002574BF0060D8E8 9 Windows 環境の注意点 10 10 メディア検出 ネットワーク障害の際に正常にTakeoverを行うためには、 Windowsの「メディア検出」機能を無効にする必要があります メディア検出を無効にしていない場合、ネットワークがリンクダウンし た場合に、Windowsがそれを検知し、インターフェースからIPアドレス が除去されてしまいます C:¥Documents and Settings¥Administrator>ipconfig Windows IP Configuration Ethernet adapter ローカル エリア接続: Media State . . . . . . . . . . . : Media disconnected C:¥Documents and Settings¥Administrator> dscontrolコマンドはdsserverと通信しますが、IPアドレスが除去され てしまっていると正しく通信ができません C:¥Documents and Settings¥Administrator>dscontrol java.rmi.ConnectIOException: Exception creating connection to: 9.188.198.196; ne sted exception is: java.net.NoRouteToHostException: No route to host: connect エラー: サーバーが応答していません。 11 C:¥Documents and Settings¥Administrator> 11 メディア検出の無効化 メディア検出を無効化の設定はレジストリエディタにより行い ます レジストリ エディタ (Regedt32.exe) を使用して、レジストリにある次の キーを表示します ¾ HKEY_LOCAL_MACHINE¥System¥CurrentControlSet¥Services¥Tcpip¥Paramet ers 次のレジストリ値を追加し、コンピューターを再起動します ¾ ¾ ¾ 値の名前 : DisableDHCPMediaSense データの種類 : REG_DWORD -Boolean 値のデータ範囲 : 0、1 (False、True)、デフォルト値 : 0 (False) 12 Windows で TCP/IP のメディア検出機能を無効にする方法 http://support.microsoft.com/kb/239924/ja 12 TCP/IP オフロードと RSS TCP/IPオフロードやRSSが有効になっていると、LBが正常 に機能しない場合があるため、無効化する必要があります TCP/IPオフロードはパケットのチェックサムの計算などをOSではなく ネットワーク・アダプターで行う機能です ¾ 製品によって異なる名称で呼ばれますのでご注意下さい RSSは複数CPUでパケットの処理を分散して行う機能です 対応したネットワーク・アダプターを使用しているコンピューターに Windows Server 2003 Service Pack 2(SP2)またはWindows Server 2003 Scalable Network Pack(SNP)をインストールすると、これらの 機能が使用可能になります Broadcom社製ネットワーク・アダプターを使用している場合 Ethernet@Wirespeed機能も同様に問題を引き起こす可能性がありま す この機能が使用可能なアダプターを使用している場合、無効に設定 して下さい 13 13 TCP/IP オフロードと RSS の無効化 以下のいずれかの方法で無効化します 1. 2. 3. ネットワーク・アダプター・ドライバーのReceive Side Scalingおよび TCPオフロードを手動で無効にする レジストリでRSSおよびTCPオフロードを手動で無効にする SNPをオフにするWindowsの修正プログラムをインストールする 例)Broadcom 9 IPv4 Checksum Offload 9 IPv4 Large Send Offload 9 Receive Side Scaling など 例)Intel 9 TCPセグメンテーションのオフロード 9 受信IPチェックサムのオフロード 9 受信TCPチェックサムのオフロード 9 送信IPチェックサムのオフロード 9 送信TCPチェックサムのオフロード など 14 Windows Server 2003 ベースおよび Small Business Server 2003 ベースの既定の SNP 機能をオフ にする更新プログラム http://support.microsoft.com/kb/948496/ja 14 TCP/IP フィルタリング LBは割り振り先サーバーのヘルスチェックにpingも使用して います。このため、ICMPプロトコルが許可されている必要が あります。IP プロトコルの Protocol 1(icmp) が許可されてい ることを確認してください 15 15 アダプタとバインド 割り振り先サーバーでMicrosoft Loopback Adapterをインス トールした場合、ネットワーク・アダプターの優先順位を確認 してください MAC転送の割り振り先となるWindowsサーバーでは、ループバック・ アダプターをインストールしますが、このアダプターの優先順位が通 常のネットワーク・アダプターよりも高い優先順位になっていると、 ルーティングに問題をもたらします ループバック・アダプターに対応する接続の優先順位を一番下にして ください ループバックに対応するアダプタの 優先順位を一番下にする 16 16 Load Balancer の問題判別に必要な情報 17 17 Load Balancer の問題判別に必要な情報 1. 現行構成ファイル dscontrol file save <ファイル名> 以下の箇所に指定したファイル名で保管される ¾ 2. スクリプトファイル 以下のディレクトリにあるserverDownなどのスクリプトファイル ¾ 3. <EDGE_ROOT>/ulb/servers/bin Load Balancerの詳細バージョン 4. <EDGE_ROOT>/ulb/servers/configurations/dispatcher 以下の方法で確認 [AIX] lslpp –l | grep ibmulb [Linux] rpm -qa | grep ibmulb [Windows] dscontrol executor report Javaの詳細バージョン java -version 18 18 Load Balancer の問題判別に必要な情報 5. LBと割り振り先サーバーのネットワークインターフェース設 定情報 [Unix] ifconfig -a [Windows] ipconfig –all bronze:[/]# ifconfig -a en0: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT, 64BIT,PSEG,CHAIN> inet 9.188.198.215 netmask 0xffffff00 broadcast 9.188.198.255 inet 9.188.198.214 netmask 0xffffff00 broadcast 9.188.198.255 lo0: flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT> inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255 inet6 ::1/0 tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1 6. LBと割り振り先サーバーのルーティング・テーブル 7. [Unix] netstat –rn [Windows] route print LBと割り振り先サーバーの接続テーブル [Unix] netstat –an [Windows] netstat –an 19 19 Load Balancer の問題判別に必要な情報 8. 各種ログ ログ・レベルを5に設定します ログ・サイズも適切に設定します server.log ¾ ¾ manager.log ¾ ¾ ¾ dscontrol manager reach set loglevel 5 dscontrol manager reach set logsize unlimited アドバイザー・ログ ¾ ¾ dscontrol manager loglevel 5 dscontrol manager logsize unlimited reach.log ¾ dscontrol set loglevel 5 dscontrol set logsize unlimited dscontrol advisor loglevel <アドバイザー名> <ポート> 5 dscontrol advisor logsize <アドバイザー名> <ポート> unlimited ログの出力先 ¾ <EDGE_ROOT>/ulb/servers/logs/dispatcher 20 20 Load Balancer の問題判別に必要な情報 9. ネットワーク・トレース 最終的にログなどから問題が切り分けることができない場合は、 ネットワーク・トレースを採取 ¾ ¾ ¾ [AIX] iptrace -a -b <出力ファイル名> [Linux] tcpdump -w <出力ファイル名> [Windows] Wiresharkなどパケット・トレース・ツールを使用 IPトレースの使用法については以下を参照 ¾ http://publib.boulder.ibm.com/infocenter/pseries/index.jsp?topic=/com.ibm.aix.d oc/cmds/aixcmds3/iptrace.htm 21 21 (参考)Wireshark 様々なOSで使用可能なネットワークモニタリング・ツール http://www.wireshark.org/からダウンロード可能 22 22