Comments
Description
Transcript
止まらない システムの実現 Web WebSphere
止まらないWebシステムの実現 日本アイ・ビー・エム システムズ・エンジニアリング株式会社 Software Technical Center, Workplace 山口 崇 [email protected] WebSphere Extended Deployment V6.1 2008.09 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb アジェンダ z お客様要件・課題 WebSphere Application Serverに対する課題 「可用性向上」をキーとした検討プロジェクト実施 z ソリューション 使用コンポーネント WebSphere Virtual Enterprise V6.1 使用したXDの機能 ¾ 保守モード、ヘルス・モニタリング、アプリケーション・バージョニング、ODR システム構成 WAS6.0/6.1 + WVE6.1 z 結果・考察 現在製品検討タスク進行中 2 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb お客様要件・課題 3 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 顧客およびシステム概要 z 業種:金融業 z 適用対象システム:経営情報管理システム(情報系) DB IHS AS1-1 AS2-1 ・・・ IHS AS1-2 AS2-2 ・・・ IHS AS1-3 AS2-3 ・・・ IHS AS1-4 AS2-4 ・・・ 認証サーバー WAS6.0 / AIX 4 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 現行システムでの課題 2007年夏:ミドルウェア製品改善検討会 当該システムで使用しているミドルウェア(WAS/DB2)に対する、製品改善 のご要望をまとめて頂く機会があった WAS(ND)に対する要望に関し、当時まだご紹介していなかった WebSphere XDで改善可能な機能があった z 改善要望の例 IHSは各AppServerのメモリ等のリソース状況を見て負荷分散して欲しい。 IHSは各AppServerのメモリ等のリソース状況を見て負荷分散して欲しい。 ODRによる動的ワークロード・バランシング ODRによる動的ワークロード・バランシング 取引量が多いAppServerは4台構成・取引量が少ないAppServerは2台構成など、 取引量が多いAppServerは4台構成・取引量が少ないAppServerは2台構成など、 AppServer台数が違っても、クラスター構成が取れる設計が取れるようにして欲しい。 AppServer台数が違っても、クラスター構成が取れる設計が取れるようにして欲しい。 動的クラスターによるJVM最低稼動数保障 動的クラスターによるJVM最低稼動数保障 5 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 現行システムでの課題 2007年秋:WebSphere XD V6.1製品のご紹介 製品の概要説明会および、ハンズオン研修の実施 ¾ ¾ Operations Optimization(当時の名称:現Virtual Enterprise)の動的オペレーション、ア プリケーション・バージョニング、ヘルス・モニタリング、Data Grid(当時の名称:現 eXtreme Scale)などに関心を持っていただく 障害対応の迅速化、予防保守、サービス提供可能時間延長など、いずれも可用性向上 を主眼とした機能に着目 保守モードを活用し障害時にスムースな縮退を行いたい。 保守モードを活用し障害時にスムースな縮退を行いたい。 アプリケーション・バージョニング(ロールアウト)によりサービス提供時間中の アプリケーション・バージョニング(ロールアウト)によりサービス提供時間中の 新規アプリケーション・リリースを行いたい。 新規アプリケーション・リリースを行いたい。 分散キャッシュをDBの前段に配置して、DB障害時にもサービスの 分散キャッシュをDBの前段に配置して、DB障害時にもサービスの 継続提供ができないか? 継続提供ができないか? 6 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb ソリューション 7 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 試行タスクと検討対象機能 2008年1-3月、WXD試行ライセンスでの事前検証タスク実施 Windowsの小規模環境で製品機能を検証 z 検証対象の機能 ODR/オートノミック・マネージャー ¾ ヘルス・モニタリング ¾ 8 新規アプリケーションのサービス無停止リリース 保守モード ¾ リソース枯渇の検知、自律対応 アプリケーション・バージョニング ¾ リソースが逼迫したASへの割り振り抑止 障害ノードのスムースな縮退 構成トポロジーの検討 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 試行タスクと検討対象機能 2008年4月~9月、正式ライセンスにて基礎検討タスク実施 前述の実稼動システムおよび、今後のコピー・システムへの展開を想定し、 WXDでの課題解決が図れるか/足りない機能があるとすれば何かを検討 AIX環境で以下の2環境を構成 ¾ ¾ 現行WAS6.0環境への適用を意図したWAS6.0 + WXD6.1構成 今後のコピーシステムへの適用を意図したWAS6.1+WXD6.1構成 事前検証タスクでやりきれなかった機能詳細の確認+追加機能の検証 z 追加で検討対象となった機能 9 動的クラスター(APC) セッション共有方式の検討 ロギング DMホット・スタンバイ パフォーマンス/キャパシティ 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb ソリューション検討の紹介 z 以下のソリューション検討をピックアップして紹介 1. 2. 3. 4. 10 ODRによる過負荷サーバーへの流量抑止 保守モードによる縮退運用 ヘルス・モニタリングによる予防保守 WAS6.0環境への適用オプション 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 1. ODRによる過負荷サーバーへの流量抑止 z 障害影響の極小化 従来:通常時 AS1-1 AS2-1 ・・・ AS1-2 AS2-2 ・・・ リクエストはラウンドロ ビンに処理される IHS 従来:過負荷時 AS1-1 AS2-1 ・・・ AS1-2 AS2-2 ・・・ IHS 11 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only AS1-1過負荷時も同様 にリクエストが均等に割 り振られ、当該サー バーおよび同一ノード の別サーバーの処理に 影響していた 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 1. ODRによる過負荷サーバーへの流量抑止 z 障害影響の極小化 ODR適用:通常時 AS1-1 AS2-1 ・・・ ODRはノードのCPUや メモリー情報、レスポン ス・タイムなどを監視 ODR AS1-2 AS2-2 ・・・ ODR適用:過負荷時 AS1-1 AS2-1 ・・・ AS1-2 AS2-2 ・・・ ODR DWLM(動的ワークロード管理) 12 リクエストはラウンドロ ビンに処理される 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only ARFM(オートノミック要 求フロー・マネジャー) がASノードのCPU/メ モリー使用状況、レス ポンスタイムなどから過 負荷を判断し、動的に 割り振りの重みを変更、 影響を極小化する (DWLM) 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 2.保守モードによる縮退運用 z スムースな縮退 従来:JVM停止 AS1-1 AS2-1 ・・・ AS1-2 AS2-2 ・・・ リクエストを停止するた めにはJVMの停止が 必要 IHS WXD保守モード AS起動のまますべて のリクエストを抑止 AS1-1 AS2-1 ・・・ ASは停止していないの で、保守作業が容易 ODR AS1-2 13 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only AS2-2 ・・・ クラスター数が多い場 合ノード・レベルでの保 守モードも設定可能 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 3.ヘルス・モニタリングによる予防保守 z 障害が起こる前に対処 従来:事後対処 障害発生後、原因解析 を実施 AS2-1 AS1-1 ・・・ 回復までの時間がかか る IHS AS1-2 AS2-2 ・・・ ヘルス・モニタリング メモリ消費量過剰 メモリ消費量過剰 AS1-1 AS2-1 ダンプ取得 ダンプ取得 シェル実行 シェル実行 ODR AS1-2 14 ・・・ 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 再起動 再起動 AS2-2 ・・・ 解析のためのダンプ取 得など、本番環境では 困難なことが多い 事前に条件を定義して おくことにより、障害発 生の予兆を検知 ダンプ取得、再起動、 運用シェルの実行と いったアクションを自律 的に実行する 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 4. WAS60環境への適用オプション z 案1:WXD61 ODRのみを適用:構成への影響最小限 ODRを前段にたて、汎用サーバー・クラスター構成でND60を構成 サービス・ポリシーを定義し、流量制御が可能 ND60セル ODRのみをXD61に ND 60 (DM) ND 60 XD61セル XD61(DM) 負荷分散 装置 ND 60 XD61(ODR) ND 61 ND 60 ND 60 ※ V6.1より非推奨構成 15 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 4. WAS60環境への適用オプション z 案2:WXD61 ODR+MA:ND60を残しWXD61を最大活用 ND60環境にMiddleware Agentを導入、ノードの情報取得を可能とする 動的クラスター構成、一部限定のヘルス・ポリシー適用が可能 ND60セル XD61 ODR+MA XD61(MA) ND 60 (DM) ND 60 XD61セル XD61(DM) 負荷分散 装置 XD61(MA) ND 60 XD61(ODR) ND 61 XD61(MA) ND 60 XD61(MA) 採用案1:現行環境適用 16 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only ND 60 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 4. WAS60環境への適用オプション z 案3:WXD61 完全移行:ND60をND61に移行 WXD61のフルセット導入、フル機能活用可能 セルも一つとなる Full XD61 XD61(MA) ND 61 XD61セル XD61(DM) 負荷分散 装置 XD61(MA) ND 61 XD61(ODR) ND 61 XD61(MA) ND 61 XD61(MA) 採用案2:コピー環境適用 17 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only ND 61 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 4. WAS60環境への適用オプション z 各構成で使用可能な機能対比表 流量制御 レポート機能 (管理 コンソール) 動的 クラスター 保守モード 案1 ODRのみ ○ △ ※1 × × 案2 ODR+MA ○ ○ ○ 案3 WXD61 ○ ○ ○ ヘルス・ ポリシー 集中 インストール・ マネージャー アプリケーション・ バージョニング 可視化 データ・ サービス × × × △ ※1 ○ △ ※2 △ ※3 × ○ ○ ○ ○ ○ ○ ※1:ODRが取得するタイプのデータ(リクエスト数や応答時間、キューに関連する情報)に関しては、汎用サーバー・ クラスターのメンバーに関しても取得できます。 ※2:適用不可のヘルス・コンディション・・・要求タイムアウト超過条件、メモリー使用量超過、メモリー・リーク 適用不可のヘルス・アクション・・・JVMヒープダンプの取得、スレッドダンプの取得 ※3:MAのみ集中インストール・マネージャーによる導入が可能 18 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 結果・考察 19 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb これまでの成果 z 基礎検証タスク:まもなくexit これまで可用性向上に関して一定の評価をいただく z US開発との協業 定期的な開発チームとのテレコンを継続実施し、製品改善要望・開発元テ スト・チームへのお客様要件インプットなどを行ってきた z 製品品質向上 20 InfoCenterやwikiに記載されてない詳細なデザイン/挙動の確認 iFixの提供 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only 04.止まらない Webシステムの実現 システムの実現 04.止まらないWeb 今後のプラン z 継続検証 10月以降も検証タスク継続 障害時挙動など追加の検証を行い、最終報告をまとめる予定 z 実環境への適用 21 検証タスクの成果を元に、対象システムの実環境への適用を検討していく 予定 また、社内で稼動している別システムへの適用検討も並行して実施予定 事例から学ぶWebSphere XD活用セミナー 事例から学ぶ XD活用セミナー IBM Internal Use Only