...

止まらない システムの実現 Web WebSphere

by user

on
Category: Documents
29

views

Report

Comments

Transcript

止まらない システムの実現 Web WebSphere
止まらないWebシステムの実現
日本アイ・ビー・エム システムズ・エンジニアリング株式会社
Software Technical Center, Workplace
山口 崇
[email protected]
WebSphere
Extended
Deployment
V6.1
2008.09
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
アジェンダ
z お客様要件・課題
„ WebSphere Application Serverに対する課題
„ 「可用性向上」をキーとした検討プロジェクト実施
z ソリューション
„ 使用コンポーネント WebSphere Virtual Enterprise V6.1
„ 使用したXDの機能
¾ 保守モード、ヘルス・モニタリング、アプリケーション・バージョニング、ODR
„ システム構成 WAS6.0/6.1 + WVE6.1
z 結果・考察
„ 現在製品検討タスク進行中
2
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
お客様要件・課題
3
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
顧客およびシステム概要
z 業種:金融業
z 適用対象システム:経営情報管理システム(情報系)
DB
IHS
AS1-1
AS2-1 ・・・
IHS
AS1-2
AS2-2 ・・・
IHS
AS1-3
AS2-3 ・・・
IHS
AS1-4
AS2-4 ・・・
認証サーバー
WAS6.0 / AIX
4
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
現行システムでの課題
2007年夏:ミドルウェア製品改善検討会
„
„
当該システムで使用しているミドルウェア(WAS/DB2)に対する、製品改善
のご要望をまとめて頂く機会があった
WAS(ND)に対する要望に関し、当時まだご紹介していなかった
WebSphere XDで改善可能な機能があった
z 改善要望の例
IHSは各AppServerのメモリ等のリソース状況を見て負荷分散して欲しい。
IHSは各AppServerのメモリ等のリソース状況を見て負荷分散して欲しい。
ODRによる動的ワークロード・バランシング
ODRによる動的ワークロード・バランシング
取引量が多いAppServerは4台構成・取引量が少ないAppServerは2台構成など、
取引量が多いAppServerは4台構成・取引量が少ないAppServerは2台構成など、
AppServer台数が違っても、クラスター構成が取れる設計が取れるようにして欲しい。
AppServer台数が違っても、クラスター構成が取れる設計が取れるようにして欲しい。
動的クラスターによるJVM最低稼動数保障
動的クラスターによるJVM最低稼動数保障
5
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
現行システムでの課題
2007年秋:WebSphere XD V6.1製品のご紹介
„
製品の概要説明会および、ハンズオン研修の実施
¾
¾
Operations Optimization(当時の名称:現Virtual Enterprise)の動的オペレーション、ア
プリケーション・バージョニング、ヘルス・モニタリング、Data Grid(当時の名称:現
eXtreme Scale)などに関心を持っていただく
障害対応の迅速化、予防保守、サービス提供可能時間延長など、いずれも可用性向上
を主眼とした機能に着目
保守モードを活用し障害時にスムースな縮退を行いたい。
保守モードを活用し障害時にスムースな縮退を行いたい。
アプリケーション・バージョニング(ロールアウト)によりサービス提供時間中の
アプリケーション・バージョニング(ロールアウト)によりサービス提供時間中の
新規アプリケーション・リリースを行いたい。
新規アプリケーション・リリースを行いたい。
分散キャッシュをDBの前段に配置して、DB障害時にもサービスの
分散キャッシュをDBの前段に配置して、DB障害時にもサービスの
継続提供ができないか?
継続提供ができないか?
6
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
ソリューション
7
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
試行タスクと検討対象機能
2008年1-3月、WXD試行ライセンスでの事前検証タスク実施
„
Windowsの小規模環境で製品機能を検証
z 検証対象の機能
„
ODR/オートノミック・マネージャー
¾
„
ヘルス・モニタリング
¾
„
8
新規アプリケーションのサービス無停止リリース
保守モード
¾
„
リソース枯渇の検知、自律対応
アプリケーション・バージョニング
¾
„
リソースが逼迫したASへの割り振り抑止
障害ノードのスムースな縮退
構成トポロジーの検討
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
試行タスクと検討対象機能
2008年4月~9月、正式ライセンスにて基礎検討タスク実施
„
„
前述の実稼動システムおよび、今後のコピー・システムへの展開を想定し、
WXDでの課題解決が図れるか/足りない機能があるとすれば何かを検討
AIX環境で以下の2環境を構成
¾
¾
„
現行WAS6.0環境への適用を意図したWAS6.0 + WXD6.1構成
今後のコピーシステムへの適用を意図したWAS6.1+WXD6.1構成
事前検証タスクでやりきれなかった機能詳細の確認+追加機能の検証
z 追加で検討対象となった機能
„
„
„
„
„
9
動的クラスター(APC)
セッション共有方式の検討
ロギング
DMホット・スタンバイ
パフォーマンス/キャパシティ
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
ソリューション検討の紹介
z 以下のソリューション検討をピックアップして紹介
1.
2.
3.
4.
10
ODRによる過負荷サーバーへの流量抑止
保守モードによる縮退運用
ヘルス・モニタリングによる予防保守
WAS6.0環境への適用オプション
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
1. ODRによる過負荷サーバーへの流量抑止
z 障害影響の極小化
従来:通常時
AS1-1
AS2-1
・・・
AS1-2
AS2-2
・・・
リクエストはラウンドロ
ビンに処理される
IHS
従来:過負荷時
AS1-1
AS2-1
・・・
AS1-2
AS2-2
・・・
IHS
11
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
AS1-1過負荷時も同様
にリクエストが均等に割
り振られ、当該サー
バーおよび同一ノード
の別サーバーの処理に
影響していた
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
1. ODRによる過負荷サーバーへの流量抑止
z 障害影響の極小化
ODR適用:通常時
AS1-1
AS2-1
・・・
ODRはノードのCPUや
メモリー情報、レスポン
ス・タイムなどを監視
ODR
AS1-2
AS2-2
・・・
ODR適用:過負荷時
AS1-1
AS2-1
・・・
AS1-2
AS2-2
・・・
ODR
DWLM(動的ワークロード管理)
12
リクエストはラウンドロ
ビンに処理される
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
ARFM(オートノミック要
求フロー・マネジャー)
がASノードのCPU/メ
モリー使用状況、レス
ポンスタイムなどから過
負荷を判断し、動的に
割り振りの重みを変更、
影響を極小化する
(DWLM)
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
2.保守モードによる縮退運用
z スムースな縮退
従来:JVM停止
AS1-1
AS2-1
・・・
AS1-2
AS2-2
・・・
リクエストを停止するた
めにはJVMの停止が
必要
IHS
WXD保守モード
AS起動のまますべて
のリクエストを抑止
AS1-1
AS2-1
・・・
ASは停止していないの
で、保守作業が容易
ODR
AS1-2
13
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
AS2-2
・・・
クラスター数が多い場
合ノード・レベルでの保
守モードも設定可能
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
3.ヘルス・モニタリングによる予防保守
z 障害が起こる前に対処
従来:事後対処
障害発生後、原因解析
を実施
AS2-1
AS1-1
・・・
回復までの時間がかか
る
IHS
AS1-2
AS2-2
・・・
ヘルス・モニタリング
メモリ消費量過剰
メモリ消費量過剰
AS1-1
AS2-1
ダンプ取得
ダンプ取得
シェル実行
シェル実行
ODR
AS1-2
14
・・・
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
再起動
再起動
AS2-2
・・・
解析のためのダンプ取
得など、本番環境では
困難なことが多い
事前に条件を定義して
おくことにより、障害発
生の予兆を検知
ダンプ取得、再起動、
運用シェルの実行と
いったアクションを自律
的に実行する
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
4. WAS60環境への適用オプション
z 案1:WXD61 ODRのみを適用:構成への影響最小限
„
„
ODRを前段にたて、汎用サーバー・クラスター構成でND60を構成
サービス・ポリシーを定義し、流量制御が可能
ND60セル
ODRのみをXD61に
ND 60 (DM)
ND 60
XD61セル
XD61(DM)
負荷分散
装置
ND 60
XD61(ODR)
ND 61
ND 60
ND 60
※ V6.1より非推奨構成
15
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
4. WAS60環境への適用オプション
z 案2:WXD61 ODR+MA:ND60を残しWXD61を最大活用
„
„
ND60環境にMiddleware Agentを導入、ノードの情報取得を可能とする
動的クラスター構成、一部限定のヘルス・ポリシー適用が可能
ND60セル
XD61 ODR+MA
XD61(MA)
ND 60 (DM)
ND 60
XD61セル
XD61(DM)
負荷分散
装置
XD61(MA)
ND 60
XD61(ODR)
ND 61
XD61(MA)
ND 60
XD61(MA)
採用案1:現行環境適用
16
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
ND 60
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
4. WAS60環境への適用オプション
z 案3:WXD61 完全移行:ND60をND61に移行
„
„
WXD61のフルセット導入、フル機能活用可能
セルも一つとなる
Full XD61
XD61(MA)
ND 61
XD61セル
XD61(DM)
負荷分散
装置
XD61(MA)
ND 61
XD61(ODR)
ND 61
XD61(MA)
ND 61
XD61(MA)
採用案2:コピー環境適用
17
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
ND 61
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
4. WAS60環境への適用オプション
z 各構成で使用可能な機能対比表
流量制御
レポート機能
(管理
コンソール)
動的
クラスター
保守モード
案1
ODRのみ
○
△
※1
×
×
案2
ODR+MA
○
○
○
案3
WXD61
○
○
○
ヘルス・
ポリシー
集中
インストール・
マネージャー
アプリケーション・
バージョニング
可視化
データ・
サービス
×
×
×
△
※1
○
△
※2
△
※3
×
○
○
○
○
○
○
※1:ODRが取得するタイプのデータ(リクエスト数や応答時間、キューに関連する情報)に関しては、汎用サーバー・
クラスターのメンバーに関しても取得できます。
※2:適用不可のヘルス・コンディション・・・要求タイムアウト超過条件、メモリー使用量超過、メモリー・リーク
適用不可のヘルス・アクション・・・JVMヒープダンプの取得、スレッドダンプの取得
※3:MAのみ集中インストール・マネージャーによる導入が可能
18
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
結果・考察
19
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
これまでの成果
z 基礎検証タスク:まもなくexit
„
これまで可用性向上に関して一定の評価をいただく
z US開発との協業
„
定期的な開発チームとのテレコンを継続実施し、製品改善要望・開発元テ
スト・チームへのお客様要件インプットなどを行ってきた
z 製品品質向上
„
„
20
InfoCenterやwikiに記載されてない詳細なデザイン/挙動の確認
iFixの提供
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
04.止まらない
Webシステムの実現
システムの実現
04.止まらないWeb
今後のプラン
z 継続検証
„
„
10月以降も検証タスク継続
障害時挙動など追加の検証を行い、最終報告をまとめる予定
z 実環境への適用
„
„
21
検証タスクの成果を元に、対象システムの実環境への適用を検討していく
予定
また、社内で稼動している別システムへの適用検討も並行して実施予定
事例から学ぶWebSphere
XD活用セミナー
事例から学ぶ
XD活用セミナー
IBM Internal Use Only
Fly UP