...

DWH設計ガイド 2章.区分化によるアクセス効率の向上 第 ビジネス・ユニットの名前

by user

on
Category: Documents
29

views

Report

Comments

Transcript

DWH設計ガイド 2章.区分化によるアクセス効率の向上 第 ビジネス・ユニットの名前
ビジネス・ユニットの名前
DWH設計ガイド
第2章.区分化によるアクセス効率の向上
PSU_temp_0522
<第1.10版 2008年 12月>
本書に含まれている情報は、正式なIBMのテストを受けていません。また、明記にしろ、暗黙的にしろ、なんらの保証もなしに配布されるものです。
この情報の使用またはこれらの技術の実施は、いずれも、使用先の責任において行われるべきものであり、それらを評価し、実際に使用する環境に統合する使用先
の判断に依存しています。それぞれの項目は、ある特定の状態において正確であることがIBMによって調べられていますが、他のところで同じまたは同様の結果が
得られる保証はありません。これらの技術を自身の環境に適用することを試みる使用先は、自己の責任において行う必要があります。
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
2009/3/178/3/05
この文書のデータの利用または公開には、
最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
内容
第1章.大規模DBへの挑戦
第2章.区分化によるアクセス効率の向上
– パーティションDB
– パーティション表
– マルチディメンション・クラスタリング(MDC)表
– ハイブリッド構成
第3章.圧縮によるストレージ格納効率の向上
第4章.大規模ワークロードの管理(WLM)
PSU_temp_0522
2
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
第2章.区分化によるアクセス効率の向上
4.ハイブリッド構成
– ハイブリッド構成の特徴
– ハイブリッド構成例
– パーティション表とMDC表の比較
– パーティション表とMDC表の組み合わせケース
PSU_temp_0522
3
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
ハイブリッド構成の特徴
パーティションDB、パーティション表、MDC表の特徴を活かす
– データを分散させ並列で処理
– 目的のデータだけに最小のDisk I/Oでたどり着く
– 保管日数を超えたデータの効率的な管理
• 高速な消去
• サービスや運用への影響を最小化
• 大量のログを発生させない
データを
分散させて
並列で処理
最小のDisk I/O
によるアクセス
保管日数を
超えたデータの
効率的な管理
MDC表
パーティションDB
PSU_temp_0522
4
パーティション表
ハイブリッド構成
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
ハイブリッド構成例
CREATE TABLE 受注明細 (顧客ID INT, 受注日 DATE, 店舗ID CHAR(3), カテゴリ CHAR(3),商品ID CHAR(3))
DISTRIBUTE BY (顧客ID)
PARTITION BY (受注日) (STARTING '2008-01-01' ENDING '2008-12-31' EVERY 3 MONTH)
ORGANIZE BY (店舗ID,カテゴリ) IN TBS1, TBS2, TBS3
Data Row
DB partition 1
顧客ID
DB partition 2
Distribute By Hash
Partition By Range
Partition By Range
受注日
TBS 1
TBS 2
TBS 3
TBS 4
TBS 1
TBS 2
TBS 3
TBS 4
2008 1Q
2008 2Q
2008 3Q
2008 4Q
2008 1Q
2008 2Q
2008 3Q
2008 4Q
店舗ID,
カテゴリ
Organize By
PSU_temp_0522
5
Organize By
Organize By
Organize By
Organize By
Organize By
Organize By
Organize By
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
パーティション表とMDC表の比較
パーティション表
(パーティションのデタッチ)
MDC表
(MDC Rollout)
大量削除処理の速度
非常に高速
高速
大量削除の方法
削除したいパーティションを指定して、
ALTER TABLE … DETACH実行
削除条件を指定してDELETE文を実行
大量削除中のアプリケーショ
ンへの影響
表に一瞬Zロックが取られる
パッケージが無効になる
削除対象のブロックにXロックが取られる
ため、削除中のブロックを参照するような
クエリーはロック待機
履歴データの扱い
デタッチによって切り離したパーティショ
ンは独立した表として保管可能(監査目
的など)
履歴データはDELETEによって削除され
るため、保管が必要な場合は別途
EXPORTしておく
その他の考慮点
削除の頻度にパーティションの区切りを
一致させるか、またはより細かくするべ
き
削除条件で指定される次元列のカーディ
ナリティが高すぎるとディスクを浪費する
(例:TIMESTAMP列)
削除処理を単純なDELETEだけで実現したければ、MDC表による高速削除機能を使う
最も高速に削除処理を実現したい場合には、パーティション表を使う
PSU_temp_0522
削除データを別途保管したい場合は、パーティション表のデタッチが有効
6
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
パーティション表とMDC表の組み合わせケース
日付列をパーティション・キーとして、月単位(または週単位)のパーティション表を作成し、更にMDCの
次元列を日付列に指定する。
以下のようなケースでメリットあり。
– 日々データは投入される。
– 日単位のパーティションを作ると、パーティションの数が増えてしまう。
– ロールアウト(履歴データ一括削除)は週次または、月次で良い。
• ロールアウトについてはパーティション表のデタッチを活用
– 毎日継続的に更新が発生し、パーティションの追加をするタイミングが調整しにくい。
– 月単位、週単位のデータ・データアクセスのほかにも、もっと細かい日にち指定のデータ・アクセスが
ある。
• 日指定のアクセスはパーティション表の区分限定スキャンではなく、MDCブロック索引を利用した
方が効率的
月次でデ
タッチ
データ投入の
単位が日単
位
履歴表A
JAN
JAN
FEB
MAR
APR
MAY
PSU_temp_0522
7
月単位でレンジパー
ティション
日単位でMDCブロック
© Copyright IBM化
Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
ビジネス・ユニットの名前
パーティション表とMDC表の組み合わせケース
表の定義と
メンテナンス
パーティション表の
み
MDCのみ
(日付列も次元列)
表定義時に次
元列を指定。
パーティション表
+MDC
(日付列はパーティ
ション表の区分キー、
かつMDCの次元列
表定義時に次
元列と区分の
レンジを指定。
月次で
DETACH/ATT
ACH/ADD運用
必要
PSU_temp_0522
8
表定義時に月
単位で区分レ
ンジを指定。月
次で
DETACH/ATT
ACH/ADD運用
必要
ロールイン時のデー
タ可用性
検索性能
△
区分レンジと検
索範囲がマッチ
するケースに適
する
◎
複数次元に対し
てMDCのブロッ
ク索引により高
速検索可能
△
検索条件が月に
一致する場合に
はパーティション
表区分限定ス
キャン、日単位
の場合はMDCブ
ロックスキャンを
利用
ATTACH:
既存データの
読み書き可能
○
○
◎
ADD: LOAD中
は既存データ
のREAD
ONLY
LOAD中は既存
データのREAD
ONLY
データ投入単
位に応じて、投
入方法を選択
できる。
月次ロールアウト性能
◎
デタッチにより月
次単位の即時削
除が可能。デタッ
チしたパーティ
ションは別表とし
て保管可能
◎
○
MDC表の
RollingOut機能に
より高速削除可
能
○
◎
高速削除と履歴
表の再利用につ
いては、デタッチ
を適用
◎
© Copyright IBM Japan Systems Engineering Co., Ltd. 2008
この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。
Fly UP