Comments
Transcript
DWH設計ガイド 2章.区分化によるアクセス効率の向上 第 ビジネス・ユニットの名前
ビジネス・ユニットの名前 DWH設計ガイド 第2章.区分化によるアクセス効率の向上 PSU_temp_0522 <第1.10版 2008年 12月> 本書に含まれている情報は、正式なIBMのテストを受けていません。また、明記にしろ、暗黙的にしろ、なんらの保証もなしに配布されるものです。 この情報の使用またはこれらの技術の実施は、いずれも、使用先の責任において行われるべきものであり、それらを評価し、実際に使用する環境に統合する使用先 の判断に依存しています。それぞれの項目は、ある特定の状態において正確であることがIBMによって調べられていますが、他のところで同じまたは同様の結果が 得られる保証はありません。これらの技術を自身の環境に適用することを試みる使用先は、自己の責任において行う必要があります。 © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 2009/3/178/3/05 この文書のデータの利用または公開には、 最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 内容 第1章.大規模DBへの挑戦 第2章.区分化によるアクセス効率の向上 – パーティションDB – パーティション表 – マルチディメンション・クラスタリング(MDC)表 – ハイブリッド構成 第3章.圧縮によるストレージ格納効率の向上 第4章.大規模ワークロードの管理(WLM) PSU_temp_0522 2 © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 第2章.区分化によるアクセス効率の向上 4.ハイブリッド構成 – ハイブリッド構成の特徴 – ハイブリッド構成例 – パーティション表とMDC表の比較 – パーティション表とMDC表の組み合わせケース PSU_temp_0522 3 © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 ハイブリッド構成の特徴 パーティションDB、パーティション表、MDC表の特徴を活かす – データを分散させ並列で処理 – 目的のデータだけに最小のDisk I/Oでたどり着く – 保管日数を超えたデータの効率的な管理 • 高速な消去 • サービスや運用への影響を最小化 • 大量のログを発生させない データを 分散させて 並列で処理 最小のDisk I/O によるアクセス 保管日数を 超えたデータの 効率的な管理 MDC表 パーティションDB PSU_temp_0522 4 パーティション表 ハイブリッド構成 © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 ハイブリッド構成例 CREATE TABLE 受注明細 (顧客ID INT, 受注日 DATE, 店舗ID CHAR(3), カテゴリ CHAR(3),商品ID CHAR(3)) DISTRIBUTE BY (顧客ID) PARTITION BY (受注日) (STARTING '2008-01-01' ENDING '2008-12-31' EVERY 3 MONTH) ORGANIZE BY (店舗ID,カテゴリ) IN TBS1, TBS2, TBS3 Data Row DB partition 1 顧客ID DB partition 2 Distribute By Hash Partition By Range Partition By Range 受注日 TBS 1 TBS 2 TBS 3 TBS 4 TBS 1 TBS 2 TBS 3 TBS 4 2008 1Q 2008 2Q 2008 3Q 2008 4Q 2008 1Q 2008 2Q 2008 3Q 2008 4Q 店舗ID, カテゴリ Organize By PSU_temp_0522 5 Organize By Organize By Organize By Organize By Organize By Organize By Organize By © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 パーティション表とMDC表の比較 パーティション表 (パーティションのデタッチ) MDC表 (MDC Rollout) 大量削除処理の速度 非常に高速 高速 大量削除の方法 削除したいパーティションを指定して、 ALTER TABLE … DETACH実行 削除条件を指定してDELETE文を実行 大量削除中のアプリケーショ ンへの影響 表に一瞬Zロックが取られる パッケージが無効になる 削除対象のブロックにXロックが取られる ため、削除中のブロックを参照するような クエリーはロック待機 履歴データの扱い デタッチによって切り離したパーティショ ンは独立した表として保管可能(監査目 的など) 履歴データはDELETEによって削除され るため、保管が必要な場合は別途 EXPORTしておく その他の考慮点 削除の頻度にパーティションの区切りを 一致させるか、またはより細かくするべ き 削除条件で指定される次元列のカーディ ナリティが高すぎるとディスクを浪費する (例:TIMESTAMP列) 削除処理を単純なDELETEだけで実現したければ、MDC表による高速削除機能を使う 最も高速に削除処理を実現したい場合には、パーティション表を使う PSU_temp_0522 削除データを別途保管したい場合は、パーティション表のデタッチが有効 6 © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 パーティション表とMDC表の組み合わせケース 日付列をパーティション・キーとして、月単位(または週単位)のパーティション表を作成し、更にMDCの 次元列を日付列に指定する。 以下のようなケースでメリットあり。 – 日々データは投入される。 – 日単位のパーティションを作ると、パーティションの数が増えてしまう。 – ロールアウト(履歴データ一括削除)は週次または、月次で良い。 • ロールアウトについてはパーティション表のデタッチを活用 – 毎日継続的に更新が発生し、パーティションの追加をするタイミングが調整しにくい。 – 月単位、週単位のデータ・データアクセスのほかにも、もっと細かい日にち指定のデータ・アクセスが ある。 • 日指定のアクセスはパーティション表の区分限定スキャンではなく、MDCブロック索引を利用した 方が効率的 月次でデ タッチ データ投入の 単位が日単 位 履歴表A JAN JAN FEB MAR APR MAY PSU_temp_0522 7 月単位でレンジパー ティション 日単位でMDCブロック © Copyright IBM化 Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。 ビジネス・ユニットの名前 パーティション表とMDC表の組み合わせケース 表の定義と メンテナンス パーティション表の み MDCのみ (日付列も次元列) 表定義時に次 元列を指定。 パーティション表 +MDC (日付列はパーティ ション表の区分キー、 かつMDCの次元列 表定義時に次 元列と区分の レンジを指定。 月次で DETACH/ATT ACH/ADD運用 必要 PSU_temp_0522 8 表定義時に月 単位で区分レ ンジを指定。月 次で DETACH/ATT ACH/ADD運用 必要 ロールイン時のデー タ可用性 検索性能 △ 区分レンジと検 索範囲がマッチ するケースに適 する ◎ 複数次元に対し てMDCのブロッ ク索引により高 速検索可能 △ 検索条件が月に 一致する場合に はパーティション 表区分限定ス キャン、日単位 の場合はMDCブ ロックスキャンを 利用 ATTACH: 既存データの 読み書き可能 ○ ○ ◎ ADD: LOAD中 は既存データ のREAD ONLY LOAD中は既存 データのREAD ONLY データ投入単 位に応じて、投 入方法を選択 できる。 月次ロールアウト性能 ◎ デタッチにより月 次単位の即時削 除が可能。デタッ チしたパーティ ションは別表とし て保管可能 ◎ ○ MDC表の RollingOut機能に より高速削除可 能 ○ ◎ 高速削除と履歴 表の再利用につ いては、デタッチ を適用 ◎ © Copyright IBM Japan Systems Engineering Co., Ltd. 2008 この文書のデータの利用または公開には、最終ページに記載されている制限事項が適用されます。