...

第1回 実績ある情報系データベース「Red Brick Warehouse」∼最新 メジャーリリース6.20のテクニカル・ブリーフ

by user

on
Category: Documents
23

views

Report

Comments

Transcript

第1回 実績ある情報系データベース「Red Brick Warehouse」∼最新 メジャーリリース6.20のテクニカル・ブリーフ
赤レンガ倉庫6丁目2番地 | 第1回
第1回 実績ある情報系データベース「Red Brick Warehouse」∼最新
メジャーリリース6.20のテクニカル・ブリーフ
コンテンツ
記念すべき第1回は、IBM Red Brick Warehouse 6.20最新メ
ジャーリリースバージョンのTechnical Brief をお送りいたし
ます。
技術情報 − IBM Red Brick
Warehouse バージョン6.20
(UNIX、Linux、およ
びWindowsプラットフォー
IBM Red Brick Warehouseは過去10年間以上、12∼18ヶ月の間隔 ム版)
でメジャーバージョンアップの製品をリリースしてきました。
今回ご提供するTechnical Brief 6.20は、そのメジャーバージョ
ンアップごとに発行され、IBM Red Brick Warehouseの製品概要
と新たに追加された機能を、技術的な面から紹介しています。
本連載では、IBM Red Brick Warehouse製品が持つData
Warehouseに特化した技術情報や、バージョン6.20で追加され
た新機能の詳細情報をご紹介します。
ビジネス・インテリジェン
ス・フォーカス
強力な照会パフォーマンス
強力なロード・パフォーマ
ンス
本格的なユーザビリティと
IBM Red Brick Warehouseを従来からお使いいただいている方に
は、Technical BriefのUpdate版として、また、今回初めて連載を
訪れて興味を持っていただいた方には、この製品の特徴的な機
能を知っていただき、今後の掲載に興味を持っていただければ
と思い、第1回目の今回は、IBM Red Brick Warehouse 6.20
のTechnical Briefを掲載することにしました。今後、定期的に
更新、追加する予定です。ぜひ一読いただき、次回以降に予定
している、より詳細な技術情報のご理解の助けになればと思い
ます。
スケーラビリティ
まとめ
バージョン6.20の新機能
関連リンク
IBM Red Brick Warehouse
製品ページ
技術情報 − IBM Red Brick Warehouse バージョン6.20(UNIX、Linux、およびWindowsプ
ラットフォーム版)
この技術情報では、以下の項目について概説しています。
●
●
●
●
●
●
●
ビジネス・インテリジェンス・フォーカス
強力な照会パフォーマンス
強力なロード・パフォーマンス
本格的なユーザビリティとスケーラビリティー
まとめ
プラットフォーム・サポート
バージョン6.20の新機能
赤レンガ倉庫6丁目2番地 | 第1回
あらゆる企業において、経営分析や意思決定のために、信頼性が高く、柔軟性のある方
法による迅速な情報へのアクセスが求められています。IBM Red Brick Warehouseは、高
速なロード・パフォーマンス、高性能の照会処理、きわめて大規模なデータベースの効
率的管理など、クリティカルで要求の厳しいデータ分析に特化した要件に対応します。
実用性、費用効果、スケーラビリティに優れたIBM Red Brick Warehouseは、幅広いユー
ザーに対して、より多くのデータの分析を可能とし、さまざまな情報に基づいた迅速な
意思決定を可能にします。
ビジネス・インテリジェンス・フォーカス
Red Brickエンジンは、意思決定支援アプリケーション向けのデータベース・サーバーと
しての基盤をもとに設計されたものであり、このような目的で開発されたデータベース
・システムは、他に存在しません。この製品は、当初、Ralph Kimball氏の擁するRed
Brick Systemsによって開発され、後にInformixおよびIBMに買収されましたが、現在に
至るまで、データウェアハウジングおよびビジネス・インテリジェンス市場において常
に中心的役割を担っています。最新版であるIBM Red Brick Warehouse 6.20でも、この製
品の目的は、次のように変わらず受け継がれています。
1. 業務上、照会に対する迅速な応答が求められる環境において、強力な照会パ
フォーマンスを提供する。
2. 特定の時間枠でのロードが要求される大量のデータに対して、強力なロード・パ
フォーマンスを提供する。
3. きわめて大規模な意思決定支援データベースに対して、ユーザビリティとスケー
ラビリティを提供する。
IBM Red Brick Warehouseは、データベースのサイズ、業務上の照会の種類、対象となる
業務の種類を問わず、これらの機能を提供します。Red Brickのユーザーは、電気通信か
ら、金融サービス、ヘルスケア、e-commerceに至る幅広い業界に及び、また、数ギガバ
イトから数テラバイトに及ぶさまざまなサイズのRed Brickデータベースが実際に運用さ
れています。業務上の照会には、日常的なブラウズ照会から、複雑な結合や計算を必要
とする詳細な分析レポートまで、さまざまな種類があります。単一のデータベースでサ
ポートすることのできる同時ユーザーの数は、ハードウェア構成とライセンス契約以外
には制約を受けず、処理される複雑な照会の数は、1日当たり数千件以上に及びます。
また実際には、生データのサイズにかかわらず、同一のアーキテクチャを利用する同一
のシステムによって、さまざまなソリューションをサポートすることができます。
IBM Red Brick Warehouseは、32ビットおよび64ビットの各種UNIXプラットフォーム上
で稼働するほか、Linux、Windows NT、およびWindows 2000上でも稼働します。ま
た、Red Brickクライアント・ソフトウェアは、Windows XP上でも稼働します。Red
Brick製品には、サーバーのすべてのインストール・システムに対応した組み込み
のODBC 3.5のサポートと、Windowsプラットフォーム用のClient Connector Packが含まれ
ています。このClient Connector Packには、Windows 版のODBCドライバーが含まれてい
るほか、JavaSoft API Version 2.0に基づいた純粋なJava Type 4ドライバーであるRed Brick
JDBCドライバーも含まれています。
サーバー・ソフトウェアには、GUIベースのIBM Red Brick Warehouse Administratorツー
赤レンガ倉庫6丁目2番地 | 第1回
ルが付属しているため、DBAによって、Windowsが実行されているPCからサーバー・マ
シン上のデータベースを管理することができます。Red Brickサーバーは、標準に準拠し
たオープンなプロトコル(ODBC、JDBC、ANSI標準SQL)を採用しており、Red Brick
データベースでは、さまざまなデータウェアハウジング・ツールを効果的に利用するこ
とができます。利用できるツールには、Cognos、Brio
Technology、MicroStrategy、Business Objectsなどが提供している分析ツールやレポート
生成ツール、SPSSやSASが提供するデータ・マイニング・ツール、BMC Patrolなどのシ
ステム管理ツール、DataStageなどのETL(抽出、変換、ロード)ツールがあります。こ
れらのツールの中には、Red Brick特有の機能に対応した組み込みサポートを備えている
ものもあります。
Red Brick製品は、品質と信頼性の高さで定評があります。定期的なメンテナンス・リ
リースによって、ユーザーは、最新のリリースを確実に入手することができます。優れ
たテクニカル・サポート・サービス、コンサルティング・サービス、トレーニング・
サービスを世界各地で利用でき、また、昨年導入された新たな認定プログラム(共通テ
スト)によって、Red Brickデータベースの管理者は自らの技能を実証することもできま
す。
強力な照会パフォーマンス
照会の応答時間は、データウェアハウスの成功を左右する鍵であり、Red Brickデータ
ベースの最も重要な特徴の1つです。業務分析担当者の使命は、情報に基づいた意思決
定であり、その意思決定を左右するのは、さまざまな照会に対する迅速で正確な応答で
す。データウェアハウスの履歴データを分析担当者がドリルダウンし、比較する間に、
このような多くの照会に対する回答が得られることが必要です。
分析担当者が求めるのは、データベースが長時間にわたって安定したオンライン状態を
維持すること、照会が他の処理によって妨げられないこと、複数の分析担当者による照
会が、互いに競合しないこと、同じデータベースに対する照会の平均応答時間が短いこ
とです。つまり、多数のユーザー、照会の複雑さのさまざまなレベル、システムに対す
る作業負荷の変動、といった要求への対応が、データベースには求められます。
どのようにして、Red Brickの照会テクノロジーは、これらの要求に対応し、さらにそれ
以上の機能を提供しているのでしょうか?
●
画期的な独自の照会テクノロジー
IBM Red Brick Warehouseは、データウェアハウジングのディメンショナル・モデ
リング手法をサポートしています。単純なスター・スキーマ、マルチファクト・
スター・スキーマ、スノーフレーク・モデルなどの効率的なデータウェアハウス
設計を利用することにより、DBAは、基本的な索引と集約表を指定するだけで、
優れた照会パフォーマンスを得ることができます。照会プランは、照会の書き換
え、述部を解決する特殊なロジック、その他のインテリジェント・ショートカッ
ト、変換などの最適化処理に大きく左右されます。これらの最適化処理はすべて
自動で透過的に実行されるため、設定やチューニングは必要ありません。
Red Brickの照会エンジンは、それぞれの照会を評価し、最善の実行プランを実行
時に選択します。この選択は、中間結果(事前に実行された予備プラン)から取
赤レンガ倉庫6丁目2番地 | 第1回
得した情報に基づいて行われます。それぞれの照会プランは、ソート、結合、ス
キャン、集計などの個別の操作に分割されます。この動的なプラン選択により、
実際の中間結果に基づいて、最適な操作が選択されます。
場合に応じて、特定の操作(特に、結合や表のスキャンなどデータ主体の操作)
の並行処理も可能です。並列処理は必要に応じて行われますが、システムと作業
負荷による制限を受けます。1つの照会によって他の照会のリソースがすべて犠
牲になることはありません。時間のかかる操作にある程度の並列処理を用いるこ
とは全体としてよい結果をもたらすでしょう。これと同じことがメモリーにも言
えます。つまり、事前定義の設定値を上限として、サーバー・プロセスごとに段
階的にメモリーを割り当てることが可能です。
●
高度な索引機能と集計管理
意思決定支援の照会は、本来、データと結合を主体とする操作であるため、ほと
んどの照会においては、各種の結合アルゴリズム(あるいは、結合する各種テー
ブル)を選択することが、最も重要となります。それが可能であるかどうかは、
索引と集計を利用できるかどうかによって決まります。Red Brickの照会エンジン
は、「処理量が最も少ない照会プラン」あるいは「処理を最も効果的な方法で分
割する照会プラン」のいずれかを選択します。大きなファクト表への照会に対応
できる集約表がある場合には、集約を利用するようにSQLが書き換えられます。
同様に、ハッシュ結合のために、索引を利用した結合の選択が行われ、他の結合
プランが最適でない場合のみに、表のスキャンが行われます。
Red Brickの索引は、次の4つの目的で使用されます。
●
●
●
●
2つ以上の表を結合する
索引付きの列をスキャンして、制約を解決する
COUNT(*) 照会などの単純な集計計算を最適化する
参照の整合性と一意性をチェックする
これらの機能は、STAR、TARGET、B-TREEという3つの索引によって行われま
す。ファクト表と、それに対応する任意の数のディメンションとの結合処理は、
そのファクト表の外部キーに対するSTARindexTMによって高速化されます。コン
パクトで完全にソートされたSTAR索引項目によって、ファクト表に対応する、
索引付きディメンションの情報の事前計算があらゆる角度から行われます。これ
により、STARjoinTMでは、それぞれのディメンションについて1対1の結合を繰り
返し実行する場合よりも、ファクト表内の必要な行をはるかに迅速に見つけ出す
ことができます。
赤レンガ倉庫6丁目2番地 | 第1回
スター・スキーマによるディメンショナル・モデル
照会によって、後続のディメンションやSTAR索引でカバーされるディメンショ
ンの小さなサブセットが制約される場合は、TARGETindexTM(Red Brickデータ
ベース内で2つの異なる用途がある)をファクト表の外部キーに対して使用
し、STARjoinTMの代替となる高速処理であるTARGETjoinTMを実行することもで
きます。TARGETjoinTMとSTARjoinTMの処理は、互いに補完的な関係にありま
す。これらのテクノロジーを組み合わせて利用することにより、複数の表に関す
るさまざまな結合照会において優れたパフォーマンスを実現することができま
す。
TARGETindexTMの第2の用途は、列に対する制約の候補値の数が少ない(ドメイ
ンが小さい)場合に高速な索引スキャンを実現します。TARGETindexTMによる
スキャンは、同じ照会の中に2つ以上の緩い制約がある場合には特に効果的で
す。ドメインが小さいTARGETindexTM項目(「地区」「性別」「州」などの列
の値など)は、ビットマップとして格納するのに適していますが、ドメインが大
きい索引では、圧縮形式および非圧縮形式のリスト表現を使用します。サーバー
では、TARGETindexTMで制約されたそれぞれの項目が最も効率的な形式で保存
され、さまざまな列値ごとに、使用頻度に応じて動的に表現が選択されます。こ
のハイブリッド型の格納方法は、非対称のデータや予測できないデータに対して
効果を発揮します。
Red BrickのB-TREE Indexは、それぞれの表の主キーに対して作成され、一意性
と外部キーの参照整合性を確保します。通常、制約の対象になる頻度の高い(そ
して、ドメインの大きい)他の列にも、管理者が追加のB-TREE Indexを作成しま
す。TARGETindexTMと同様に、B-TREE Indexも、制約を評価する際に照会の
パフォーマンスを向上させますが、STARjoinTMやTARGETjoinTMが実行できない
場合や最適でない場合(ディメンション表から外部表に対する結合を行う場合な
赤レンガ倉庫6丁目2番地 | 第1回
ど)には、索引を利用した別の結合方法を提供する働きもあります。この場合、
いずれか一方の表がスキャンされ、もう一方の表がB-TREE Indexを通じて結合
されます。
Red Brickの集約表も、索引と同様に動作します。ファクト表から生成された集約
表は、そのファクト表に対して、もう1つのSTAR索引のように機能します。これ
は、照会の中間結果を事前に計算するもう1つの手段です。Red Brick製品におい
て最も特徴的で画期的なコンポーネントがVistaTMテクノロジーであると言えま
す。これには、スキーマ内で最小であり、結合の負荷が最も少ない集約表を使用
するように、集計の照会を自動的に書き換える働きがあります。この集計ナビ
ゲーションは、Red Brickに統合されており、透過的に動作します。照会やアプリ
ケーションを再設計しなくても、エンド・ユーザー、照会ツール、アプリケー
ション・プログラマーに対して、集計パフォーマンスの向上が可能となります。
インストールや構成に関するオーバーヘッドは、一切存在しません。
Vistaでは、インテリジェント型のディメンション階層という概念が実装されてい
ます。このため、一定レベルの単一の集計を使用して、より粒度の粗いレベルに
照会を書き換えることができます。さらに、Vista Advisorでは、集計照会の履歴
を記録し分析して、既存の集約の利用状況に関するレポートと、新たな集約の作
成を推奨するレポートの2種類のレポートを生成します。推奨された集約は、レ
ポート内に記述されたSQLをもとに簡単に作成できます。DBAは、それぞれの集
約をどの程度有効に利用できるか、どの程度の保守が必要になるかを正確に理解
した上で、作成する集約を選択することができます。
Vista Advisorによる分析
赤レンガ倉庫6丁目2番地 | 第1回
Vistaのリライト・システムが透過的に機能するだけでなく、集約表の保守も明細
表へのロード操作の一部として自動的に行われます。明細表が何らかの方法で更
新されると、Table Management Utility (TMU)のロード操作やDML操作によっ
て、その変更内容が関連する集約に自動的に反映されます。この保守操作は、既
存の集約行を完全に再構築する際に生じるオーバーヘッドを避けるために、段階
的に実行されます。ユーザーが指定すれば、集約の保守を表ごとに延期すること
もできます。保守作業は、多くの場合、TMUプロセスから始まりますが、常に
サーバー・プロセスによって処理されるため、(照会プランと同様に)実行時に
保守プランを生成し、選択することができます。
優れた照会パフォーマンスを保証するIBM Red Brick Warehouseの数多くの特性を
集約するために、3種類の索引と、それらの索引に関連する結合アルゴリズムお
よびスキャン・アルゴリズムには、さまざまなスキーマや照会プロファイルに対
応する数々の手段が用意されています。Vista テクノロジーは、実行時の作業負
荷を低減する別の手段を提供することで、索引処理の柔軟性を高めます。管理者
は、これらの豊富な機能を十分に活用できますが、索引や集約の作成を控えて、
保守やストレージに伴うコストを低く抑えることもできます。エンド・ユーザー
は、DBAの選択に関与することも、DBAの選択によって作業を妨げられることも
ありません。エンド・ユーザーが目にするのは、優れたパフォーマンスのみで
す。
●
専門的な分析関数と記述能力
IBM Red Brick Warehouseは、照会の実行をさまざまな方法で最適化するだけでな
く、専門的なSQL関数も備えています。アプリケーション開発者やエンド・ユー
ザーは、これらの関数を利用して、柔軟性のある照会を設計することができま
す。パフォーマンスの向上につながる機能も、使いやすさを考慮した機能も用意
されています。Red Brick独自のRISQL拡張関数と、サポートされているANSI
SQL/OLAP関数のどちらを使用しても、上位10件の値を取得し、合計や平均、そ
の他のシーケンシャル分析を実施できます。これらの関数は、サードパーティの
いくつかの照会ツールによるドロップダウン・リストとして実装されているた
め、アプリケーション開発担当者の助けを借りなくても、エンド・ユーザーが専
門的なSQLをサーバーに送ることができます。
ANSI標準の複雑な照会式や結合がサポートされているため、同一の照会をさまざ
まな方法で記述することによって、照会の実行やパフォーマンスを制御すること
ができます。また、ユーザーは、任意の表または副照会に対して、結果全体では
なく行のサンプルを要求できます。これは、他の用途(データ・マイニングな
ど)に利用するテスト・データを作成する場合や、ランダムな行の集合による代
表値に基づいて概算結果を得る場合に便利な機能です。(ランダム・サンプリン
グ機能)
Administratorツール内のEXPLAIN関数では、照会のすべての内部操作についてグ
ラフィカルなウィンドウが提供されます。Query Performance Monitorで収集され
た照会の統計メッセージやオペレーター・レベルの統計と組み合わせて使用する
と、照会を調整しながら、スキーマと照会の設計をともに改善する方法を見つけ
出すことができます。
赤レンガ倉庫6丁目2番地 | 第1回
強固なデータウェアハウス設計を基盤としているため、Red Brickの照会パフォー
マンスは、洗練されたデータ・アクセス方式をどのように実装し、選択するかに
よって大きく左右されます。システムのハードウェアや資源を常に監視する必要
はなく、また、タスクの監視やチューニングも最小限で済みます。同時ユーザー
の数が増加すると、データベースは、資源を共有することによって応答を返しま
す。また、データ全体には直接アクセスせず、定型的な照会が数多く実行される
ため、照会の平均応答時間に大きな影響を与えずに、データベースの表を拡大す
ることができます。
強力なロード・パフォーマンス
データ・ローディングの優れたパフォーマンスは、照会の応答時間に次いで、データ
ウェアハウスの成功にとって欠かせない要素です。データウェアハウスには、往々にし
て、メインフレーム、OLTPデータベース、購入したデータ、Webなどの多様なソース
からデータが入力されます。そして、実際に稼働すると、それぞれのデータベースのサ
イズがかなり拡大し、投資効果が現れ始めます。
ユーザーは、迅速かつ正確な応答だけでなく、(通常は、前日の夜間にロードされた
データからの)最新の応答を期待しています。ロードの時間枠、つまり、データベース
が保守のためにオフラインになる厳密な時間帯は、ユーザーをオンライン状態に保ち、
データベースを最新の状態に維持する上でDBAが直面しなければならない最大の制約事
項です。一部の業界では、さまざまな時間帯のユーザーや、更新頻度の高いスケジュー
ルだけでなく、年中無休のアクセスにさえ対応するために、ロードの時間枠を短縮して
いる場合もあります。どのようなビジネス環境でも、分析担当者による照会の実行は、
他のいかなるデータベース操作よりも優先させる必要があります。
どのようにして、Red Brickの表管理テクノロジーは、これらの要求に対応し、さらにそ
れ以上の機能を提供しているのでしょうか?
●
TMUによる高性能なデータ・ローディング
Red Brickの大容量データ・ローダーであるTable Management Utility(TMU)は、
独立したプログラムとして動作しますが、データ行の挿入や更新、参照整合性の
チェック、索引の構築、集約の保守など、データベースを即座に照会可能な状態
に保つ上で必要なあらゆるタスクを実行します。TMUは、これらのタスクを非常
に高速に実行することで、ハードウェアやシステム管理に要するコストを削減す
ると共に、データを予定通りに分析できることを保証します。数百万件のデータ
行を約数分間で表にロード可能であり、1時間に10ギガバイトのロード速度を持
続することも珍しくありません。TMUは、IBM Red Brick Warehouseのサーバー・
マシンまたはリモート・クライアント・マシンから実行できるため、DBAは、入
力ファイルや出力ファイルをローカルで保守することができます。
TMUは、入力ファイルを一度だけ読み込み、1回のパスで表にデータをロード
し、その索引と集約をすべて構築します。データウェアハウスは、ロード操作が
完了すると同時に分析可能な状態になります。TMUによるロードは、データの読
み込み、Red Brick内部形式への行の変換、表と表の索引に対する行の書き込みと
いった複数のフェーズに分割されます。並列型のTMUは、各段階ごとに別のプロ
赤レンガ倉庫6丁目2番地 | 第1回
セスを使用し、ある段階から別の段階へ行の集合を引き渡し、複数の集合が同時
に処理されるようにすることで、ロードのパフォーマンスを向上させています。
使用可能なCPUの数によっては、DBAが追加の変換プロセスや索引構築プロセス
を割り当てることもできます。
参照整合性のチェックは、ディメンション表の主キー索引を共有メモリーにマッ
ピングできるようにし、オペレーティング・システムに対するメモリー・マッピ
ング・コールをより広範に利用することで、さらに最適化されています。この方
法により、索引の探索が高速化し、ファクト表内の行のチェックを行います。一
部のロード操作では、最適化をオンにすることもできます。その場合、単一の
データ行ではなく、データ行の集合に基づいて索引が更新されます。これによ
り、システム上の入出力が削減され、ロード全体のパフォーマンスが向上しま
す。
TMUのスクリプトには、ロード・モード(追加、挿入、置換、変更、更新)の選
択のほか、リジェクト条件を指定する機能、破棄する行に対する制限を設定する
機能、参照整合性違反を避けるために行から参照表を自動的に生成する機能
(AUTOROWGEN)など、さまざまなデータ処理要件に対処するロジックが組み
込まれています。自動集計機能は、入力されたデータに集計関数を適用し、たと
えば、他の列内の一致するキー値に基づいて、指定された列の合計を求めると
いった操作を実行します。データは、標準入力、ディスク・ファイル、または
テープから、固定長レコードまたは可変長レコードとして区切り付き形式と定位
置形式のどちらでもロードすることができます。サポートされているロケールに
よる入力データは、ロードした上で、データベースのロケールに変換が可能で
す。
TMUは、更新、REORG操作、アンロードなどのその他のデータベース操作も実
行します。REORGコマンドを実行すると、保守が延期されている索引または集
約が再構築されるほか、無効な索引や、データとの同期がとれていない索引が再
構築されます。これらの操作は、並行して実行できます。アンロード機能を使用
すると、表データを短時間でファイルに保存し、そのファイル内のデータを再
ロードしたり、他の場所で再利用することができます。再構築処理や再ロード処
理の効率を上げるために、アンロード時にはDDLファイルやTMUファイルも出力
されます。
アンロード機能に替わる方法として、サーバー・ベースの高速なEXPORTコマン
ドを使用することにより、任意のSELECT文に基づいて表データをファイルに保
存することができます。EXPORTコマンドは、ODBC層をバイパスして、照会結
果をサーバー・マシン上のディスクに直接送ります。作成されたファイルは、内
部形式(Red Brickの表に最も高速にデータ行をロードできる形式)でエクスポー
トし、再ロードすることができます。
●
バージョン管理による並行性と回復可能性
ロードの時間枠をごく短くする必要がある業務や、年中無休でデータベースへの
アクセスが要求される業務の場合は、照会を優先するRed Brickの並行処理機能に
よって、照会のパフォーマンスを損なわずに、任意の表のデータを変更しなが
ら、同時に照会を行うことができます。ロードや更新操作のために生じた変更
赤レンガ倉庫6丁目2番地 | 第1回
は、バージョン・ログと呼ばれる特殊なセグメントに一時的に保存されます。
バージョン・ログは、変更の影響を受ける実際のデータベース・ファイルに合わ
せて定期的に書き換えられます。このようなバージョン管理を有効にする一方
で、照会結果の一貫性を確保したい場合、管理者は、データベースの改訂を凍結
し、後で、あるいはデータベースが次回に「オフライン」になった時点で、デー
タベースに対するユーザーのビューを更新することができます。
TMUでは、定期的なコミット、つまり「trickle-feed」機能がサポートされてお
り、バージョン管理されたロードを一度に指定したレコード数単位で、あるいは
指定した分単位で実行することができます。この方法でデータをロードすると、
単一のロード・トランザクションが長時間実行されることを避け、データベース
に対する変更を一定の間隔でコミットすることで、データの回復可能性を大幅に
高めることができます。並行ロードを必要としないユーザーは、単に回復可能性
を高めるために、バージョン管理されたデータベースを利用することもできま
す。
要約すると、TMUは、大量のデータをロードすることに特化した完全に実用的な
プログラムです。Red Brickの表管理テクノロジーは、Red Brickの照会テクノロ
ジーと同様、データベースのサイズやロードの時間枠の長さに関係なく、ロード
のパフォーマンスを保証できるという点で、DBAに柔軟性を提供します。圧倒的
な速さのロード処理により、データベースをテラバイトの範囲まで拡張すること
ができます(ロードの速度は、照会の速度を示す目安となります)。きわめて高
速なデータの取得が可能になれば、通常、より高速なデータのロードが可能にな
ります。
本格的なユーザビリティとスケーラビリティ
その場その場の照会もバッチ方式のロードも効率よく行われるデータベースであるとす
れば、もう1つの大きな要件は、「使いやすさ」です。ユーザーは、アプリケーション
開発用のプラットフォームとして、インストール、構成、管理、操作が容易なデータ
ベースを必要としています。管理の容易さが重要である理由には、3つあります。それ
は、「日常の管理作業にそれほど多くの時間を割けない場合がある」「DBAやアプリ
ケーション開発者のトレーニングや再教育には多額の費用が必要になる」「データウェ
アハウスは、厳密な設計が求められる一方で、変更が容易でなければならない」という
理由です。使いやすさという要件は、多くの場合、スケーラビリティにも関連します。
データウェアハウスに投資する際には、データウェアハウスの初期のユーザーが期待す
る照会やロードのパフォーマンスを犠牲にせずに、業務に応じた用途の拡大が可能であ
ることを確認することが必要です。
具体的には、DBAには次のことが求められます。
●
●
●
●
管理タスクを可能な限り迅速に実施する。できれば、データベースがオフライン
中のロード時間内に実施する。
データベースのアクティビティを効果的に監視する。
あらゆるユーザーの要求に対応できるようデータベースを構成する。
システム資源について社内のIS部門の助けを借りず、単独で作業を行う。
赤レンガ倉庫6丁目2番地 | 第1回
どのようにして、Red Brickデータベースは、これらの要求に対応し、さらにそれ以上の
機能を提供しているのでしょうか?
第一に挙げられるのは、IBM Red Brick Warehouseは、特定の目的に的を絞ったシンプル
な製品である点です。Red Brickのクライアント/サーバー・アーキテクチャにより、管
理しやすいインストール・プロセスや構成プロセスが実現しました。細かなインストー
ル作業は、カーネルの構成(UNIXユーザーの場合)のみです。このインストール作業
を正しく行えば、DBAは、単一の構成ファイルの制御により、テスト・データベースや
実働データベースの設計および構築を行うことができます。
一般に、Red Brick製品では、データウェアハウスの優れたプロジェクト計画と効果的な
設計方法論を前提とした場合、構成作業の負担が軽減されます。資源の配分はほとんど
動的に行われ、並列処理やメモリーの使用などに関するデフォルトのチューニング・オ
プションやオプション・パラメーターにより、多くの場合、最初から効果的に利用でき
ます。パフォーマンス・チューニングによっては、構成パラメーターに対して、変更を
加える方法で行われ、たとえばスクリプト化されたセッション単位の変更を加えること
で、個別の照会やロードのレベルでの変更も実施可能です。また、単一の複雑な照会で
メモリーを多量に使用する必要がある場合でも、他のユーザーの照会に関する汎用パラ
メーターを調整せずに対応することができます。
急速に拡大するデータベースの管理は、DBAが直面する最も困難な管理作業の1つで
す。データや索引の格納に関するRed Brickのアプローチ(データのセグメント化)は、
時間順のデータ管理を容易にしています。データウェアハウスは、一定期間のデータを
時間順で格納するように設計することができます。新しいデータ・セグメントがロール
オンすると、古いデータ・セグメントはロールオフするため、ディスク・スペースが再
利用され、古くなったデータは削除されます。またRed Brickではデータと同じように、
索引をローカルでセグメント化できるので、データと同様のメンテナンスがIndexでも
実施できるので、保守作業が大幅に簡略化されます。一般に、セグメント化は、照会の
パフォーマンス(特に並列処理)やロードのパフォーマンスに影響を与えるだけでな
く、製品の全般的なユーザビリティにも影響を与えるデータ管理手段です。優れたセグ
メンテーション計画によって、パフォーマンスが最適化され、管理コストが削減されま
す。
DBAは、システムテーブルやDST(Dynamic Statistics Tables)に格納される詳細なメタ
データへのアクセスが可能です。これらのメタデータには、標準SQLを使用して照会お
よび結合を実行することができます。Query Performance Monitorには、特殊な一連
のDSTが組み込まれており、これらのDSTには、照会の実行統計が、初回プラン内の個
別のオペレーターのレベルまで詳細に記録されます。DBAは、さまざまな動作条件の下
で同一の統計についてピーク時の統計と累積統計を比較するプロファイルを設定するこ
とによって、照会のパフォーマンスを監視し、長時間実行されている照会を診断するこ
とができます。
赤レンガ倉庫6丁目2番地 | 第1回
Query Performance Monitor:オペレーター統計表に対する照会結果
Administratorツールには、詳細な照会を記述しなくてもデータベースの状態を確認でき
るように、グラフィカル・インターフェイスが用意されています。このツールのメイン
・ウィンドウは、データベース・ツリーとして構造化されています。DBAは、このツ
リー内を移動することで、オブジェクト間の関係を検討することができます。このツー
ルには、オブジェクトの作成と管理のためのウィザードも用意されています。このウィ
ザードを利用すると、各種のDDLサーバー・コマンドや、オブジェクト(またはデータ
ベース全体)を作成する際に使用するSQLを生成するShow DDLコマンド、グラフィカ
ルなEXPLAINツールが含まれている照会インターフェイスをエミュレートすることが
できます。Advisorログ・ファイルに対する照会の作成、また、表形式やグラフィカル
な形式による分析結果の表示などは、このツールのVista Advisor インターフェイスに
よって、きわめて簡単に行えるようになります。
サーバー・ソフトウェアには、Administratorツールのほかにも、ログ・ビューアー、
データの整合性の問題を調べて修正するサーバー・ベースのユーティリティ、データ
ベースのサイズ設定ツール(Administratorにも実装)、RISQL Entry Toolなど、さまざま
なツールやユーティリティがあります。RISQL Entry Toolと、その関連製品であ
るRISQL Reporterは、シンプルで効果的なツールであり、SQL文の発行や、SQLスクリ
プトの実行および編集をコマンド行から直接行うことができます。RISQL Reporterに
は、基本的なレポート作成機能が用意されており、システム表やDSTに対する照会に特
に便利です。
赤レンガ倉庫6丁目2番地 | 第1回
システム表の情報
Red Brickデータベースは、類似した機能を持つ他の製品と比較して、少人数の管理者に
よる管理が可能であるという報告が顧客から寄せられています。Red Brick製品が、従来
のRDBMSソリューションの何分の1かのコストで数千にも及ぶビジネス・ユーザーに対
してテラバイト級のデータウェアハウス機能を提供している理由の1つは、こうした
ユーザビリティにあります。
まとめ
情報への迅速なアクセスを可能とし、信頼性/柔軟性の高い方法は現代の業務分析に不
可欠な要素です。このような高いレベルの要件を満たすためには、高度に特化されたテ
クノロジーをベースとした製品が必要です。IBM Red Brick Warehouse 6.20は、照会の実
行、データのローディング、管理において画期的な技術を採用し、ビジネスクリティカ
ルな意思決定支援用アプリケーションの開発のための強固で拡張性の高いプラット
フォームを提供します。どんなに複雑なアプリケーションであっても、IBM Red Brick
Warehouseは、強力なパフォーマンスと確かな投資効果を実現します。
バージョン6.20の新機能
IBM Red Brick Warehouseバージョン6.20では、数多くの新機能、拡張機能が追加されま
した。主な機能は次のとおりです。
●
照会のプロファイリングと監視 − 管理者、パフォーマンス分析担当者、および
キャパシティ計画担当者は、Query Performance Monitorを使用して、実行時に照
赤レンガ倉庫6丁目2番地 | 第1回
会のプロファイルを作成してその進展を監視し、また、プロファイルを保存しプ
ロファイルの変化を検討することができます。プロファイルは、それぞれのユー
ザーが使用しているプロセッサー時間、物理I/O操作の回数、ディスクへの書き込
み回数など、オペレーター・レベルで収集された詳細な統計によって構成されま
す。
●
●
●
●
●
●
●
●
SQL OLAP関数 − サーバーで
は、RANK、DENSE_RANK、NTILE、ROW_NUMBER、RATIO_TO_REPORTの
ほか、OLAP集計関数など、SQL標準の「基本OLAP」パッケージで定義されてい
る関数がすべてサポートされます。業務に関する広範な分析的照会に対応するた
めに、ウィンドウ・パーティションとウィンドウ・フレームを定義することがで
きます。同等のRISQL表示関数も引き続きサポートされています。
VistaによるリライトおよびAdvisor拡張機能 − 事前計算されたビューの照会リラ
イト・システムでリライトされる照会が2種類追加されています。つまり、複雑
な式によってグループ化を行う照会と、COUNT(DISTINCT)、SUM
(DISTINCT)、MIN、またはMAX関数が含まれている照会のうち、入力列が事
前計算されたビューのGROUP BY節や選択リストで定義されているものが、リラ
イトされます。Advisorは、これらのリライト機能を認識し、それに従って候補
ビューを生成します。候補ビューの分析を最適化するために、このリリースに
は、一度の分析で生成される候補ビューの数を制限する構成パラメーターとSET
コマンドが用意されています。
TARGETjoinTMの並行処理とセグメントの除外 −TARGETjoinTM索引がローカル
でセグメント化されている場合、TARGETjoinTM照会では、照会の結合フェーズ
で並行処理が利用され、不要なセグメントは結合処理から除外されます。
SQL EXPORTでのXML形式 − 照会結果をXML形式のファイルにエクスポートで
きます。
バックアップおよびリストア操作 − TMUでは、ディスク、テープ、およ
びXBSA準拠のストレージ管理システムへの完全バックアップと増分バックアッ
プが可能です。バックアップ操作は、データベースの読み取りおよび書き込みア
クセスが可能な状態で実行することができます。すべてのバックアップについて
メタデータの詳細な履歴が維持され、信頼性の高い効率的なリストア操作がサ
ポートされます。
リモートTMU − DBAは、ローカル制御ファイルと入力ファイルを使用し
て、LOAD DATA、UNLOAD、およびGENERATE操作をクライアント・マシンか
ら開始できます。PTMUは、リモート・サーバー上で実行され、その出力ファイ
ルと廃棄ファイルがクライアントに返されます。
XMLによるロード − XMLファイルを表の各列に対応付けるTMU制御ファイル内
のパスに基づいて、XML形式のファイルから表にデータをロードできます。
索引のローカルなセグメント化 − DBAは、時系列データベースの保守を容易に
するために、セグメント化する列が索引に存在しなくても、TARGETindexTMやB-
赤レンガ倉庫6丁目2番地 | 第1回
●
TREE Indexをデータと同様にセグメント化できます。ローカル索引を作成する
には、CREATE INDEX...SEGMENT LOCALオプションを使用し、ローカル索引を
アタッチするには、ALTER SEGMENT...RANGE LIKE SEGMENTオプションを使
用します。
セグメントに関するDDLの拡張
1. STAR索引をCREATE STAR INDEX...SEGMENT LIKE DATAおよびALTER
SEGMENT ATTACH...RANGE LIKE SEGMENTオプションによって容易に
セグメント化できます。
2. ALTER SEGMENT...RELEASE STORAGEオプションを使用すると、行を削
除した後の領域を解放できます。
3. ALTER SEGMENT...DROP LAST STORAGEオプションを使用すると、未使
用のPSUをセグメントの最後から削除できます。
4. ALTER SEGMENT...RANGE MOVEオプションを使用すると、セグメント
を切り離さなくても、1つの表の中でセグメントの位置を変更できます。
5. 索引が意図せず無効になることを避けられます。これには、ALTER
SEGMENT...DETACHおよびRANGE MOVEオプションでINVALIDATEキー
ワードを指定する必要があります。
●
●
●
システムカタログの拡張 − カタログのアクセス時間、メモリーの使用、データ
ベース・ロックの使用が改善されました。新しいシステム表であ
るRBW_VIEW_REFERENCESには、ビューで参照されている表を識別する働きが
あります。
32ビットから64ビットへの移行ユーティリティ − 32ビット版のIBM Red Brick
Warehouseで作成したデータベースは、ベンダーのプラットフォームが同じであ
れば、64ビット版との完全な互換性があります。TMU UPGRADE文を使用する
と、データベースを32ビットから64ビットのアドレッシングにアプグレードする
こともできます。
OLE DBアプリケーションとの接続性 − Red BrickのODBCドライバー
は、MicrosoftのOLE DB - ODBCブリッジを利用してWindowsのOLE DBアプリ
ケーションをサポートします。以下のMicrosoft製品によって作成したアプリケー
ションを含めて、OLE DBベースのアプリケーションは、Red Brickデータベース
に接続できます。
1. ActiveX Data Objects(ADO)およびActive Server Pages(ASP)
2. Microsoft SQL Server Data Transformation Services(DTS)およびAnalysis
Services
●
●
Red Brick JDBCによるIBM HTTP Serverの認定 − 3階層のJDBC構成における中間
層としてIBM HTTP Serverがサポートされます。
『Query Performance Guide』− この新しい資料には、Query Performance
Monitor、EXPLAIN、その他のチューニング・ツールおよび推奨事項に関する解
説が収録されています。
Fly UP