Comments
Transcript
Bluemix Bluemixではじめるアナリティクス テクニカル・セミナー 1
IBM Bluemix www.bluemix.net そこが知りたい! IBM Bluemix テクニカル・セミナー Bluemixではじめるアナリティクス 日本アイ・ビー・エム株式会社 SWG WebSphere事業部 佐野智久 1 IBM Bluemix www.bluemix.net ご注意 この資料は日本アイ・ビー・エム株式会社および日本アイ・ビー・エム システムズ・エンジニアリング株 式会社の正式なレビューを受けておりません。 資料の内容には正確を期するよう注意しておりますが、この資料の内容は2014年09月現在の情報であり、 製品の新しいリリース、修正などによって動作/仕様が変わる可能性があります。 当資料は、資料内で説明されている製品の仕様を保証するものではありません。従って、この情報の利用 またはこれらの技法の実施はひとえに使用者の責任において為されるものであり、資料の内容によって受 けたいかなる被害に関しても一切の補償をするものではありません。 また、IBM、IBMロゴおよびibm.comは、世界の多くの国で登録されたInternational Business Machines Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標 である場合があります。現時点でのIBMの商標リストについては http://www.ibm.com/legal/copytrade.shtmlをご覧ください。 2 © 2014 IBM Corporation 2 IBM Bluemix www.bluemix.net アジェンダ ビッグデータ&アナリティクス Bluemix ではじめるアナリティクス ビッグデータ&アナリティクス 関連のサービス まとめ 3 © 2014 IBM Corporation 3 IBM Bluemix www.bluemix.net ビッグデータ&アナリティクス 4 © 2014 IBM Corporation 4 IBM Bluemix www.bluemix.net 今、何が起こっているのでしょうか? あらゆるデータが 分析可能に 「分析」によって 意思決定が大幅に改善 データ活用が 企業競争⼒に直結 5 © 2014 IBM Corporation ビッグデータが注目されている中、データの活用しビジネスに活かすことが重要で あるといわれています。 データを分析することで得られる知見に基づく意思決定が企業の競争力に直結し ており、実際に効果をあげている事例もあります。 また、企業内のデータの蓄積が進みデータを活用する準備を整えつつある企業も 多い。さらに、だれでも利用可能なオープンデータも整備されてきています。 5 IBM Bluemix www.bluemix.net 意思決定のスピードが求められる時代 市場構造が急激な変化する時代、データに基づく意思決定にもスピードが必要です。 グローバル化 情報の量と質の変化 ⾦融危機 顧客意識の変化 市場構造の急激な変化 このような時代でも成⻑するために・・・ 事実に基づく 正確な判断 大量に蓄積 されたデータ 直感ではなく 直感ではなく スピーディーに! スピーディーに! 意思決定 製品戦略 ブランド戦略 マーケティング戦略 組織変革 ・ ・ 6 © 2014 IBM Corporation 情報の量と質の変化、顧客意識の変化、グローバル化といった市場の変化に対応 するためには、これまでの勘や経験に基づく直感だけに頼った判断では十分では ありません。 事実に基づく正確な判断をスピーディーに行い、データに裏づけされた意思決定 によって企業の戦略を決定することが重要となってきています。 6 IBM Bluemix www.bluemix.net 身近にあるデータから価値を引き出す まずは⼊⼿が容易なデータを使って分析を始めることが重要です。 今、身の回りにある取引のデータや顧客データから もっと有益な知⾒を取り出せるはず・・・ 「何からはじめれば いいのか?」 やり方が分からない? 分析環境がない? 時間がない? 7 © 2014 IBM Corporation テクノロジーの進化やストレージ価格の低下により、ビッグデータがビジネスに大き なインパクトを与えるようになってきています。 データ分析を行う場合、データソースやデータ量は広ければ広いほど良い結果が 得られ、新しい気付きや発見があり、ビジネス課題の解決や売上向上、コスト削減 により貢献することになると言われています。 しかしながら、ビッグデータを扱う技術やツールが整備され、価格も安価になり、 ビッグデータ活用の重要性も十分理解しているにも関わらず、企業経営者の課題 は「何から始めればよいのかわからない」という点にあることが多くあります。 ビッグデータでなければ分析ができないわけではなく、身近なデータから価値ある 知見を得ることができることも多く、入手容易なデータあるいは既存のデータを使っ て、様々な分析を行い試行錯誤することからはじめることが重要です。 7 IBM Bluemix www.bluemix.net 分析に必要な要素 「データ」×「分析手法」 既存のデータの利用 時間やコストをかけずに、分析に注⼒ 知⾒ クラウドの活用 柔軟な「分析基盤」 様々なワークロードタイプへの対応 柔軟なリソース割当て 新しいテクノロジーの迅速な利用 分析結果 データ 分析手法 BIツール BIツール DWH ETL ETL ワーク ロード DM ETL Mining リソース 知⾒ 分析基盤 テクノロジ 8 © 2014 IBM Corporation 分析を行って知見を得るためには、「データ」と「分析手法」が欠かせません。 データは既存のデータを利用できたとしても、どのような分析をすれば有用な知見 が得られるかは、スキルや経験に大きく依存します。 スキルや経験の向上のためには、トライアル&エラーのできる環境やスモールス タートできる環境が適しているといえます。 また、効率的な分析を行うためには、柔軟な分析基盤が求められます。 ①構造化データを分析するのか、ソーシャルメディアのような非構造データを分析 するのかによって処理するワークロードのタイプは異なります。 ②処理するデータ量に応じて、計算リソースに対する要求も変わってきます。 ③効率的な分析には、インメモリー・データベースやDWHアプライアンスのような最 新テクノロジーの活用も重要です。 このような柔軟性のある分析基盤は、クラウド技術の活用によって容易に実現でき ます。 8 IBM Bluemix www.bluemix.net Bluemix ではじめるアナリティクス 9 © 2014 IBM Corporation 9 IBM Bluemix www.bluemix.net データウェアハウジングおよび分析用の アジャイル・プラットフォーム Bluemix ランタイム スプレッドシート (Liberty, Ruby, …) データロード テーブル参照 クエリ発⾏ ブラウザ Analytics Warehouse BIツール データウェアハウス (BLU Acceleration) 統計解析 実⾏環境 (R) Rスクリプトの実⾏ 統計解析 統合開発環境 Rスクリプトの開発 10 © 2014 IBM Corporation Bluemix を使って分析をはじめるにあたって、Analytics Warehouse のサービスを 利用することができます。 このサービスは、データウェアハウジングおよび分析用のアジャイル・プラットフォー ムであり、データウェアハウス、統計解析の実行環境(R言語)、統合開発環境 (RStudio)の三つのコンポーネントから構成されています。 これらのコンポーネントは、基本的には、ブラウザから利用することが可能であり、 すぐに分析をするために必要な要素がそろっています。 データウェアハウスは、外部のBIツールと連携することも可能です。また、Bluemix のランタイムからアクセスすることも可能です。 10 IBM Bluemix www.bluemix.net 統計解析環境 R オープンソースの統計解析向けの プログラミング⾔語及び実⾏環境 統計解析用ソフトウェアの デファクト・スタンダード 強⼒な統計解析・データ解析機能 多様で美しいグラフの容易な作成 RStudio R⾔語の向けの統合開発環境 コードアシスト機能やグラフの描画 R Markdown形式によるドキュメント化 ドキュメントへの R スクリプトの埋込み Knit: R Markdown HTML 11 © 2014 IBM Corporation 統計解析環境として、R言語の実行環境を利用することができます。 R言語は、オープンソースの統計解析向けのプログラミング言語およびその実行環 境であり、統計解析用ソフトウェアのスタンダード的なものです。 豊富な統計解析ライブラリーと多彩なグラフ作成が特徴となっています。 また、統合開発環境である RStudio を利用することができます。 Rスクリプトの開発が容易となるだけでなく、R Markdown 形式によるドキュメント化 の機能との連携によって、メンバー間の分析結果の共有をサポートしています。 11 IBM Bluemix www.bluemix.net データウェハウスと分析実⾏環境 インデータベース・アナリティクス データ処理・分析処理のオフロード 分析実⾏環境 通常の分析 分析実⾏ データウェアハウス クエリ 分析結果 インデータベース・アナリティクス 分析実⾏ メモリ メモリ 使用量 使用量 データ データ 転送量 転送量 クエリ・分析処理 分析結果 12 © 2014 IBM Corporation Analytics Warehouse サービスでは、インデータベース・アナリティクスのアプロー チをとることができます。 大量のデータの移動はコストの高い処理であるため、データ処理や分析処理を データベース内で実行するようにオフロードすることで、効率的な分析を実現できる ようになります。 これによって、データウェハウスと分析実行環境の間のデータ転送量を削減し、実 行環境のメモリ使用量も削減することが可能となります。 12 IBM Bluemix www.bluemix.net デモの概要 販売店の売上げ明細データを用いて、 データの可視化とデータ分析を Bluemix 上で実現する データベースや分析ツール等の準備が不要 データウェアハウス、統計解析の実⾏環境、統合開発環境が 組み込まれている 必要なのはデータだけ Bluemixアプリケーションからのサービスの利用が可能 軽量フレームワークを使ったアプリケーション ウェブ上のサービスとの連携 IBM Bluemix の Analytics Warehouse を利用して、Ruby でビジネス・インテリジェンスおよびアナリティクス・サービスを作成する http://www.ibm.com/developerworks/jp/bigdata/library/bd-ruby-bluacceleration-app/ 13 © 2014 IBM Corporation デモでは、Bluemix の Analytics Warehouse のサービスを利用して、販売店の売 り上げ明細データを行います。 デモのポイントは以下のとおりです。 - 分析を始めるにあたって、利用者は分析対象となるデータを準備するだけで、分 析環境を自前で用意する必要はない。 - Bluemix のランタイムと連携することで、集計データや分析結果を共有することが 容易となる。 このデモは、developerWorks の記事がベースとなっているので、ランタイムとの連 携については、その記事を参照ください。 13 IBM Bluemix www.bluemix.net デモ:販売店の売上げデータの可視化と分析 デモで使用するデータ Cognos BI のサンプルデータ 2010年1月から 2013年8月までの 446023 件の売上げ明細データ 等 デモの流れ Analytics Warehouse のコンソール R スクリプトの実⾏と結果確認 R スクリプトからのデータベースへのアクセス 開発環境 分析結果のドキュメント化 データの可視化 データへのアクセス 売上げ明細データの表示 グラフ表示 地域別営業成績グラフの表示 データ分析 アソシエーション分析 バスケットの中の商品間の関連性(どのような商品が同時に購入されているか) についての分析 14 © 2014 IBM Corporation Analytics Warehouse では、Cognos BI のサンプルデータが利用可能になってい ます。 デモでは、サンプルデータに含まれる約44万件の売上げ明細データ等を利用して、 データの可視化やデータの分析を行います。 -Analytics Warehouse のコンソール画面の紹介 -Rスクリプトの実行 -データベースへのアクセス (インデータベース・アナリティクスの効果) -開発環境 RStudio の紹介 -ランタイムとの連携 -データへのアクセス -グラフ表示 (Google Charts との連携) -分析結果の表示 14 IBM Bluemix www.bluemix.net デモのまとめ 分析に最低限必要な環境が整っています。 分析に最低限必要な環境が整っています。 データさえあれば、今すぐにでも、分析がはじめられます。 データさえあれば、今すぐにでも、分析がはじめられます。 データベースや分析ツール等の準備が不要 データウェアハウス、統計解析の実⾏環境、統合開発環境が 組み込まれている 必要なのはデータだけ Bluemixアプリケーションからのサービスの利用が可能 軽量フレームワークを使ったアプリケーション ウェブ上のサービスとの連携 15 © 2014 IBM Corporation デモでは、事前準備がなくても、すぐに分析を開始することができることを見ていた だきました。 Analytics Warehouse は、インデータベース・アナリティクスのアプローチや、最新 テクノロジーを搭載したデータウェアハウスの利用などの特徴もあります。 Bluemix ランタイムとの連携は、分析結果の共有にも役立ちます。 15 IBM Bluemix www.bluemix.net ビッグデータ&アナリティクス 関連のサービス 16 © 2014 IBM Corporation 16 IBM Bluemix www.bluemix.net アナリティクス関連のサービス インメモリ・データ・ストアから予測分析まで 17 © 2014 IBM Corporation アナリティクス関連のサービスは、Big Data のセクションと Business Analytics のセク ションに、合計5つあります。 17 IBM Bluemix www.bluemix.net アナリティクス関連のサービス 名称 提供形態 Analytics Warehouse 正式版 データウェアハウジングおよび分析用のアジャイル・プラットフォーム を提供。メモリ内の最適化および列編成された BLU アクセラ レーション・テクノロジーを使用。 Geospatial Analytics Beta リアルタイムの地理空間分析。定義された地域において、デバイ スがいつ利用され、もしくは利用されなくなったかの情報を取得。 IBM Analytics for Hadoop Beta ビッグデータ・セットの分析アプリケーションを開発するための使い やすいインターフェースを備えた、Hadoop ベースのクラスターを 提供。⼤規模で複雑な分析を実⾏するためのエンタープライズ 機能を備えた IBM BigInsights を使用。 Time Series Database 正式版 IoT デバイス・データのための管理対象データ・ストアを追加して、 そのデータに対する時系列分析を実⾏する機能を提供。 Embeddable Reporting Beta IBM Cognos BI のレポートを実⾏。Cognos BI Dynamic Query モードを使用して作成されたコンテンツをサポート。 REST ベースのインターフェースを使用して、レポートを実⾏したり、 レポートをアプリケーションに容易に統合可能。 BigData Business Analytics 説明 18 © 2014 IBM Corporation 5つのアナリティクス関連のサービスのうち、正式版は Analytics Warehouse と Time Series Database です。 それ以外のサービスは、Beta 版として提供されています。 18 IBM Bluemix www.bluemix.net Analytics Warehouse データウェアハウジングおよび分析用の アジャイル・プラットフォーム データウェアハウス カラム型のインメモリーDB である IBM BLU Acceleration を搭載 分析機能 R を使った統計解析 RStudio による統合開発環境 アクセス方法 Web コンソール データのロード、クエリの実⾏、R スクリプトの 実⾏ 分析ツールとの連携 Cognos BI, Excel, Tableau, Microstrategy の ような分析アプリケーションとの連携 Bluemix アプリケーション 19 © 2014 IBM Corporation Analytics Warehouse は、データウェアハウジングおよび分析用のアジャイル・プ ラットフォームです。 分析に必要な要素(データウェアハウス、分析実行環境、統合開発環境)がすぐに 利用可能であり、データウェアハウスのワークロード向けの BLU Acceleration を搭 載していることが特徴です。 Webコンソールからの利用だけでなく、外部のBIツールとの連携、Bluemixランタイ ムとの連携も可能です。 19 IBM Bluemix www.bluemix.net DB2 BLU アクセラレーション 迅速なアナリティクスを実現する BLUアクセラレーション インメモリーカラム型 優れたメモリー管理技術とI/O効率、 CPU処理の最適化により実現 ハイブリッド型データベース BLUテーブルが従来の⾏テーブルと 共存 同じスキーマ、ストレージ、メモ リー内に共存 パラレル・ベクトル処理 マルチコアとSingle Instruction Multiple Data (SIMD)によって並列 処理を実現 コンプレッション データの順序を保持する業界初の データ圧縮機能によって、圧縮済み のデータを解凍することなくデータ を処理 BLUアクセラレーションを 実装したデータベース ランタイム 従来の DB2ランタイム 従来のDMS (非BLUテーブル用) BLU ランタイム BLU DMS (BLUテーブル用) 従来のDB2バッファープール SIMD機能を備えたCPU ストレージ 従来の⾏形式の テーブル C1 C2 C3 C4 C5 C6 C7 C8 圧縮とエンコードが ⾏われた列テーブル C1 C2 C3 C4 C5 C6 C7 C8 20 © 2014 IBM Corporation DB2 V10.5 からの新機能である BLU Acceleration は、 I/O 効率を高めることで データウェアハウス向けワークロードを効率的に処理することができます。 インメモリー・データベースにより低速なディスクへのアクセスを抑制します。 また、集計処理の多いデータウェアハウス向けに適したデータ構造として、カラム型 テーブルをサポートしています。 20 IBM Bluemix www.bluemix.net Analytics Warehouse のメニュー 主な機能 分析 (Analyze) Rスクリプトの開発 統合開発環境 RStudio との連携 Rスクリプトの実⾏ In-Database Analysis の実現 Excel との連携 外部データへの接続: Office データ接続 (.odc) ファイル 管理 (Manage) テーブルの参照 クエリ (SQL) の実⾏ データのロード Cloudant のデータとの同期 21 © 2014 IBM Corporation Analytics Warehouse のコンソールで実行できる主な作業です。 分析(Analyze)のメニューでは、R言語を使った統計解析を行います。 管理(Manage)のメニューでは、データのロードやデータの参照を行うことができま す。 21 IBM Bluemix www.bluemix.net R ⾔語での Analytics Warehouse の利用 データベースへのアクセス bluR : R から DB2 BLU へアクセスするためのライブラリ bluQuery : データの参照 (SQLクエリの発⾏) blu.data.frame : BLU データフレームの作成 インデータベース・アナリティクスを実現するためのデータフレーム library(bluR) con <- bluConnect( "BLUDB", "", "" ) bluAnalyticsInit( con ) # ローカル接続 data1 <- bluQuery( "SELECT * FROM GOSALES.ORDER_DETAILS" ) data2 <- blu.data.frame( "GOSALES.ORDER_DETAILS" ) bluClose(con) DB2 BLU からデータを抽出した後は、通常の R スクリプトと同様に処理するのみ BLU データフレームで、インデータベース・アナリティクスを簡単に実現できる 22 © 2014 IBM Corporation R言語の実行環境からデータベースにアクセスする場合は、データベースに対して ローカル接続します。 データへのアクセス方法は、大きく分けると二通りあります。 通常の SQLクエリを発行してデータベース上のデータを R のデータフレームに展 開するためには bluQuery() を利用します。 また、インデータベース・アナリティクスのアプローチのために、BLU データフレー ムを利用することもできます。これを利用した場合には、SQLクエリを利用せずに効 率的なデータアクセスを実現し、効率的な分析が可能となります。 データベースから取得したデータは、通常のRスクリプトと同様に分析することが可 能です。 22 IBM Bluemix www.bluemix.net Sinatra での Analytics Warehouse の利用 データベースへのアクセス VCAP_SERVICES 環境変数の情報を利用して接続 require 'ibm_db' conn = IBM_DB.connect "DATABASE=#{$database};HOSTNAME=#{$host}; PORT=#{$port};PROTOCOL=TCPIP;UID=#{$username}; PWD=#{$password};", '', '' stmt = IBM_DB.exec conn, $sql1 while(res = IBM_DB.fetch_assoc stmt) data[res['PRODUCT']][res['YEAR']] = res['PROFIT'] end IBM_DB.close conn DB2 BLU から抽出したデータは、Sinatra のフレームワークの中の view に値を埋め込む 23 © 2014 IBM Corporation Bluemix ランタイムから、Analytics Warehouse のデータベースにアクセスするた めには、リモート接続する必要があります。 接続に必要は情報は、VCAP_SERVICES 環境変数から取得します。 SQLクエリによって取得されたデータは、アプリケーションで加工・出力を行います。 Ruby Sinatra のような軽量のアプリケーション・フレームワークを利用した場合には、 フレームワークの view に値を埋め込んだり、外部のグラフ作成サービスと連携した りすることが容易です。 23 IBM Bluemix www.bluemix.net Geospatial Analytics (Beta) リアルタイム地理空間データ分析用の デバイス追跡プラットフォーム 特定領域へのデバイスの入退出のリアルタ イムの追跡 軽量の MQTT プロトコルの利用 MQTT のメッセージ・ブローカーを使って、 デバイスからのイベントの通知の受信とデバ イスの位置情報の提供 API によるリージョンの管理 リージョンの定義やリージョンの監視の制御 ユースケース例 ある小売店の近くに来たお客様へのリアルタ イムなプロモーション 事故や緊急事態の発生をリアルタイムにドラ イバーへ通知 24 © 2014 IBM Corporation Geospatial Analytics は、リアルタイムの地理空間データの分析用のデバイス追跡 プラットフォームです。 特定領域へのデバイスの入退出をリアルタイムで追跡することが可能です。 たとえば、顧客分析と連動したリアルタイムでのプロモーションに活用することなど が考えられます。 このサービスは軽量の MQTT プロトコルを採用しており、MQTT ブローカを別途 準備することが必要となります。 24 IBM Bluemix www.bluemix.net IBM Analytics for Hadoop (Beta) Hadoop ベースのクラスター環境 Hadoop の環境の構築・管理からの開放 InfoSphere BigInsights Enterprise Edition V3.0 オープンソースの Apache Hadoop がベース Hive, MapReduce, Pig などが利用可能 ビッグデータの分析アプリケーションの 開発に注⼒ Hadoop クラスター上のデータへの 簡単なアクセスと簡単なデータのロード 分析アプリケーションの簡単な開発 チャートやグラフを使った データの可視化 25 © 2014 IBM Corporation IBM Analytics for Hadoop は、Hadoop ベースのクラスター環境をクラウド上で提 供するサービスです。 オープンソースの Apache Hadoop がベースになっている InfoSphere BigInsights V3 が利用可能です。 迅速にHadoop環境を構築することが可能となると同時に、煩雑な運用管理の一部 から開放されるといった特徴があります。 運用管理にかかる労力を削減することで、利用者は分析アプリケーションの開発に 注力することが可能となります。 25 IBM Bluemix www.bluemix.net Time Series Database IoT デバイス・データのための データ・ストア メーターのような IoT デバイスの データの蓄積と時系列分析 IBM Informix 12.10 タイム・スタンプを伴う 時系列データの分析 スマートメータ、RFID タグ、セン サー・デバイスなど 例えばスマートメーターで収集された 電気使用量、株価や取引⾼、⼼電図の 記録、震動計、ネットワーク・パ フォーマンス・レコードなど、 幅広い種類のデバイスに対応 26 © 2014 IBM Corporation Time Series Database は、スマートメーターやセンサー・デバイスなどのIoTデバ イスのデータを蓄積したり時系列分析したりするためのサービスです。 IBM Informix TimeSeries V12.10 がベースとなっています。 タイムスタンプを伴う時系列データを効率的に扱うことができます。 26 IBM Bluemix www.bluemix.net Infomix TimeSeries 時系列データ用のデータ・ストア タイム・スタンプを伴う一連のデー タである時系列データに対する⾼速 データベース オフセット管理されたデータ インデックスはID列のみ Informix TimeSeries リレーショナル・アプローチ 処理時間 時系列データへの⾼速なアクセス データやインデックスの巨大化の抑制 デバイス ID データ・ ローディング タイムスタンプ列 1 起点:2010-12-01 01:00:00 [(4,160,40), (4.5,155,35), ….] 2 起点:2010-12-01 01:00:00 [(5,175,44), (4.5,160,35). .] ・・・・ ・・・・ インデックス=メーターIDのみ レポート生成 ディスクス ペース 他社リレーショナル・ データベース IBM Informix TimeSeries 27 © 2014 IBM Corporation Infomix TimeSeries は時系列データ用のデータストアです。 タイムスタンプを伴う一連のデータである寺家列データに対する高速データベース の機能を提供します。 通常のリレーショナルデータベースとは異なり、デバイスID をキーとして、ある時刻 を起点としてインターバルごとにデータを保管します。 この構造によって、データやインデックスの巨大化を抑制することができると同時に、 時系列データに対する高速アクセスを実現しています。 27 IBM Bluemix www.bluemix.net Embeddable Reporting (Beta) Business Intelligence のレポートや ダッシュボードの作成や統合の プラットフォーム BI機能の提供 レポーティング、ダッシュボード、多次元 分析(OLAP)、スコアカード、アラート 等 Cognos BI v10.2.1.1 RESTful API でのレポートの作成、アプ リケーションへレポートの統合 データベース リポジトリ: MongoDB connection レポートの仕様 データソース情報 Cognos BI model データ: DB2 JDBC connection レポートに表示する内容のデータ 28 © 2014 IBM Corporation Embeddable Reporting は、Business Intelligence のレポートやダッシュボードの 作成やアプリケーションへの統合を実現するプラットフォームを提供するサービスで す。 Cognos BI V10.2 がベースとなっており、多次元分析(OLAP) などの BI機能を利 用することができます。 レポートの仕様やデータソース情報やモデルの情報を格納するために MongoDB を利用します。 レポートに表示する内容のデータは、JDBC で接続するデータベースを利用します。 これらのデータベースは、Bluemix 上で提供される MongoDB や SQL Database のサービスを利用することが可能であり、Embeddable Reporting のサービスととも にランタイムにバインドします。 28 IBM Bluemix www.bluemix.net まとめ 29 © 2014 IBM Corporation 29 IBM Bluemix www.bluemix.net 分析を成功させる「3つの要因」 分析の目的の明確化 意思決定プロセスへの組込み 分析の経験やスキルの向上 分析の目的の 明確化 戦略 スモールスタート トライアル&エラー 分析の経験やスキル の向上 人 業務 実装 意思決定プロセス への組込み 30 © 2014 IBM Corporation 分析を成功させるためには3つの要因があるといわれています。 まずは、分析の目的とゴールを明確にすることです。どんなビジネス課題を解決す るためにデータ分析を行うかを明確にすることが重要です。 次に、データ分析から得られた知見を、事実に基づく客観的な判断として、意思決 定プロセスに組み込むことが大切です。分析結果を意思決定に活用できなければ、 従来の直感での意思決定から抜け出すことができません。 また、データサイエンティストのような、具体的な業務や業界の専門性の知識や見 識をもった分析者も欠かせません。 Bluemix は開発者に対して、アジャイルなアプリケーション開発の環境を提供しま す。Bluemixを使えば、データ分析のための柔軟な分析基盤をすぐに利用可能で す。 これによって、最小限の時間とコストで分析アプリケーションの開発を始めることが でき、スモールスタートが容易になります。 また、フィードバック・ループをまわしながらトライアル&エラーのアプローチが重要 といわれるデータ分析において、新しい分析スキルを身につけることも容易になりま す。 30 IBM Bluemix www.bluemix.net 分析で成功するための「3つのステップ」 準備 ビッグデータ& アナリティクス の基礎 実⾏ 価値実現に 必須 戦略 戦略 価値の源泉 評価 分析の成果と価値創出 を合致させる ビジネスインパクト測定と未 来設計 業務 実装 分析 基盤 プラットフォーム ビッグデータを取扱う システム基盤を確保する データ 業務 実装 企業文化 データ 信頼 事実をベースとした 意思決定を⾏う データに自信を持つ セキュリティと統制 信頼できる組織関係 分析結果の信頼 戦略 業務 実装 拡大 スポンサーシップ 投資 価値創造の 強化 共有すべきVisionを 明確にし、⾏動を促す 厳格さと協調によって 価値を生み出す 人 専門知識 人 ベース ライン 分析 スキル 経験 知識 スキルと機能の開発 および利用 出典:Analytics: A blueprint for value – Converting big data and analytics into results, IBM Institute for Business Value © 2013 IBM 31 © 2014 IBM Corporation 分析で成功するための最初のステップとして、分析の目的とゴールを明確にすることが重要ですが、 柔軟な分析基盤を確保することも必要です。 Bluemix では、分析基盤として、いますぐに利用可能なデータウェアハウスや統計解析の実行環境 を提供しています。 Bluemix で提供されるアナリティクス関連のサービスを分析基盤を一つのエントリーポイントとしてま ず分析をはじめることが、分析を成功させる入り口となります。 31 IBM Bluemix www.bluemix.net IBM Bluemix www.bluemix.net 32 © 2014 IBM Corporation 32