...

사례로 보는 프로젝트의 한지수 이사 한국이엠씨컴퓨터시스템즈㈜

by user

on
Category: Documents
38

views

Report

Comments

Transcript

사례로 보는 프로젝트의 한지수 이사 한국이엠씨컴퓨터시스템즈㈜
사례로 보는 Big Data 프로젝트의 Success Factor
한지수 이사
한국이엠씨컴퓨터시스템즈㈜
© Copyright 2015 EMC Corporation. All rights reserved.
1
목차
• Big Data는 무엇인가?
• BI/DW와 Big Data의 차이점?
• Big Data프로젝트의 목표
• Big Data 프로젝트 수행의 3가지 어려움
• Big Data 프로젝트 사례와 시사점
• Key Success Factor
• Big Data 수행을 위한 조직
• Big Data 수행을 위한 Technology
• Big Data 프로젝트 수행 단계
• Best partner for Big Data
© Copyright 2015 EMC Corporation. All rights reserved.
2
Big Data는 무엇인가?
Big Data
비즈니스
가치
향상된 Insight 제공
사내 + 사외
(정형, 비정형)
Smart 의사결정
Data 기반 사고 혁신
사내(정형)
기존 데이터
• 사내  사내 + 사외 (Web, SNS 등)
Volume
Various
Velocity
Business 경쟁력 제고
데이터
• 정형  정형+비정형 (문서, 메일, 이미지, 동영상, 로그 등)
© Copyright 2015 EMC Corporation. All rights reserved.
3
BI/DW 와 Big Data의 차이점?
Big Data Analytics (Data Science)
Interpretation
based
Why it
happened?
What
we will do?
ANALYSIS
데이터 유형
분석기법
일반적 질문
What
happened?
Fact
based
Past
TIME
Business
Intelligence
Big Data
Analytics
© Copyright 2015 EMC Corporation. All rights reserved.
What
will
happen?
Future
• 대규모 data set
• 정형/비정형 Data, File, 음성/이미지/텍스트 등
• 최적화 모델 / 통계학적 분석 / 예측분석 모델 /
Forecasting / Early Warning 등
• 어떤 결과가 나올 것인지?(What-if simulation)
• 우리 비즈니스에 최적화된 시나리오는 무엇인지?
• 향후에 어떤 일이 발생할 것인지?
Business Intelligence
데이터 유형
분석기법
일반적 질문
• 비교적 소규모의 data set
• 정형 Data, 전통적 RDBMS 소스
• 집약적 대시보드 / 스탠다드 ad hoc 리포팅 / Alerts
/ 정형 Query 등
• 지난 분기에 발생한 일은?
• 왜 발생했는지?
• 과거 실적 및 영업이익은?
4
Big Data의 프로젝트의 목표
고객 중심의
R&D
생산/품질 향상
계정계 데이터
흐름에 대한 분석
금융회사의
목표
제조회사의
목표
마케팅 분석의
고도화
고도의 AS 정보
제공
고객 중심의
이니셔티브
Strong
Analysis
병렬처리 프로세싱
* Source: the Saïd Business School at the University of Oxford
© Copyright 2015 EMC Corporation. All rights reserved.
5
Big Data 프로젝트 수행의 3가지 어려움
1
왜 Big Data를 도입해야 하나?
• 회사의 비즈니스와 Align 하여 “무엇”을 “왜” 분석해야 하는지 목표가 명확하지 않다
• “무엇을 예측”할 것인가?, “무엇을 최적화”할 것인 가에 대한 막연한 목표
2
IT 부서 주도의 기술구현 프로젝트
• 업무현장의 Insight를 반영하기 어렵고, 분석의 효과로서 목적하는 바가 분명하지 않다
• 기존의 시스템으로부터 “어떤 데이터”를 “어떠한 방식”으로 수집할 것인지 확실치 않다
3
매우 다양한 분석 요구사항과 시스템 연계
• 분석데이터를 요구하는 조직마다 매우 “다양한 원천데이터”와 “다양한 분석기법”을 요구
© Copyright 2015 EMC Corporation. All rights reserved.
6
Big Data 프로젝트 사례와 시사점(1/3)
왜 Big Data 를 도입해야 하나? > 추진 과제 선정 프로젝트의 선행
Challenging Questions
Cases
C 증권
조직 차원의 분석 목표와
분석 대상을 정의하였는가?
대상 Biz-Case 핵심과제를
도출하였는가?
C레벨의 스폰서쉽을
확보하였는가?
Key Findings
<월별 주가 예측 리포트>
주가 예측 정확도 향상
1) 95개 주가 종목의 예측이 가능한
K-Index 지표 개발
2) 통계경제지표, SNS, 블로그 등
내/외부 통합데이터 분석 플랫폼 구축
 적합한 주제/목표
3) ’13년 Big Data Award우수상 수상
 분석 데이터의
식별
P 제조
빅데이터 기반 생산관리시스템
<생산관리시스템 품질관리>
전직원 공모(358개)
투자 효과에 대한 분석과
예측이 가능한가?
선행과제 실행으로
Big Data 선
부서별 토론/임원 토론
경험으로
향후 시행착오를
현업부서장(우선순위: 35개) 줄이고자 함
선행과제 20개 추출
© Copyright 2015 EMC Corporation. All rights reserved.
• 추진과제 고도화
 ’13년: 20여개의 Pilot 과제
 ’14년: 기 수행 7개 과제
검증 및 개선
7
Big Data 프로젝트 사례와 시사점(2/3)
IT 부서 주도의 기술구현 프로젝트 > 회사 전체의 Big Data 수준 향상
Challenging Questions
Cases
D중공업
현업분석가, Biz전문가가
함께 참여하였는가?
데이터 분석인력(Scientist)
는 육성 및 확보하였는가?
Biz-Case에 적합하게 적용할
분석 모델은 수립하였는가?
Pilot을 통한 주제분석 및 사전 교육
1. 과제별 현업전문가, 분석전문가 및
Data Scientist 양성
Key Findings
Pilot
과제수행
심화교육
(2주)
기본교육
(1주)
분석가 활용
 조직의 빅데이터
역량 향상을 위한
데이터 분석가 양성
C 물류
현실성 있는 분석 모델 개발
1. 실무진과의 참여와 검증을 통해
물동량 예측을 위한 모델 개발
 적합한 과제와 분석
모델 적용
H중공업
조직 전사 수준의 빅데이터
수준 진단은 되어있는가?
© Copyright 2015 EMC Corporation. All rights reserved.
빅데이터 수준 진단 및 과제선정
H
사
1. 빅 데이터 조직 수준을진단
2. 전체 업무 중 25개를 빅데이터 분석
과제로 선정, 최우선과제 4개 정의
8
Big Data 프로젝트 사례와 시사점(3/3)
매우 다양한 분석 요구사항과 시스템 연계 > BIG DATA ON CLOUD
Challenging Questions
Cases
Key Findings
S 제조
추가 요구사항 수렴이
용이한 확장 구조인가?
구현
목표
공정 품질
관제 체계
Big Data
기반 자동
분석 체계
다양한 분석
및 결과
Feed
Back
품질 추적
체계 고도화
안정적으로 대용량을
지원하는 플랫폼인가?
 최적의 솔루션 구축
 안정적인 운영/확산
산재된 데이터 통합 및
연계방안은 검토되었는가?
각 분석 환경에 유연한
대응은 가능한가?
Cloud 환경 적용
© Copyright 2015 EMC Corporation. All rights reserved.
9
Key success factor
1
적합한 주제/목표
수행 조직과 역할
(Master Plan)
2
3
4
분석 데이터의 식별
역량향상을 위한 데이터 분석가 양성
적합한 과제와 분석 모델 적용
적용 Technology
철저한 사전 준비와
검증을 통한
Big Data
프로젝트 수행
(Implementation)
5
최적의 솔루션 구축
6
안정적인 운영/확산
© Copyright 2015 EMC Corporation. All rights reserved.
10
Big Data 수행을 위한 조직
People
Business
Role & Responsibility
• Biz Expert (업무 담당자)
• 주제/과제 정의
• Data Scientist (분석가)
• 업무 통찰력 / 분석 수행
• Big Data Coordinator
• 우선순위, 키워드 정의
목적과 효과
• 분석 방법론 적용
Data
• Data Architect
• Solution Architect
• Big Data Consultant
Technology
• DB Administrator
• Hadoop Administrator
• HW/SW/NW Engineer
• Solution Specialist
© Copyright 2015 EMC Corporation. All rights reserved.
• 필요 데이터 식별/확보
• 원천/목표 데이터 정의
• 데이터 논리/물리모델 설계
• 속성 데이터 정의
• 데이터 관리 및 활용 체계 수립
Data 수집과 관리
• 아키텍처 총괄적 설계, 관리
• 데이터 기술적 관리, 처리
• 서버, NW, 스토리지 기술지원
• 관련 소프트웨어 기술지원
• 제품별 유지보수
Solutions
11
Big Data 수행을 위한 technology
기업의 Value Chain 에서 생성되는 모든 데이터의 저장
소셜
데이터
Aster
Mobile
데이터
Crawler
Extract
시스템
데이터
ETL
CEP
Analytics
GemFire
Staging
8
Analytic
Mart
EDW
GP
Loader
GPHDFS
protocol
GP
Loader
Greenplum &
Hadoop
Interface
Enterprise
DW
예측 모델
Adatper
HAWQ
Staging
4
© Copyright 2015 EMC Corporation. All rights reserved.
Big Data 시각화,
모바일
GPFDIST
protocol
Hadoop
SQLFire
Visual
Analytics
HighPerformance
Analytics
In-DB Scoring
Load
분석 UI
Cloud Architecture
Greenplum DB
Flume
SmartTV
데이터
생산설비
데이터
Data Ingestion & ETL
SpringXD
Analytic on Demand
Big Data Lake
데이터 수집
데이터 원천
DB SandBox
전처리
Hadoop In-DB
Scoring
결과
GPHDFS
protocol
Hadoop
SandBox
12
Big Data 프로젝트 수행 단계
Master Plan
수립
Pilot 수행
전문가 양성
Implementation
© Copyright 2015 EMC Corporation. All rights reserved.
“점진적 추진” : 과제 우선 순위 – 선택과 집중
“시작이 반” : 신속한 추진 전략과 Roadmap
“백문이 불여일견” : Pilot을 통해 실제 체험
“강력한 Sponsorship 확보” : C 레벨의 의지
“소수 정예” : 전문가를 양성하고 전담 조직 구성
“역량 내재화” : 외부 전문업체를 활용하여 기술내재화
“전사 프로젝트” : 최고 효율과 최대 성과를 획득
“뛰어난 Partnership” : 성공확률 극대화
13
Best partner for big data
Solution과 경험을 보유한 Big Data 프로젝트의 최고의 파트너는 EMC
Big Data 위한 최적의 플랫폼
Big Data 전용 솔루션
Big Data를 위한 맞춤형 서비스
1. 적합한 주제/목표
2. 분석 데이터의
식별
Data
Scientist
Big Data Planning
교육
3. 역량향상을 위한 데이터 분석가 양성
Big Data 분석
4. 적합한 과제와 분석
모델 적용
DB/HD
대용량
HDFS
Big Data Architecting
5. 최적의 솔루션 구축
백업
Big Data Implementation
BigData를 구현하기 위한
Converged Infra, Storage, Virtualization
© Copyright 2015 EMC Corporation. All rights reserved.
6. 안정적인 운영/확산
Big Data를 효과적으로 저장, 관리, 분석 위한
최적의 제품 및 솔루션
Big Data 구축
관리 자동화
Big Data를 통한 비즈니스 가치 창출을 위한
최적의 프로페셔널 서비스 제공
14
Fly UP