사용자 도구

사이트 도구


dbms:olap

OLAP

정의

  1. OLAP(On-Line Analytical Processing)이라는 용어는 E.F. Codd에 의하여 처음 사용되었다.
  2. OLTP(On-line Transaction Processing)의 상대적 개념으로 사용되어지고 있다.
  3. DW(데이터 웨어하우스)나 CRM 시스템에서 데이터 접근 및 활용 전략에 있어서 매우 중요한 기술요소로서 다루어진다.
  4. OLAP은 데이터의 분석과 관리의 목적을 위해서 다차원 데이터를 모으고, 관리하고, 프로세싱하고, 표현하기위한 응용프로그램 및 기술들의 종류를 뜻한다.
  5. 최종 사용자가 데이터베이스에 쉽게 접근하여 필요로 하는 정보를 직접 작성하고 의사결정에 활용하는 일련의 과정이다.
  6. OLAP 제품이란 공유된 다차원적 정보의 빠른 분석을 제공할 수 있는 제품이다.
  7. 비정형적 질의(Ad-hoc Query) 분석은 아마도 제품 자체 내에서나 혹은 밀접하게 연결되어 있는 관련 제품 내에서 가능할 것이다.

특징

  1. 분석을 위해 활용되는 정보의 형태가 다차원적이라는 사실이다. 다차원정보는 사용자들에 의해 이해되는 기업의 실제 차원(기간, 제품, 부서, 지역 등)을 반영한다.
    정보의 다차원성은 OLAP을 다른 시스템과 구분하는 가장 중요한 개념이고 OLAP를 다른 용어로 표현한다면 바로 “다차원 분석”이다.
  2. 최종사용자는 중간 매개자(정보처리 담당자)나 매개체(인쇄된 보고서) 없이 온라인 상에서 직접 데이터에 접근한다는 것이다.
  3. 최종사용자는 대화식(interactive)으로 정보를 분석한다는 것이다. 시스템은 사용자의 사고 흐름이 중간에 끊이지 않도록 신속하게 질의 결과를 제시할 수 있어야 한다는 의미이다.
  4. OLAP의 목적은 최종사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원하는데 있다.
  5. OLTP은 매일매일의 기업운영을 가능하게 하는 반면, OLAP은 기업이 나가야 할 방향을 설정할 수 있는 것이다.
  • OLAP의 특성
    1. 대규모 데이터에 접근
    2. 업무 요소들 간의 다양한 관계를 분석함
    3. 통합된 정보
    4. 다양한 계층의 시계열 정보
    5. 다양한 관점에서 표현된 정보
    6. 사용자의 질의에 대한 빠른 응답

데이터웨어하우스와 OLAP 비교

  • 데이터웨어하우스(DW)와 OLAP시스템의 성능(capability)을 구분하는 것이 중요하다. 일반적으로 관계형 기술에 기반을 둔 데이터웨어하우스에 비해 OLAP은 전략적정보와 나아가 분석을 제공하는 정보에 빠른 접근을 제공하는 합산데이터의 다차원적 관점을 사용한다.
  • OLAP과 데이터웨어하우스는 상호보완 관계이다. 데이터웨어하우스는 데이터를 저장하고 관리한다. OLAP은 데이터웨어하우스의 데이터를 전략적인 정보로 변환한다. OLAP은 기본적인 접근(navigation)과 조회(browsing)에서부터 계산, 시계열(time series), 복잡한 모델링까지의 영역을 가진다.
  • 의사결정권자들이 더욱 진보된 OLAP 성능을 시험함에 따라 그들은 데이터 접근에서부터 정보를 지식화 하는 방향으로 가고 있다.
데이터 웨어하우스 OLAP
잠재적인 모든 유형의 질의 대처 특화된 분석용
Very Large, highly detailed data Large, Lightly detailed data
읽기 전용 읽기 / 쓰기(Planning, Budgeting)

OLTP와 OLAP 비교

  • OLTP은 매일매일의 기업운영을 가능하게 하는 거래처리 시스템이고, OLAP은 다차원 분석에 의해서 기업이 나가야 할 방향을 설정할 수 있는 것이다.
  • OLAP의 목적은 최종사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원하는데 있다.
  • OLTP와 OLAP의 비교항목을 요약하면 다음과 같다.
구분 OLTP OLAP
데이터의 구조 복잡 (운영 시스템 계산에 적합) 단순(사업 분석에 적합)
데이터의 갱신 순간적/동적 주기적/정적
응답 시간 2, 3 초 ~ 몇 초 이내 수 초 ~ 몇 분까지도 가능
데이터의 범위 과거 30 일 ~ 90 일 과거 5 년 ~ 10 년
데이터 성격 정규/핵심 업무 데이터, mission critical 데이터 비정규/read-only 데이터,index 에 의존
데이터의 크기 수 Giga Byte 수 Tera Byte
데이터의 내용 현재 데이터 기록 보관된, 요약/계산 데이터
데이터 특성 거래처리(transaction) 중심 주제(subject) 중심
데이터 액세스 빈도 높음 보통 혹은 낮음
데이터의 사용법 고도로 구조화된 연속 처리 고도로 비구조화 된 분석 처리
쿼리의 성격 예언 가능, 주기적 예측하기 어렵고, 특수하다

MOLAP와 ROLAP 비교

  • OLAP 은 그 구성에 따라 MOLAP(Multi-dimensional OLAP)과 ROLAP (Relational OLAP)으로 구분한다.
  • MOLAP 은 다차원의 데이터베이스를 큐브 형태의 데이터 뷰로 작성하여 사용자 OLAP 제품을 이용하여 다양한 분석을 할 수 있는 구성으로 되어 있고,
    ROLAP 은 사용자의 요건 분석을 취합하여 사용자 관점의 뷰를 메타데이터로 구성하여 그를 통한 사용자 쿼리 및 보고서 작성, 다양한 분석을 할 수 있는 구성으로 되어 있다.
  • OLAP 서버는 MDB나 MDD(Multi-dimensional DataBase)라고도 불리는 다차원 데이터베이스 서버를 의미하게 된다.
  • Arbor사의 Essbase Server 제품을 대표적인 예로 들 수 있다.
  • MDD는 다른 데이터베이스에서 추출한 요약된 데이터를 일반적으로 대규모의 공유 큐브에 저장하게 된다.
  • 이 큐브에는 보통 다음 번 갱신 작업을 하기 전까지는 정적인 데이터가 보관된다.
  • ROLAP은 관계형 데이터베이스를 기반으로 하는 OLAP이다.
  • ROLAP서버는 미리 계산된 스테이지 큐브를 보유하지 않는 대신 데이터 웨어하우스 전용 데이터베이스나 관계형 데이터베이스를 데이터 소스로 이용하고 중간 단계 서버(전용 OLAP서버)에 이들의 데이터를 보유한다.
  • 최종 사용자는 OLAP서버에 연결하고 OLAP서버는 RDBMS에 쿼리를 보내게 된다.
  • ROLAP서버가 RDBMS로부터 데이터를 받게 되면 자체 큐브를 생성하고 적은 양의 데이터 셋트만 클라이언트로 되돌려 주게 된다.
  • 데이터웨어하우스 전용의 데이터베이스에는 NCR Teradata, Sybase IQ 그리고 Informix RedBrick 등이 있고, 관계형 데이터베이스는 Oracle 이나 SQL 서버 등이 이에 포함된다.
  • ROLAP과 MDD는 보통 분석 작업을 수행하는 동안 데이터베이스에 대한 접속을 계속해서 유지하고 있어야 한다.
  • MDD는 데이터 마트에 적합하지만 요약 데이터와 상세 데이터 둘 다를 요구할 경우에 데이터의 “폭발” 경향을 보이는 대규모 데이터웨어하우스에는 적합하지 않다.
  • MDD는 재정분석에 가장 많이 사용되고 있다.
  • ROLAP시스템은 설치하기가 복잡할 뿐만 아니라 관리하기도 매우 복잡하다고 보고되어지고 있다.
  • 또한 ROLAP에서의 잇점을 제대로 활용하려면 RDBMS 후면의 아키텍쳐를 변경할 필요성이 종종 있다고 한다.
MOLAP OLAP
다차원 OLAP(MDB기반의 OLAP), Real Data Cube 관계형 OLAP(RDB기반의 OLAP), Virtual Data Cube
다차원 data view를 미리 정의한 후 질의 수행
(예:영업실적을 제품/브랜드/계절 /가계별로 검색 후 질의 수행)
강력하고 유연한 질의 기능 확장성 있는 다차원 구조
drill-down/pivoting/복잡한 회계연산 구현 가능 복잡한 회계연산 구현 불가
많은 공간 차지 (기본량의 5~10배 이상), 대용량 처리 불가 적은 공간 차지(기본량의 2배 이내), 대용량 처리 가능
차원 수와 값이 많아지면, 큐브(cube) 크기가 기하급수적으로 증가 차원 수와 관계없이 처리
그대로 다차원 분석 가능 다차원 분석을 위해서 데이터 모델링을 수행하는 스타
a.스키마(Star Schema), 스노우플레이크
b.스키마(Snowflake Schema) 필요
사용자 요구 변경 시 재 구축 사용자 요구 변경 시 쉽게 대처
재무 Application에 적합 끊임없이 데이터가 갱신되는 POS(Point Of Sales) S/W 등의 마케팅 애플리케이션(Application) 에 적합

MOLTP와 ROLAP의 비교

  • ROLAP 계열의 제품 중에서는 DSS Agent와 Decision Suite가 용량이 큰 서버이고 고가이다.
  • BusinessObjects 제품은 ROLAP 제품으로서 MOLAP 방식의 분석 기능을 제공한다.
  • MOLAP 계열의 제품 중에서는 Oracle Express와 Hyperion Essbase가 용량이 큰 서버이고 고가이다.
  • Cognos PowerPlay 제품은 Desktop MOLAP 제품으로 부서단위 업무분석 도구로 많이 활용되고 있다.
  1. MOLAP 도구(Tools)
    1. Hyperion사의 Essbase
    2. Cognos PowerPlay
    3. Comshare사의 commander EIS/OLAP
    4. Oracle사의 Express
    5. Sciences사의 Gentia
  2. ROLAP 도구(Tools)
    1. BusinessObjects사의 BusinessObjects
    2. Microstrategy사의 DSS Agent
    3. Brio Technology사의 Brio Query
    4. Infomix사의 MetaCube
    5. Information Advantage사의 Decision Support Suite
    6. Oracle사의 Discoverer

CRM과 OLAP의 비교

  • CRM과 OLAP의 관계는 CRM의 업무분류에서 확인할 수 있다.
  • Analytical CRM은 데이터 웨어하우스, 데이터 마이닝, OLAP을 이용하여 고객의 다양한 분석을 접근하는 Extended DW로 해석된다.
  • 이와 비교하여 Collaborative CRM이나 Operational CRM은 ERP가 가지고 있는 기능 중에서 고객 접촉과 관련된 기능을 강화하여 ERP의 기능을 확장하거나 인터넷에 대응하는 신개념의 e-CRM이다.

dbms/olap.txt · 마지막으로 수정됨: 2007/02/23 11:32 저자 starlits