본문 바로가기

CERTIFICATION/ADsP

[D-7/핵심포인트 정리] 2과목 데이터 분석 기획

1-1. 분석 기획 방향성 도출

01. 분석 기획의 특징

     (1) 분석 기획

  • 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했떤 결과를 도출할 수 있도록
    이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업

     (2) 데이터 사이언티스트의 역량

  • 수학/통계학적 지식 + 정보기술(IT 기술, 해킹 기술, 통신 기술 등) + 비즈니스에 대한 이해와 전문성

 

02. 분석 대상과 방법

  • 분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 분류

  • Optimization : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화의 형태로 수행
  • Solution : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 분석과제 수행
  • Insight : 분석 대상이 불분명하고, 분석 방법을 알고 있는 경우 인사이트 도출
  • Discovery : 분석 대상, 방법을 모른다면 발견을 통하여 분석 대상 자체르 새롭게 도출
✔ 4가지 주제 유형 정의 출제

 

03. 목표 시점별 분석 기획 방안

  • 과제 중심적인 접근 방식 : 당면한 과제를 빠르게 해결
  • 장기적인 마스터플랜 방식 : 지속적인 분석 내재화로 해결
✔ 과제단위와 마스터플랜단위 구분 문제 출제

 

04. 분석 기획시 고려사항

  • 분석의 기본인 가용 데이터(Available Data)에 대한 고려 필요
  • 분석을 통해 가치가 창출될 수 있는 적절한 활용방안과 유스케이스(Proper Business Use Case) 탐색 필요
  • 분석 수행시 발생하는 장애요소들에 대한 사전계획 수립 필요(Low Barrier Of Execution)

 


1-2. 분석 방법론

01. 분석 방법론 개요

     (1) 기업의 합리적 의사 결정을 가로막는 장애 요소

  • 고정 관념(Stereotype)
  • 편향된 생각(Bias)
  • 프레이밍 효과(Framing Effect)

 

     (2) 방법론의 적용 업무의 특성에 다른 모델

  • 폭포수 모델(Waterfall Model)
    - 단계별로 철저한 검토와 승인 과정을 거쳐 확실히 매듭짓고 다음 단계로 진행하는 하향식(Top Down) 모델
    - 문제나 개선사항이 발견되면 전단게로 돌아가는 피드백 과정 수행
  • 프로토타입 모델(Prototype Model)
    - 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서
      일단 분석을 시도해보고 그 결과를 확인해가면서 반복적으로 개선해나가는 방법
    - 개발 시간 단축
  • 나선형 모델(Spiral Model)
    - 여러 번의 개발 과정을 거쳐 점진적으로 프로젝트를 완성해가는 모델
    - 처음 시도하는 프로젝트에 적용이 용이, 반복에 대한 관리체계를 효과적으로 갖추지 못한 경우
      프로젝트 진행이 어려움
    - 대규모 시스템 소프트웨어 개발에 적합
✔ 각 모델의 장단점과 모델 구분 출제
  - 프로토타입 설명 보기에 개발 시간이 오래 걸린다 => 오답!

 

     (3) 분석 방법론의 구성 요소

  • 상세한 절차(Procedure)
  • 방법(Methods)
  • 도구와 기법(Tools & Techniques)
  • 템플릿과 산출물(Templates & Outputs)
✔ 분석방법론의 구성요소 4가지

 

 

02. KDD 분석 방법론

📌 KDD(Knowledge Discovery in Database)
 데이터베이스에서 의미있는 지식을 탐색하는 데이터 마이닝, 기계학습, 인공지능, 패턴 인식, 데이터 시각화 등에 응용
  • 분석 대상의 비즈니스 도메인에 대한 이해와 프로젝트 목표를 정확하게 설정
  • 데이터셋 선택(Selection)
  • 데이터 전처리(Preprocessing)
    - 분석 데이터 세트에 포함된 잡음(Noise), 이상값(Outlier), 결측치(Missing value)를 식별하고 필요할 때 제거
  • 데이터 변환(Transformation)
    - 분석 목적에 맞는 변수를 선택하거나 데이터 차원을 축소하여 데이터 마이닝을 효율적으로 적용할 수 있도록
      데이터셋 변경
  • 데이터 마이닝(Data Mining)
    - 변환된 데이터셋을 이용하여 분석 목적에 맞는 데이터 마이닝 기법 선택
    - 데이터 마이닝 알고리즘을 선택하여 패턴을 찾거나 데이터 분류, 예측 등 마이닝 작업 시행
  • 결과 평가(Interpretation/Evaluation)
    - 분석 결과에 대한 해석과 평가, 활용

✔ KDD 분석 단계별 내용과 순서 출제

 

03. CRISP-DM 분석 방법론

📌 CRISP-DM(Cross Industry Standard Process For Data Mining)
   6단계 구성으로, 각 단계는 폭포수모델처럼 단방향이 아니라, 단계간 피드백을 통하여 완성도를 높임  
  • 업무 이해(Business Understanding)
    - 비즈니스 관점 프로젝트의 목적과 요구 사항을 이해하기 위한 단계
    - 도메인 지식을 데이터 분석을 위한 문제 정의로 변경하고 초기 프로젝트 계획을 수립하는 단계
    - 업무 목적 파악, 상황 파악, 데이터 마이닝 목표설정, 프로젝트 계획 수립으로 구성
  • 데이터 이해(Data Understanding)
    - 분석을 위한 데이터 수집, 데이터 속성 이해를 위한 과정으로 구성
    - 데이터 품질에 대한 문제점 식별 및 숨겨져 있는 인사이트 발견 단계
    - 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인 
  • 데이터 준비(Data Preparation)
    - 분석을 위하여 수집된 데이터에서 분석 기법에 적합한 데이터셋 편성 단계
    - 많은 시간 소요
    - 분석용 데이터셋 선택, 데이터 정제, 데이터 통합, 데이터 포맷팅
  • 모델링(Modeling)
    - 다양한 모델링 기법과 알고리즘을 선택해 모델링 과정에서 사용되는 파라미터를 최적화
    - 이 단계를 통해 찾아낸 모델은 테스트용 프로세스와 데이터셋을 평가하여 모델과적합(Overfitting)
      문제를 발견하고 대응방안 마련
    - 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가
  • 평가(Evaluation)
  • 전개(Deployment)

✔ 순서와 화살표의 양방향(피드백)이 형성되는 구간 출제

 

04. 빅데이터 분석 방법론

     (1) 빅데이터 분석의 계층적 프로세스

 

     (2) 빅데이터 분석 방법론의 5단계

✔ 각 테스크 안에 어떤 스텝이 있는지 출제
    - 분석 기획 단계에서 프로젝트 위험 대응 계획을 수립할 때 예상되는 위험에 대한 대응 방법 : 회피, 전이, 완화, 수용

 


1-3. 분석 과제 발굴

01. 분석과제 발굴 방법론

     (1) 하향식 접근 vs 상향식 접근

하향식 접근 방식
(Top Down Approach)
분석과제가 주어지고 이에 대한 해법을 찾기 위해 각 과정이 체계적으로 단계화되어 수행
상향식 접근 방식
(Bottom Up Approach)
문제의 정의 자체가 어려운 경우, 데이터 기반으로 문제를 지속적으로 개선
✔ 상향식 접근방식과 하향식 접근방식 차이점 출제
📌 문제가 주어져 있는 상태에서 답을 구하는 하향식 접근 방식이 전통적으로 수행되었던 분석 과제 발굴
📌 대규모의 다양한 데이터를 생성하고 빠르게 변하는 기업 환경에서는 문제 자체의 변화가 심해 문제를 사전에
      정의하는 것이 어려워짐. 데이터를 활용하여 생각하지 못했던 인사이트를 도출하고 시행착오를 통해
      개선해가는 상향식 접근방식이 점차 증가하는 추세

 

 

     (2) 디자인 씽킹(사고)

  • 넓은 의미에서 디자이너의 사고 방식을 의미
    - 디자이너는 시작 단계에서 대상을 자세히 관찰하고 그 상황이나 대상에 공감함으로써 많은 가능성과 아이디어를
      생각해냄
  • 그 이후 많은 아이디어를 내고 그것을 다시 필터링하고 이 과정을 반복하면서 최선의 결과 도출
  • 사용자들에게 공감하는 것에서 시작해 상향식=아이디어를 발산하고 곧 하향식=수렴하는 과정을 거쳐 많은
    프로토타이핑과 피드백을 수렴하여 발전하는 과정

 

     (3) 디자인 씽킹 프로세스 5단계

  • Empathize(공감) : 사용자 인터뷰 등을 통해 고객의 문제에 공감하는 단계
  • Define(정의) : 첫번째 얻는 통찰을 바탕으로 고객의 진짜 문제를 정의하는 과정
    - ex) pain point 발굴
  • Ideate(아이디어) : 현실 가능성을 고려하지 않고 자유롭게 고객에게 적합한 해결방안 제시
    - ex) pain point 개선 중심
  • Prototype : 새로운 아이디어를 프로토타입으로 만들어보거나 서비스에 대한 시나리오 만들어보는 단계
  • Test : 1차적으로 완성된 프로토타입에 대한 고객의 피드백을 바탕으로 프로토타입 개선
✔ 디자인 씽킹 프로세스 단계별 개념 정리 및 순서 출제

 

02. 하향식 접근 방식(Top Down Approach)

  • 향식 접근법의 한계
    - 문제의 구조가 분명하고 문제를 해결하고 해결책 시도에는 적합
    - 새로운 문제의 탐색에 한계

 

03. 하향식 접근 방식의 과정

     (1) 문제 탐색(Problem Discovery)

  • 비즈니스 모델 기반 문제 탐색
    - 전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출하고 식별하는 것이 중요
    - 업무(Operation), 제품(Product), 고객(Customer), 규제와 감사(Regulation & Audit), 지원 인프라(IT & Human Resource) 등 5가지 영역으로 기업의 비즈니스를 분석

✔ 비즈니스 모델 캔버스의 9가지 블록을 단순화한 것이 위에 5가지 영역으로 출제
  • 외부 참조 모델 기반의 문제 탐색
    - 유사, 동종 사례 벤치마킹을 통해 분석 기회 발굴
    - 평상시 지속적인 조사와 데이터 분석을 통한 가치 발굴 사례를 정리하여 풀(Pool)로 만들어둔다면
      과제 발굴 및 탐색시 빠르고 의미있는 분석 기회 도출 가능
  • 분석 유스 케이스(Analytics Use Case) 정의
    - 문제에 대한 상세 설명과 기대효과를 명시하여 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용
  • 분석 기회 발굴의 범위 확장

  • 거시적 관점(STEEP)
    - 사회(Social) 영역
    - 기술(Technology) 영역
    - 경제(Economic) 영역
    - 환경(Environmental) 영역
    - 정치(Political) 영역
  • 경쟁자 확대 관점(위협이 될 수 있는 상황)
    - 대체재 영역 : 현재 생산을 수행하고 있는 제품, 서비스의 대체재 파악
    - 경쟁자 영역 : 현재 생상을 수행하고 있는 제품, 서비스의 주요 경장자에 대한 동향 파악
    - 신규진입자 영역 : 향후 시장에 대해서 위협이 될 수 있는 신규진입자에 대한 동향 파악
  • 시장의 니즈 관점
    - 고객 영역
      고객의 구매 동향 및 고객의 컨텍스트를 더욱 깊게 이해하여 제품, 서비스 개선 필요에 필요한 분석 기회 도출
    - 채널 영역
      영업 사원, 직관 대리점, 홈페이지 등의 자체적으로 운영하는 채널뿐만 아니라 최종 고객에게 상품, 서비스를
      전달하는 것에 경로로 존재하는 가능한 경로를 파악하여 경로에 존재하는 채널별로 분석 기회 확대 탐색
    - 영향자들 영역
      기업 의사결정에 영향을 미치는 주주, 투자자, 협회 및 기타 이해관계자의 주요 관심사항 파악하여 분석기회 탐색
  • 역량의 재해석 관점
    - 내부 역량 영역 : 지식, 기술 등의 노하우와 유형자산의 노하우
    - 파트너와 네트워크 영역 : 자사가 보유하고 있지 않지만, 관계를 유지하고있는 관계사 역량 활용 파악
✔ 혁신적 관점은 분석기회 발굴의 확장으로 경쟁자 확대관점, 시장의 니즈 관점, 역량의 재해석 관점의
   영역별 개념 출제

 

     (2) 문제 정의(Problem Definition)

  • 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계

 

     (3) 해결방안 탐색(Solution Search)

  • 분석역량(Who), 분석기법 및 시스템(How)으로 해결 방안 탐색

 

    (4) 타당성 검토(Feasibility Study)

도출된 분석 문제나 가설에 대한 대안을 과제화하기 위해서 다각적으로 타당성 분석 수행
  • 경제적 타당성 : 비용대비 편익 분석 관점의 접근
  • 데이터 타당성 : 데이터 존재여부
  • 기술적 타당성 검토
    - 기술적 분석 역량 확보 → 도출된 대안 중에서 가장 우월한 대안 선택 → 과제정의서 형태로 시행 후
      프로젝트 계획의 입력자료로 활용
✔ 하향식접근과정 순서 출제
✔ 타당성 검토의 종류 및 개념 출제

 

04. 상향식 접근 방식(Bottom Up Approach)

     (1) 정의

  • 기업이 보유하고 있는 다양한 원천 데이터로부터 분석을 통하여 통찰력과 지식을 얻는 접근방법
  • 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 모든 문제를 도출하는 일련의 과정

 

     (2) 상향식 접근법의 특징

  • 하향식 접근법은 논리적 단계별 접근법으로 최근의 복잡하고 다양한 환경에서 발생하는 모든 문제를 해결하기 어렵기 때문에 디자인적 사고(Design Thinking) 접근법을 통해 WHY→WHAT 관점으로 존재하는 데이터 그 자체를 객관적으로 관찰하여 문제를 해결하려는 접근법 사용
  • 문제의 정의 자체가 어려운 경우 데이터 기반 문제 재정의 및 해결방안 탐색 후 지속해서 개선하는 방식
  • 비지도 학습 방법
  • 인과관계로부터 상관관계 분석으로의 이동
  • 데이터 자체의 결합, 연관성, 유사성을 중심으로 접근
  • 시행착오를 통한 문제 해결 : 프로토타이핑 접근법
  • 절차 : 프로세스 분류 > 프로세스 흐름 분석 > 분석 요건 식별 > 분석 요건 정의

 

     (3) 프로토타이핑 프로세스

  • 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해보고 그 결과를 확인해가면서 반복적으로 개선해나가는 방법
  • 하향식 접근법은 문제가 정형화되어있고, 문제해결을 위한 데이터가 완벽하게 존재할 경우 효과적
  • 프로토타이핑은 방법론 비록 완전하지 못하다해도 신속하게 해결책이나 모형을 제시함으로써 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화하게 하는 상향식 접근 방식

       ⇒ 프로토타이핑 접근법은 결국 빅데이터 분석 환경에서 유용

✔ 프로토타이핑 개념 출제

 

     (4) 빅데이터 환경에서 프로토타이핑 역할

  • 문제에 대한 인식 수준
    - 문제 정의가 불명확하거나 이전에 접해보지 못한 새로운 문제인 경우 사용자 또는 이해관계자는 프로토타입을
      이용하여 문제를 이해하고 이를 바탕으로 구체화하는데 도움을 받을 수 있음
  • 필요 데이터 존재 여부의 불확실성
    - 대체 불가능한 데이터를 사전에 확인한다면 불가능한 프로젝트 수행시 리스크를 사전 방지 가능
  • 데이터 사용 목적의 가변성
✔ 빅데이터 환경에서 프로토타이핑 3가지 역할 출제

 

05. 분석과제 정의

  • 분석 과제 정의서
    분석명, 분석 정의, 분석별 필요 소스 데이터, 분석 방법, 데이터 입수 및 분석의 난이도와 사유, 분석 수행주기, 검증 오너십, 상세 분석 과정 등

 


1-4. 분석 프로젝트 관리 방안

01. 분석과제 관리를 위한 5가지 주요 영역

  • 분석프로젝트는 범위, 일정, 품질, 리스크, 의사소통 등 영역별 관리가 수행되어야할 뿐 아니라, 데이터에 기반한 분석 기법을 적용한다는 특성때문에 아래와 같은 5가지 주요 속성을 고려하여 추가적인 관리 필요
  • Data Size(양)
  • Data Complexity(복잡도)
    - BI 프로젝트처럼 정형데이터가 분석 마트로 구성되어있는 상태에서 분석하는 것과 달리 비정형, 반정형 데이터가
      존재할 경우 데이터 확보뿐만아니라 분석 모델의 선정 등에 대한 사전 고려 필요
  • Speed(분석 속도)
  • Analytic Coplexity(분석 복잡도)
    - 분석모델의 정확도와 복잡도. 분석 모델이 복잡할수록 정확도는 올라가지만 해석이 어려워짐
    - 이에 대한 기준점 사전 정의 필요
  • Accuracy & Precision(정확도&정밀도)
    - Accuracy : 모델과 실제값 차이가 적다는 정확도 의미
    - Precision : 모델을 지속적으로 반복했을 때 편차의 수준으로써 일관적으로 동일한 결과를 제시한다는 것 의미
    - 분석 활용측면에서는 정확도, 안정성 측면에서는 정밀도가 중요
    - 이 둘의 관계는 트레이드 오프 관계로 모델의 해석 및 적용시 사전에 고려해야함
✔ 분석프로젝트 5가지 속성 출제

 

02. 분석 프로젝트의 특성

  • 분석가의 목표
    - 개별적인 분석 업무 수행 뿐만아니라 전반적인 프로젝트 관리 또한 중요
  • 분석가의 입장
    - 데이터 영역과 비즈니스 영역의 현황을 이해하고, 프로젝트의 목표인 분석의 정확도 달성과
      결과에 대한 가치 이해를 전달하는 조정자로서의 분석가 역할이 중요
  • 분석 프로젝트는 도출된 결과의 재해석을 통한 지속적인 반복 및 정교화가 수행되는 경우가 대부분
    → 프로토타이핑 방식의 애자일(Agile) 프로젝트 관리방식에 대한 고려도 필요

 

03. 분석 프로젝트 영역별 주요 관리 항목

  • 범위(Scope)
  • 시간(Time)
    - 데이터 분석 프로젝트는 초기에 의도했던 결과가 나오기 쉽지 않기 때문에 시간이 소요될 수 있음
    - 품질을 보장한다는 전제하에 타임박싱 기법으로 일정관리 진행(철저한 통제X)
  • 원가(Cost)
  • 품질(Quality)
    - 프로젝트 품질은 QC와 QA로 나누어 수행
  • 통합(Integration)
  • 조달(Procurement)
    - 프로젝트 목적성에 맞는 외부 아웃소싱 운영
  • 자원(Resource)
    - 인력에 관한 사항
  • 리스크
    - 관련 위험 식별, 대응방안 사전 수립
  • 의사소통
    - 다양한 의사소통체계 마련 필요
  • 이해관계자(Stakeholder)
    - 데이터 분석 프로젝트는 다양한 전문가가 참여 → 이해관계자와 공유할 환경 필요
✔ 10개 주요관리항목 중 시간에 대한 문제 출제

 

 


 

2-1. 마스터 플랜 수립 프레임워크

01. 마스터 플랜 수립 프레임워크

  • 분석 과제를 대상으로 다양한 기준을 고려해 적용 우선순위를 설정 및 데이터 분석 구현을 위한 로드맵 수립
  • 분석 로드맵의 과제들이 잘 수행되도록 하기위해서는 분석거버넌스 체계 수립 필요
  • 분석 거버넌스 역량을 높이기 위해서는 현재 분석수준이 어떤지 살펴보는 분석 성숙도 측정 필요

✔ 분석마스터 플랜 정의 
    - 시급성과 전략적 필요성은 전략적 중요도의 평가 요소
    - 적용 기술의 안정성 검증은 기술 용이성의 평가 요소
    - 가치는 비즈니스 효과

 

02. 우선순위 평가에 활용하기 위한 ROI 관점에서 빅데이터의 핵심 특징

📌 정보 전략계획(ISP, Information Strategy Planning)
정보기술 또는 정보시스템을 전략적으로 활용하기 위해 조직 내외부 환경을 분석하여 기회나 문제점 도출,
사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 중장기 마스터플랜 수립 절차

 

✔ 중장기적 마스터플랜 수립시, 우선순위 및 적용범위 고려요소 구분 문제 출제

 

 

03. ROI 요소를 고려한 우선순위 평가 기준

  • 시급성 : 판단 기준은 전략적 중요도가 핵심이며, 전략적 중요도가 시점에 따라 시급성 여부를 고려할 수 있다는 뜻
    - ex) 현재는 미래보다 시급성이 높다
  • 난이도 : 현시점에서 과제를 추진하는 것이 비용과 범위 측면을 고려했을때, 바로 적용하기 쉬운 것인지
                  혹은 어려운 것인지 판단

 

04. 사분면 분석을 통한 과제 우선순위 선정 기법

  • 시급성 : 3 -> 4 -> 2 -> 1
  • 난이도 : 3 -> 1 -> 2 -> 4

✔ 분석과제의 적용이 난이도 또는 시급성에 따라 우선순위 순서 구분 출

 

 


2-2. 분석 거버넌스 체계 수립

01. 분석 거버넌스 체계 구성요소

📌 데이터를 수집, 축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 더욱 중요
  ⇒ 분석 관리쳬계 수립

✔ 분석 거버넌스 5개 구성요소 출제

 

 

02. 데이터 분석 수준진단

📌 기업들은 데이터 분석의 도입 여부와 활용에 대해 명확하게 분석 수준을 점검할 필요有
      데이터 분석수준 진단은 6개의 영역의 분석준비도와 3개 영역의 분석 성숙도를 평가함으로써 수행

  • 분석 업무 파악
    - 발생한 사실 여부 파악
    - 예측 분석 업무
    - 시뮬레이션 분석 업무
    - 최적화 업무 정기적 개선
    - 분석 업무 정기적 개선
  • 인력 및 조직
    - 분석전문가 직무 존재
    - 분석전문가 교육 훈련 프로그램
    - 관리자들의 기본적 분석 능력
    - 전사 분석업무 총괄 조직 존재
    - 경영진 분석업무 이해 능력
  • 분석기법
    - 업무별 적합한 분석기법 사용
    - 분석업무 도입 방법론
    - 분석기법 라이브러리
    - 분석기법 효과성 평가
    - 분석기법 정기적 개선
  • 분석 데이터
    - 분석업무를 위한 데이터 충분성, 신뢰성, 적시성
    - 비구조적 데이터 관리
    - 외부 데이터 활용 체계
    - 기준 데이터 관리
  • 분석문화
    - 사실에 근거한 의사결정
    - 관리자의 데이터 중시
    - 회의 등에서 데이터 활용
    - 경영진의 직관보다 데이터
    - 데이터 공유 및 협업문화
  • IT 인프라
    - 운영시스템 데이터 통합
    - EAI, ETL 등 데이터 유통체계
    - 분석 전용 서버 및 스톨지
    - 빅데이터 분석 환경
    - 통계 분석 환경
    - 비주얼 분석 환경
✔ 분석준비도 6개 영역과 세부내용 구분 출제

 

  • 조직의 성숙도 평가도구 : CMMI(Capability Maturity Model Integration)
  • 분석 수준 진단 결과 : 정착형, 확산형, 준비형, 도입형

✔ 분석준비도와 분석 성숙도에 따른 유형별 특성 출제

 

03. 데이터 거버넌스 체계 수립

     (1) 데이터 거버넌스 개요

  • 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리 체계를 수립하고
    운영을 위한 프레임워크(Framework) 및 저장소(Repository)를 구축하는 것
  • 데이터 거버넌스의 중요한 관리 대상
     - 마스터 데이터(Master Data), 메타 데이터(Meta Data), 데이터 사전(Data Dictionary)
  • 데이터 거버넌스를 구축함으로써 데이터의 가용성, 유용성, 통합성, 보안성, 안정성 확보
✔ 데이터 거버넌스 정의 출제

 

 

     (2) 데이터 거버넌스 구성요소

  • 원칙(Principle)
  • 조직(Organization)
  • 프로세스(Process)
✔ 데이터 거버넌스 3개 구성요소 출제

 

    (3) 데이터 거버넌스 체계

  • 데이터 표준화
    - 데이표 표준용어 설명, 명명규칙, 메타데이터 구축, 데이터 사전 구축
  • 데이터 관리 체계
    - 메타 데이터와 데이터 사전의 관리 원칙 수립
  • 데이터 저장소 관리(Repository)
    - 메타데이터 및 표준데이터 관리를 위한 전사 차원의 저장소 구성
    - 데이터 관리 체계 지원을 위한 워크플로우 및 관리용 SW 지원,
      관리 대상 시스템과의 인터페이스를 통한 통제가 이루어져야 함
    - 데이터 구조 변경에 따른 사전영향평가도 수행되어야 효율적 활용 가능
  • 표준화 활동
    - 데이터 거버넌스 체계를 구축한 후 표준 준수 여부를 주기적으로 점검하고 모니터링
✔ 데이터 거버넌스 체계요소 중 데이터 표준화, 관리체계, 저장소관리 출제 비중 높음

 

04. 데이터 분석을 위한 3가지 조직 구조

  • 집중구조
    - 전사 분석 업무를 별도의 분석 전담 조직에서 담당
    - 전략적 중요도에 따라 분석 조직이 우선순위를 정해 진행 가능
    - 현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
  • 기능구조
    - 일반적인 분석 수행구조
    - 별도 분석 조직이 없고 해당 업무 부서에서 분석 수행
    - 전사적 핵심 분석이 어려우며, 부서 현황 및 실적통계 등 과거 실적에 국한된 분석 수행 가능성 높음
  • 분산구조
    - 분석 조직 인력들을 현업부서에 직접 배치하여 분석 업무 수행
    - 전사 차원의 우선순위 수행
    - 분석 결과에 따른 신속한 Action 가능
    - 베스트 프랙티스 공유 가능
    - 부서 분석 업무와 역할 분담 명확히 해야함

 

05. 분석 과제 관리 프로세스

  • 과제 발굴과 과제수행 및 모니터링으로 나누어짐
  • 과제 발굴 단계에서는 개별조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석과제 풀(pool)로 관리하면서 분석 프로젝트를 선정하는 작업 수행
  • 과제수행 단계에서는 분석을 수행할 팀을 구성하고 분석 과제 수행할 때 지속적인 모니터링과 과제 결과를 공유하고 개선하는 절차 수행
✔ 분석과제 관리 프로세스 순서 출제