본문 바로가기

CERTIFICATION/ADsP

(4)
[D-7/핵심포인트 정리] 3과목 데이터 분석(2) 4-1. 통계분석의 이해 01. 통계 통계 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 통계자료의 획득 방법 총 조사(Census)와 표본조사(Sampling) 표본 추출 방법 단순랜덤추출(Simple Random Sampling), 계통추출법(Systematic Sampling), 집락추출법(Cluster Sampling), 층화추출법(Stratified Random Sampling) 자료의 측정 방법 명목척도, 순서척도, 구간척도, 비율척도 02. 통계 분석 기술통계 (Descriptive Statistic) 평균, 표준편차, 중위수, 최빈값, 그래프 통계적 추론 (Statistical Inference) 모수추정, 가설검정, 예측 03. 확률 분포 확률변수 ..
[D-7/핵심포인트 정리] 3과목 데이터 분석(1) 1-1. 데이터 분석 기법의 이해 1. 데이터 처리 과정 • 데이터 분석을 위해서 데이터웨어하우스(DW)나 데이터마트(DM)를 통해 분석데이터 구성 • 신규데이터나 DW에 없는 데이터는 기존 운영시스템(Legacy)에서 직접 가져오거나 운영데이터저장소(ODS)에서 정제된 데이터를 가져와서 DW의 데이터와 결합하여 활용 2. 시각화 기법 • 가장 낮은 수준의 분석 but 잘 사용하면 복잡한 분석보다 더 효율적 • 대용량 데이터를 다룰 때 & 탐색적 분석을 할 때 필수 3. 공간 분석 • 공간적 차원과 관련된 속성들을 시각화하는 분석 • 지도 위에 관련된 속성들을 생성하고 크기모양, 선 굵기 등을 구분하여 인사이트를 얻음 4. 탐색적 자료 분석 (EDA) • 다양한 차원과 값을 조합해가며 특이점이나 의미있는..
[D-7/핵심포인트 정리] 2과목 데이터 분석 기획 1-1. 분석 기획 방향성 도출 01. 분석 기획의 특징 (1) 분석 기획 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했떤 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 (2) 데이터 사이언티스트의 역량 수학/통계학적 지식 + 정보기술(IT 기술, 해킹 기술, 통신 기술 등) + 비즈니스에 대한 이해와 전문성 02. 분석 대상과 방법 분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 분류 Optimization : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화의 형태로 수행 Solution : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 분석과제 수행 Insight : 분석 대상..
[D-7/핵심포인트 정리] 1과목 데이터 이해 1-1. 데이터와 정보 01. 데이터의 유형 정성적 데이터 : 비정형 데이터 형태로 저장, 검색, 분석에 많은 시간과 비용이 필요 언어, 문자 등 형태와 형식이 정해져 있지 않음 숫자나 금액으로 환산할 수 없는 것 ex) 회사 매출이 증가함, 설문조사 주관식 응답, 페이스북 등 ✔ 주관식 설문조사가 정성적 데이터는 옳은 보기 ✔ 설문조사는 비정형 데이터라고 한다면 틀린 보기 ✔ 객관식 설문문항은 수치로 처리 가능하면 정량적 데이터도 가능 정량적 데이터 : 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터 데이터양이 증가하더라도 저장, 분석 용이 숫자나 금액으로 환산 가능한 것 ex) 온도, 풍속, 강수량, 나이, 몸무게, 주가 등 ✔ 정성적 vs 정량적 데이터의 특징 구분 데이터유형 특징 데..