728x90
반응형
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다.
01 분석 기획 방향성 도출
- 분석 기획
- 실제 분석을 수행하기 전에 분석과제를 정의하고 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
분석대상 O 분석대상 X 분석방법 O 최적화 통찰 분석방법 X 솔루션 발견
- 실제 분석을 수행하기 전에 분석과제를 정의하고 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
- 목표 시점 별 분석 기획 방안의 차이
- 당면한 분석 주제의 해결(과제 단위) → 지속적 분석 문화 내제화(마스터 플랜 단위)
- 1차 목표: Speed & Test → Accuracy & Deploy
- 과제의 유형: Quick & Win → Long Term View
- 접근 방식: Problem Solving → Problem Definition
- 분석 기획 시 고려사항
- 분석의 기본이 되는 데이터 고려: 데이터 확보, 데이터 유형에 따른 선행 분석
- 정형 데이터: DB
- 비정형 데이터: 보고서, 이메일, 소셜데이터
- 반정형 데이터: 센서를 통한 스트리밍되는 머신데이터
- 분석을 통해 가치 창출되는 적절한 활용방안과 유즈케이스 탐색
- 분석 수행시 발생 가능한 장애요소와 대책에 대한 사전 계획 수립
- 분석의 기본이 되는 데이터 고려: 데이터 확보, 데이터 유형에 따른 선행 분석
02 분석 방법론
- 방법론: 절차, 방법, 도구와 기법, 템플릿과 산출물로 구성
- 폭포수 모델: 단계를 순차적으로 진행, 문제 발견시 피드백 과정 수행
- 나선형 모델: 반복을 통해 점증적으로 개발
- 프로토타입 모델: 점진적으로 시스템 개발, 일부분 우선 개발해 요구사항 개선
- KDD 분석 방법론
- 데이터셋 선택: Target Data
- 데이터 전처리: Preprocessed Data
- 데이터 변환: Transformed Data
- 데이터 마이닝: Patterns
- 결과 평가: Interpretaion/Evaluation
- CRISP-DM 방법론
- 여러 단계(Phases) → 일반화 태스크 → 세분화 태스크 → 프로세스 실행
- 업무 이해: 업무 목적 파악, 상황 파악, 목표 설정, 계획 수립
- 데이터 이해: 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 품질 확인
- 데이터 준비: 분석용 데이터 셋 선택, 데이터 정제, 데이터 통합, 포맷팅
- 모델링: 모델링 기법 선택, 테스트 계획, 모델 작성, 모델 평가
- 평가: 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가
- 전개: 전개 계획 수립, 모니터링과 유지보수 계획 수립, 종료 보고서 작성, 프로젝트 리뷰
- 빅데이터 분석 방법론
- 계층적 프로세스 모델
- 단계: 단계별 산출물 생성, 버전 관리 등 통제
- 태스크: 단계를 구성하는 활동
- 스텝: WBS의 워크 패키지, 입력자료/처리 및 도구/출력자료로 구성된 단위 프로세스
- 분석 기획: 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험계획 수립
→ SOW(프로젝트 범위 정의서), 프로젝트 정의서, WBS, 위험관리 계획서 - 데이터 준비: 필요 데이터 정의, 데이터의 스토어 설계, 데이터 수집 및 정합성 점검
→ 데이터 정의서, 데이터 스토어 설계서, 메타 데이터, 데이터 사전, 데이터 정합성 점검 보고서 - 데이터 분석: 분석용 데이터 준비, 텍스트 분석, 탐색적 분석, 모델링, 모델 평가 및 검증, 모델 적용 및 운영방안 수립
→ 비즈니스 룰, 분석용 데이터 셋, 텍스트 분석 보고서, 데이터 탐색/시각화 보고서, 모델링 결과 보고서, 알고리즘 설명서, 모니터링 방안, 모델 평가/검증 보고서 - 시스템 구현: 설계 및 구현, 현시스템 테스트 및 운영
→ 시스템 분석 및 설계서, 구현 시스템, 시스템 테스트 결과 보고서, 매뉴얼, 운영 계획서 - 평가 및 전개: 모델 발전계획 수립, 프로젝트 평가 및 보고
→ 모델 발전 계획서, 프로젝트 성과 평가서, 프로젝트 최종 보고서
- 계층적 프로세스 모델
03 분석 과제 발굴
- 하향식 접근
- 문제가 주어지고 이에 대한 해법을 찾기 위해 각 과정이 체계적이고 단계화되어 수행
- 상향식 접근
- 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선
하향식 접근 방식
- 문제 탐색
- 비즈니스 모델 기반: 업무, 제품, 고객, 규제와 감사, 자원 인프라 등 5가지 영역
- 거시적 관점 : 메가 트렌드에서 해당 산업에 폭넓게 영향을 미치는 사회, 경제적 요인을 STEEP으로 요약하여 사회, 기술, 경제, 환경, 정치 영역
- 경쟁자 확대 관점 : 사업 영역의 직접 경쟁자 및 제품, 서비스 뿐만 아니라 대체제와 신규 진입자 등으로 확대
- 시장의 니즈 탐색 관점 : 사업에서의 고객 영역, 채널 영역, 영향자들 영역
- 역량의 재해석 관점 : 내부 역량 영역, 파트너와 네트워크 영역
- 외부 참조 모델 기반: 유사, 동종 사례를 벤치마킹을 통해 분석 기회 발굴, Quick&Easy 방식, 브레인스토밍
- 분석 유즈케이스 정의
- 비즈니스 모델 기반: 업무, 제품, 고객, 규제와 감사, 자원 인프라 등 5가지 영역
- 문제 정의
- 비즈니스 문제를 데이터와 분석 문제로 변환하여 정의
- 해결방안 탐색
- 분석 역량, 분석 기법 및 시스템
- 타당성 검토
- 경제적 타당성, 데이터 및 기술적 타당성
상향식 접근법
- 기업이 보유하고 있는 다양한 원천 데이터로부터 분석을 통하여 통찰력과 지식을 얻는 접근 방법
- 하향식 접근법(기존): 논리적 단계별 접근법으로 다양한 환경의 문제를 해결하기 어려워 디자인적 사고 접근법을 통해 WHY 관점을 강조했지만, 객관적으로 존재하는 데이터 그 자체를 관찰하여 문제를 해결하는 WHAT 관접으로 접근
- 비지도 학습 방법으로 수행되며, 데이터 자체의 결합, 연관성, 유사성을 중심으로 접근 (지도 학습: 목적이 명확)
- 시행착오를 통한 문제 해결
- 프로토타이핑 접근법: 완벽하진 못해도 신속하게 해결책이나 모형 제시 (빅데이터 분석 환경에서 필요성 대두)
- 문제 인식 수준, 필요 데이터 존재 여부의 불확실성, 데이터 사용 목적의 가변성
분석과제 정의
- 분석과제 정의서를 통해 분석별 필요 소스 데이터, 분석 방법, 데이터 입수 및 분석의 난이도, 분석 수행 주기, 검증 오너십, 상세 분석 과정 등 정의
04 분석 프로젝트 관리 방안
- 관리 특성
- 데이터 양
- 비정형 데이터
- 속도
- 분석 모델의 정확도와 복잡도: 모델이 복잡할수록 정확도는 올라가지만 해석이 어려워짐
- Accuracy: 모델과 실제 값 사이 차이가 적음(활용적 측면) Precision: 모델을 지속적으로 반복했을 때 편차의 수준으로써 일관적으로 동일한 결과 제시(안정성 측면)
- 분석 프로젝트 특성
- 도출된 결과의 재해석을 통한 지속적인 반복 및 정교화가 수행되는 경우가 대부분 → 프로토타이핑 방식의 애자일 프로젝트 관리방식에 대한 고려 필요
- 관리 방안
- 주제: 통합, 이해관계자, 범위, 자원, 시간, 원가, 리스크, 품질, 조달, 의사소통
728x90
반응형
'Note > Certificate' 카테고리의 다른 글
[ADsP] 3과목 요약 정리 : 3-1 데이터 분석 개요 (0) | 2021.06.15 |
---|---|
[ADsP] 2과목 요약 정리 : 2-2 분석 마스터 플랜 (0) | 2021.06.15 |
[ADsP] 1과목 요약 정리 : 1-3 가치 창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2021.06.15 |
[ADsP] 1과목 요약 정리 : 1-2 데이터의 가치와 미래 (0) | 2021.06.15 |
[ADsP] 1과목 요약 정리 : 1-1 데이터의 이해 (0) | 2021.06.15 |