Note/Certificate
[ADsP] 3과목 요약 정리 : 3-2 R프로그래밍 기초
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 R 소개 오픈소스 프로그램, 통계/데이터마이닝과 그래프를 위한 언어 GPL(General Public License)하에 배포되는 S프로그래밍 언어로 구현 → GNU-S라 함 표준 플랫폼(S언어 기반) 모든 운영체제에서 사용 가능 메모리 저장방식, 객체지향언어, 함수형 언어 02 R 들어가기 편리한 기능 작업환경 설정: setwd(“디렉터리”) 도움말: help, ?, RSiteSearch(“함수명”) 히스토리: history(), savehistory(file=“파일명”), loadhistory(file=“파일명”) 콘솔 청소: ctrl + L 스크립트 사용 한줄 실행: ctrl + R 여러줄 실행: 드래그, ..
[ADsP] 3과목 요약 정리 : 3-1 데이터 분석 개요
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 데이터 처리 데이터 분석을 위해 DW나 DM을 통해 분석 데이터 구성 신규 데이터나 DW에 없는 데이터는 기존 운영시스템에서 가져오기보다 운영시스템에서 임시로 데이터를 저장하는 스테이징 영역에서 데이터를 전처리해 운영데이터저장소(ODS)에 저장된 데이터를 DW와 DM과 결합해 데이터 구성 최종 데이터 구조로 가공 시뮬레이션 모델링: 처리시간에 대한 분포 파악 최적화: 목적함수와 계수 값을 프로세스별로 산출 데이터마이닝 분류: 인구통계, 요약변수, 파생변수 산출 비정형 데이터: 텍스트 마이닝을 거쳐 데이터 마트와 통합 관계형 데이터: 사회 신경망 분석을 거쳐 통계값이 데이터 마트와 통합 02 시각화 기법 가장 낮은..
[ADsP] 2과목 요약 정리 : 2-2 분석 마스터 플랜
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 마스터 플랜 수립 분석 마스터 플랜 수립 프레임워크 우선순위 고려요소 전략적 중요도, 비즈니스 성과/ROI, 실행 용이성 적용 범위/방식 고려요소 업무내재화 적용 수준, 분석데이터 적용 수준, 기술적용 수준 ISP: 정보전략계획(문제점 도출, 우선순위 결정, 마스터 플랜 수립 절차) 우선순위 평가 방법 및 절차 비즈니스 관점에서 도출된 다양한 분석과제들을 기업에 적용시키기 위해 적용 우선순위 평가 빅데이터 특징인 4V 고려한 우선순위 평가기준 적용 투자비용 요소: 크기, 다양성, 속도 비즈니스 효과: 가치 우선평가 기준 (포트폴리오 사분면 분석) 시급성: 전략적 중요도가 핵심 (3-4-2-1) 난이도 (3-1-2..
[ADsP] 2과목 요약 정리 : 2-1 데이터 분석 기획의 이해
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 분석 기획 방향성 도출 분석 기획 실제 분석을 수행하기 전에 분석과제를 정의하고 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 분석대상 O 분석대상 X 분석방법 O 최적화 통찰 분석방법 X 솔루션 발견 목표 시점 별 분석 기획 방안의 차이 당면한 분석 주제의 해결(과제 단위) → 지속적 분석 문화 내제화(마스터 플랜 단위) 1차 목표: Speed & Test → Accuracy & Deploy 과제의 유형: Quick & Win → Long Term View 접근 방식: Problem Solving → Problem Definition 분석 기획 시 고려사항 분석의..
[ADsP] 1과목 요약 정리 : 1-3 가치 창조를 위한 데이터 사이언스와 전략 인사이트
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 빅데이터 분석과 전략 인사이트 빅데이터 회의론 원인 부정적 학습 효과 과거의 고객관계관리(CRM): 공포 마케팅, 투자대비 효과 미흡 부정적인 성공 사례 빅데이터가 필요없는 분석사례 기존 CRM 분석 성과 싸이월드 퇴보 원인 OLAP 같은 분석 인프라로 존재했으나 중요한 의사결정 데이터 분석 활용 못함 웹로그 분석을 통한 일차원적 분석만 집중 소셜 네트워킹 활동 특성과 관련된 분석을 위한 프레임 워크나 평가지표도 없었음 트렌드 변화가 사업모델에 미치는 영향에 대한 전략적 통찰을 가지지 못함 전략적 통찰이 없는 분석의 함정 단순히 일차원적 분석의 반복은 해당 부서의 업무 영역에서는 효과적이지만, 기업의 환경 변화와..
[ADsP] 1과목 요약 정리 : 1-2 데이터의 가치와 미래
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 빅데이터의 이해 정의 Mckinsey: 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 IDC: 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출, 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 가트너 그룹의 더그래니의 3V Volume: 양 Variety: 다양성 Velocity: 속도 정의의 범주 및 효과 데이터 변화: 3V(규모, 속도, 형태) 기술 변화: 새로운 데이터 처리, 저장 분석 기술, 클라우딩 컴퓨팅 활용 인재, 조직 변화: 데이터 사이언티스트, 데이터 중심 조직 빅데이터 출현 배경 산업계: 고객 데이터 ..
[ADsP] 1과목 요약 정리 : 1-1 데이터의 이해
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 데이터와 정보 데이터 정의 존재적 특성: 객관적 사실 당위적 특성: 추론, 예측, 전망, 추정을 위한 근거 특징 정성적 데이터: 언어, 문자 → 형식x, 형태x 정량적 데이터: 수치, 도형, 기호 지식 암묵지 학습과 경험을 통해 개인에 체화된 지식 공유와 전달의 어려움 내면화 → 공통화 필요 ex) 김치 담그기, 자전거 타기 형식지 문서나 매뉴얼처럼 형식화된 지식 공유와 전달이 용이 표준화 → 연결화 ex) 교과서, 비디오, DB DIKW 데이터: 개별 데이터 자체로 의미가 중요하지 않은 객관적 사실 정보: 데이터의 가공, 처리와 데이터 간 연관관계 속에서 의미가 도출 지식: 정보를 구조화하여 유의미한 정보를 분..
[ADsP] 빅데이터 상식 정리
DBMS와 SQL DBMS 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경 제공 SW SQL 데이터베이스에 접근할 수 있는 데이터베이스의 하부 언어 단순 질의 + 완전한 데이터 정의, 조작 기능 테이블 단위로 연산 수행 데이터 관련 개인정보 비식별 기술 데이터 마스킹 데이터의 길이, 유형, 형식 등 속성 유지 새롭고 읽기 쉬운 데이터 익명으로 생성 유형: 정적인 데이터 마스킹, 동적인 데이터 마스킹, 치환, 셔플, 암호화 등 가명처리 개인정보주체의 이름을 다른 이름으로 변경 다른 값으로 대체하는 일정 규칙이 노출되지 않도록 주의 총계처리 데이터의 총합 값을 보임으로서 개별 데이터의 값을 보이지 않도록 함 데이터 값 삭제 데이터 공유, 개방 목적에 따라 데이터 셋에 구..