Note/Certificate
[SQLD 시험] 제41회 SQL 개발자(SQLD) 독학 후기
ADsP 시험 1주일 뒤가 SQLD 시험이라 공부할 여유가 없었다. ADsP 과목이 생소했기에 여기에 집중했고 SQLD는 투자를 별로 못했다. 그래도 SQL은 꾸준히 공부해왔고 실전에서도 사용했던 경험이 있기에 덜 걱정되었고, 그렇게 5일정도 공부해서 시험을 보게 되었다! 이 친구도 마찬가지로 50,000원의 응시비.. 기본 개념은 구글링으로 요약된 내용을 훑어보았고, 다들 노랭이책을 필수로 풀어본다해서 시험 전 급하게 구매해서 보았다! (생각없이 보다가 다른 범위까지 공부할뻔..) 문제를 풀면서 어떤식으로 문제가 나오는지 파악했고 좌측 개념 설명을 토대로 개념공부도 진행했다. 생각보다 SQL 문제가 어렵다고 느꼈다.. 눈으로 코드를 실행하려니까 잘 안됐다 ㅠㅠ 개념공부를 제대로 안했으니까 답지도 꼼꼼히..
[SQLD] SQLD 자격검정 시험 핵심 요약 (feat. 노랭이책)
'SQL 자격검정 실전문제'(일명 노랭이책)을 풀며 핵심 개념을 정리한 글입니다 1-1 데이터 모델링의 이해 1-2 데이터 모델과 성능 2-1 SQL 기본 2-2 SQL 활용 2-3 SQL 최적화 기본 원리 ✨ 1-1 데이터 모델링의 이해 데이터모델링이 필요한 이유 업무정보를 구성하는 기초가 되는 정보들에 대해 일정한 표기법에 의해 표현 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용 데이터모델링 유의점 중복: 여러 장소에 같은 정보 저장 x 비유연성: 데이터의 정의를 데이터의 사용 프로세스와 분리 → 데이터 혹은 프로세스의 작은 변화가 애플리케이션과 데이터베이스에 중대한 변화를 일으킬 수 있는 가능성 줄임 비일관성: 데이터와 데이터 간의 상호 연관 관계에 대해 명확히 정의..
[SQLD] 2과목 요약 정리: 2-2 SQL 활용
표준 조인 일반 집합 연산자 UNION: 합집합, 중복 제거 INTERSECT: 교집합 EXCEPT/MINUS: 차집합(DIFFERENCE) CROSS JOIN: 곱집합(PRODUCT), JOIN조건이없는 경우 생길 수 있는 모든 조합 순수 관계 연산자 SELECT: WHERE절로 구현 PROJECT: SELECT절로 구현 NATURAL JOIN: 다양한 JOIN DEVIDE: 사용X FROM절 JOIN INNER JOIN: 내부 조인, 동일한 값이 있는 행만 반환 JOIN 조건을 USING절이나 ON절에서 사용 NATURAL JOIN: 등가조인 수행 USING절이나 ON절, WHERE절에서 조건 정의 가능 CROSS JOIN: 생길 수 있는 모든 데이터의 조합 OUTER JOIN: 동일한 값이 없는 행..
[SQLD] 2과목 요약 정리: 2-1 SQL 기본
관계형 데이터베이스 데이터베이스의 발전 1960s, 파일 구조를 통해 데이터를 저장하고 관리 1970s, 계층형 데이터베이스, 망향 데이터베이스 상용화 1980s, 관계형 데이터베이스 상용화, oracle 사용 시작 1990s, 객체 관계형 데이터베이스로 발전 관계형 데이터베이스 1970, 영국의 수학자 E.F.Codd 박사가 처음 소개 정규화를 통한 이상현상 제거, 동시성 관리, 병행 제어를 통한 동시 공유 SQL DML(데이터 조작어): SELECT, INSERT, UPDATE, DELETE DDL(데이터 정의어): CREATE, ALTER, DROP, RENAME DCL(데이터 제어어): GRANT, REVOKE TCL(트랜잭션 제어어): COMMIT, ROLLBACK TABLE 행과 칼럼의 2차원..
[SQLD] 1과목 요약 정리: 1-2 데이터 모델과 성능
성능 데이터 모델링 데이터베이스 성능향상을 목적으로 설계 단계의 데이터 모델링 때부터 정규화, 반정규화, 테이블 통합, 테이블 분할, 조인구조, PK, FK 등 반영 초기 단계에 고려할수록 재업무 비용 최소화 프로세스 데이터 모델링을 할 때 정규화를 정확히 수행 데이터베이스 용량산정 수행 데이터베이스에 발생되는 트랜잭션의 유형 파악 용량과 트랜잭션의 유형에 따라 반정규화 수행 이력 모델의 조정, PK/FK 조정, 슈퍼/서브타입 조정 성능 관점에서 데이터 모델 검증 정규화 데이터를 결정하는 결정자에 의해 함수적 종속을 가진 일반속성을 의존자로 하여 입력/수정/삭제 이상을 제거 한 테이블에 인덱스가 많아지만 조회 성능 향상, 입력/수정/삭제 성능 저하 함수적 종속성: 데이터들이 어떤 기준값에 의해 종속되는 ..
[SQLD] 1과목 요약 정리: 1-1 데이터 모델링의 이해
데이터 모델링 모델링 특징 추상화: 현실 세계를 일정한 형식에 맞춰 표현 단순화: 복잡한 현실 세계를 약속된 규약을 통해 쉽게 이해할 수 있도록 함 명확화: 애매모호함 제거, 정확한 현상 기술 모델링 관점 데이터 관점(what) 프로세스 관점(how) 상관 관점(interaction) 데이터 모델링 중요성 파급효과: 시스템 구축 작업 중 데이터 설계가 중요 간결한 표현: 복잡한 정보의 요구사항에 대한 간결한 표현 데이터 품질: 정확성이 높은 데이터, 데이터 구조의 문제 유의점 중복: 여러 장소에 같은 정보 저장 비유연성: 사소한 업무 변화에 데이터 모델이 수시로 변경되면 안됨 비일관성: 신용 상태에 대한 갱신 없이 고객의 납부 이력 정보 갱신 안됨 (연계성 하락) 데이터 모델링 과정 모델링 3요소: th..
[ADsP 시험] 제29회 데이터분석 준전문가(ADsP) 독학 후기
29회 ADsP 시험을 보았다. (결과는 맨 마지막!) 원래 '빅데이터분석기사'를 보려고 공부했었는데 1회 시험이라 기출 문제도 없고 공부 방향을 제대로 잡지 못해 아쉽게 불합격을 했다.. 😭 통계 문제 헬파티 😵 기사는 재시험을 보지 않을 것 같아서 공부한 내용을 까먹기 전에 비슷한 과목인 'ADsP' 시험에 응시했다. 응시료가 50,000.. 한 번에 붙지 않으면 안되는 시험비.. 나는 '2018년 버전 데이터 에듀' 책으로 공부를 했다. 빅데이터 기사 교재로 공부했었기 때문에 비슷한 내용이 많아서 시험 전 1주일 투자해서 볼 수 있었다. 1, 2장은 핵심을 찾아 암기했고, 3장은 문제를 풀며 이해했다.. 3장이 혼자 이해하기 어려운 부분이 많아 문제를 풀어보며 빈출 유형을 특히나 공부했다. (아직 ..
[ADsP] 3과목 요약 정리 : 3-5 정형 데이터 마이닝
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 데이터마이닝 통계분석: 가설이나 가정에 따른 분석이나 검증 대용량 데이터에서 의미 있는 패턴을 파악하거나 의사결정에 활용 종류 방법론: 인공지능, 의사결정나무, K-평균 군집화, 연관분석, 회귀분석, 로짓분석, 최근접 이웃 표현 방법: 시각화 분석, 분류, 군집화, 포캐스팅 사용 분야 환자 데이터를 이용해 발생 가능성이 높은 병 예측 기존 환자가 응급실에 왔을 때 어떤 조치를 먼저 해야하는가 결정 고객 데이터를 이용해 우량/불량 예측해 대출적격 여부 판단 입국자의 이력과 데이터를 이용해 관세물품 반입 여부 예측 데이터마이닝 발전사 데이터 수집(1960s): 정적 데이터 공급 데이터 접근(1970s): 동적 데이터..
[ADsP] 3과목 요약 정리 : 3-4 통계 분석
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 통계분석의 이해 통계: 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태로 표현 방법: 총 조사, 표본조사(sampling) 모집단: 조사하고자 하는 대상 집단 전체 표본: 모집단의 일부 원소 모수: 표본 관측에 의해 구하고자 하는 모집단에 대한 정보 표본 추출 방법 단순랜덤 추출: 임의의 n개 추출, 확률 동일 (복원/비복원) 계통 추출: 구간을 나눠 k개씩 띄어서 표본 선택 집락 추출: 군집별로 랜덤추출 층화 추출: 이질적 원소들로 구성된 모집단에서 각 계층을 대표할 표본 추출 측정 명목척도: 어떤 집단에 속하는지 분류 (성별, 출생지 등) 순서척도: 서열 관계 관측 (학년, 선호..
[ADsP] 3과목 요약 정리 : 3-3 데이터 마트
'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다. 01 데이터 변경 및 요약 데이터 마트: 데이터 웨어하우스와 사용자의 중간층에 위치 요약변수 수집된 정보를 분석에 맞게 종합한 변수 많은 모델에 공통으로 사용될 수 있어 재활용성 높음 파생변수 사용자가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여하는 변수 주관적 → 논리적 타당성 갖춰 개발 세분화, 고객 행동 예측, 캠페인 반응 예측에 잘 활용 reshape 패키지 met(): 데이터를 DB 구조로 녹이는 함수 → 모든 데이터를 표준형식으로 변환 cast(): 새로운 구조로 데이터를 만드는 함수 sqlaf 패키지 R에서 SQL 명령어 사용 sql: select * from [data frame] ..