[ADsP] 1과목 요약 정리 : 1-1 데이터의 이해
Note/Certificate

[ADsP] 1과목 요약 정리 : 1-1 데이터의 이해

728x90
반응형

'ADsP 데이터 분석 준전문가 (데이터에듀)' 교재를 참고하여 간략히 정리하였습니다.

01 데이터와 정보

  • 데이터 정의
    1. 존재적 특성: 객관적 사실
    2. 당위적 특성: 추론, 예측, 전망, 추정을 위한 근거
  • 특징
    1. 정성적 데이터: 언어, 문자 → 형식x, 형태x
    2. 정량적 데이터: 수치, 도형, 기호
  • 지식
    1. 암묵지
      • 학습과 경험을 통해 개인에 체화된 지식
      • 공유와 전달의 어려움
      • 내면화 → 공통화 필요
      • ex) 김치 담그기, 자전거 타기
    2. 형식지
      • 문서나 매뉴얼처럼 형식화된 지식
      • 공유와 전달이 용이
      • 표준화 → 연결화
      • ex) 교과서, 비디오, DB

DIKW

  1. 데이터: 개별 데이터 자체로 의미가 중요하지 않은 객관적 사실
  2. 정보: 데이터의 가공, 처리와 데이터 간 연관관계 속에서 의미가 도출
  3. 지식: 정보를 구조화하여 유의미한 정보를 분류하고 개인적 경험을 결합하여 내재화한 것
  4. 지혜: 지식의 축적과 아이디어가 결합된 창의적 산물

02 데이터베이스 정의와 특징

  • 용어
    • 1950년대, 미군의 데이터 기지라는 뜻으로 탄생
    • 1963년, 미국 SDC가 개최한 심포지엄에서 공식 용어로 사용
    • 1970년대 초반, 유럽에서 단일어로 일반화
    • 1975년, 국내에서 KORSTIC를 통해 처음 서비스 됨
  • 정의
    • EU: 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단을 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의. 수집물
    • 국내 저작권법: 소재를 체계적으로 배열 또는 구성한 편집물을 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것
    • 국내 컴퓨터 용어사전: 동시의 복수 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라 편성된 데이터의 집합
  • 특징
    1. 통합된 데이터: 동일한 내용의 데이터가 중복되어 있지 않음
    2. 저장된 데이터: 컴퓨터가 접근할 수 있는 저장 매체에 저장
    3. 공용 데이터: 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용(대용량화, 구조 복잡)
    4. 변화되는 데이터: 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 변화하면서도 항상 현재의 정확한 데이터 유지
  • 다양한 측면
    1. 정보의 축적 및 전달 측면
      • 기계가독성: 일정한 형식에 따라 정보처리기기가 읽고 쓸 수 있음
      • 검색가독성: 다양한 방법으로 필요한 정보를 검색
      • 원격조작성: 정보통신망을 통해 원거리에서 즉시 온라인 이용
    2. 정보 이용 측면: 요구에 따라 다양한 정보 신속히 획득
    3. 정보 관리 측면: 정보를 일정한 구조에 따라 정리, 저장, 검색, 관리
    4. 정보기술 발전 측면: 정보처리, 관련 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술의 발전을 견인할 수 있음
    5. 경제/산업 측면: 국민의 편의를 증진하는 수단

03 데이터베이스 활용

  • 기업내부
    • OLTP: 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태 중 하나
    • OLAP: 정보 위주의 분석 처리
    • CRM(고객관계관리): 고객 중심 자원 극대화
    • SCM(공급망관리): 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간, 장소에 제공
    • ERP: 각종 관리시스템의 경영자원을 하나의 통합 시스템으로 재구축해 생산성 극대화하는 경영혁신기법
    • RTE: 회사의 주요 경영정보를 통합관리
    • BI: 기업이 보유한 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스
    • EAI: 기업 내 모든 애플리케이션을 유기적으로 연동해 필요한 정보를 중앙 집중적으로 통합, 사용, 관리할 수 있는 환경
    • KMS: 기업 경영을 지식의 관점에서 새롭게 조명하는 접근 방식
  • 사회기반구조
    • VAN(부가가치통신망): 독자적인 네트워크 형성, 각종 정보를 부호, 영상, 음성 등으로 교환해 정보 축적
    • CALS: 제품의 라이프 사이클 전반에 관련된 데이터를 통합하고 공유, 교환할 수 있도록 한 경영통합정보시스템
728x90
반응형