ADsP - 데이터의 이해 (1)

반응형

데이터의 이해

데이터의 정의

  • 일반적으로 연구나 조사 등의 바탕이 되는 재료 혹은 자료를 의미

데이터의 특성

  • 데이터는 있는 그대로의 사실, 즉 객관적인 사실을 의미
  • 정보는이러한 데이터를 가공하여 만든 자료를 의미
  • 데이터의 존재적 특성 : 있는 그대로의 사실
  • 데이터의 당위적 특성 : 추론/ 예측 / 전망 등을 위한 정보의 근거
  • 따라서, 데이터는 정보가 아니라 객관적 사실의 자료

데이터의 유형

  • 정성적 데이터 : 집합으로 표현할 수 없는 기준이 명확하지 않은 데이터 (예; 언어와 문자 등)
  • 정량적 데이터 : 집합으로 표현할 수 있는 기준이 명확한 데이터 (예; 수치, 도형, 기호 등)
  • 정형 데이터 : 고정된 틀을 가지고 있으면서 연산이 가능한 데이터 (CSV, 스프레드시트 등)
    • 관계형 데이터베이스(DB)에 저장됨
    • 데이터의 수집과 관리가 용이
  • 비정형 데이터 : 고정된 틀이 존재하지 않고 연산이 불가능 (댓글, 영상, 이미지등)
    • 수집과 관리가 어려움
    • NoSQL DB에 저장됨
  • 반정형 데이터 : 고정된 형태는 있지만 연산이 불가능 (XML, JSON 등)
    • 수집과 관리가 어려움
    • 파일형태로 저장됨
    • 가공을 거쳐 정형 데이터로 변환이 가능

암묵지와 형식지

  • 암묵지 : 학습과 체험을 통해 개인에게 습득되어 있지만, 겉으로는 드러나지 않는 상태의 지식 (숨겨진 knowHow)
  • 형식지 : 암묵지가 문서나 메뉴얼처럼 외부로 표출되어 여러 사람이 공유할 수 있는 지식
  • 암묵지와 형식지의 상호작용 : 공유화되기 어려운 암묵지가 형식지로 표출되고 연결되면 그 상호작용으로 지식이 형성된다.

데이터와 정보

DIKW 피라미드

  • 데이터에서 지혜를 얻는 과정
  • 데이터 : 개별 데이터 자체는 의미가 중요하지 않은 객과적인 사실
  • 정보 : 데이터의 가공/처리를 통하여 의미가 생성됨
  • 지식 : 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합해 고유의 지식으로 내제화된 것
  • 지혜 : 지식의 축척과 아이디어가 결합된 창의적 산물
  • DIKW 피라미드

DIKW 피라미드

데이터에 관한 상식

- 비트와 바이트

  • 비트(bit) : "0"과 "1"의 두 가지 값으로 신호를 나타내는 최소단위
  • 바이트(byte) : 8개의 비트로 구성된 데이터의 양을 나타내는 단위

- 데이터 단위

  • 1 바이트(byte) = 8 비트
  • 1 킬로 바이트(KB) = 1024 바이트
  • 1 메가 바이트(MB) = 1024 킬로 바이트
  • 1 기가 바이트(GB) = 1024 메가 바이트
  • 1 테라 바이트(TB) = 1024 기가 바이트
  • 1 페타 바이트(PB) = 1024 테라 바이트
  • 1 엑사 바이트(EB) = 1024 페타 바이트
  • 1 제타 바이트(ZB) = 1024 엑사 바이트
  • 1 요타 바이트(YB) = 1024 제타 바이트
반응형

'Data Analysis' 카테고리의 다른 글

Python NumPy 완벽 가이드: 데이터 과학의 기초  (2) 2024.11.28
Python Pandas 완벽 가이드: 데이터 분석의 시작  (2) 2024.11.27
선형대수 (2)  (0) 2024.07.18
선형대수 (1)  (0) 2024.07.16
ADsP - 데이터의 이해(2)  (0) 2024.07.05