반응형
데이터의 이해
데이터의 정의
- 일반적으로 연구나 조사 등의 바탕이 되는 재료 혹은 자료를 의미
데이터의 특성
- 데이터는 있는 그대로의 사실, 즉 객관적인 사실을 의미
- 정보는이러한 데이터를 가공하여 만든 자료를 의미
- 데이터의 존재적 특성 : 있는 그대로의 사실
- 데이터의 당위적 특성 : 추론/ 예측 / 전망 등을 위한 정보의 근거
- 따라서, 데이터는 정보가 아니라 객관적 사실의 자료
데이터의 유형
- 정성적 데이터 : 집합으로 표현할 수 없는 기준이 명확하지 않은 데이터 (예; 언어와 문자 등)
- 정량적 데이터 : 집합으로 표현할 수 있는 기준이 명확한 데이터 (예; 수치, 도형, 기호 등)
- 정형 데이터 : 고정된 틀을 가지고 있으면서 연산이 가능한 데이터 (CSV, 스프레드시트 등)
- 관계형 데이터베이스(DB)에 저장됨
- 데이터의 수집과 관리가 용이
- 비정형 데이터 : 고정된 틀이 존재하지 않고 연산이 불가능 (댓글, 영상, 이미지등)
- 수집과 관리가 어려움
- NoSQL DB에 저장됨
- 반정형 데이터 : 고정된 형태는 있지만 연산이 불가능 (XML, JSON 등)
- 수집과 관리가 어려움
- 파일형태로 저장됨
- 가공을 거쳐 정형 데이터로 변환이 가능
암묵지와 형식지
- 암묵지 : 학습과 체험을 통해 개인에게 습득되어 있지만, 겉으로는 드러나지 않는 상태의 지식 (숨겨진 knowHow)
- 형식지 : 암묵지가 문서나 메뉴얼처럼 외부로 표출되어 여러 사람이 공유할 수 있는 지식
- 암묵지와 형식지의 상호작용 : 공유화되기 어려운 암묵지가 형식지로 표출되고 연결되면 그 상호작용으로 지식이 형성된다.
데이터와 정보
DIKW 피라미드
- 데이터에서 지혜를 얻는 과정
- 데이터 : 개별 데이터 자체는 의미가 중요하지 않은 객과적인 사실
- 정보 : 데이터의 가공/처리를 통하여 의미가 생성됨
- 지식 : 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합해 고유의 지식으로 내제화된 것
- 지혜 : 지식의 축척과 아이디어가 결합된 창의적 산물
- DIKW 피라미드
데이터에 관한 상식
- 비트와 바이트
- 비트(bit) : "0"과 "1"의 두 가지 값으로 신호를 나타내는 최소단위
- 바이트(byte) : 8개의 비트로 구성된 데이터의 양을 나타내는 단위
- 데이터 단위
- 1 바이트(byte) = 8 비트
- 1 킬로 바이트(KB) = 1024 바이트
- 1 메가 바이트(MB) = 1024 킬로 바이트
- 1 기가 바이트(GB) = 1024 메가 바이트
- 1 테라 바이트(TB) = 1024 기가 바이트
- 1 페타 바이트(PB) = 1024 테라 바이트
- 1 엑사 바이트(EB) = 1024 페타 바이트
- 1 제타 바이트(ZB) = 1024 엑사 바이트
- 1 요타 바이트(YB) = 1024 제타 바이트
반응형
'Data Analysis' 카테고리의 다른 글
Python NumPy 완벽 가이드: 데이터 과학의 기초 (2) | 2024.11.28 |
---|---|
Python Pandas 완벽 가이드: 데이터 분석의 시작 (2) | 2024.11.27 |
선형대수 (2) (0) | 2024.07.18 |
선형대수 (1) (0) | 2024.07.16 |
ADsP - 데이터의 이해(2) (0) | 2024.07.05 |