[전문가 칼럼] 데이터의 이해

데이터란 이론을 세우는 데 기초가 되는 사실·자료를 의미한다. 데이터는 가공되지 않은 사실(fact, raw material)로서 문자나 숫자나 수치,기호, 도형으로 표현될 수 있다.

데이터는 언어, 문자 등으로 기술이 되는 정성적 데이터와 수치,기호,도형으로 구분되는 정량적 데이터로 구분할 수 있다.

디지털 환경을 통해 끊임 없이 쏟아지는 것이 데이터이다. 인간이 살아가는 환경 속 어디나 데이터는 쏟아질 수 밖에 없고 그렇게 쏟아지는 데이터를 통해 인류문명은 발전을 거듭해 왔다고 할 수 있다. 시간이 지날수록 데이터가 주목받는 이유는 데이터가 바로 가치를 극대화 시키는 핵심 엔진이기 때문이다. 데이터를 분석하면 그 안에서 이전에 예측하지 못했던 새로운 통찰력(Insight)을 얻을 수 있다.

2. 데이터구분

데이터는 다음과 구분으로 설명될 수 있다.

이 세상의 존재하는 사실 그대로의 내용을 데이터(Data)라고 지칭하며 그것을 가공처리 한 것을 정보(Information)라고 한다. 그리고 많은 정보를 일반화시킨 지식(Knowledge)과 그것을 활용하는 역량인 지혜(Wisdom)로 설명이 된다. 이것을 영어의 첫 글자만을 인용하여 DIKW 라고도 지칭한다.

데이터베이스를 이해하기 위해서는 다음의 핵심 개념을 이해하는 것이 선행되어야 한다. 특히 데이터, 데이터베이스, 데이터베이스관리스템, 데이터베이스 시스템에 대한 혼선은 그 다음 학습을 방해하고 지식을 정립해가는 데 있어 혼란을 야기한다. 각각의 개념에 대한 명확한 정의를 하고 그 이후에 그것에 포함된 하부 개념을 이해해가면 데이터베이스 관련된 지식을 선명하고 체계적으로 학습할 수 있는 원동력이 된다. 따라서 다음 순서로 기본개념을 확립할 필요가 있다.

3. 데이터의 특성

데이터를 객관적 사실(fact, raw material)의 특성을 나타내는 존재적 특성과 추론·예측·전망·추정을 위한 근거(basis)로서 당위적특성을 나타내기도 한다.

4. 데이터 유형

수량적 데이터로 표현이 되는지에 따라 정성적데이터와 정량적로 구분하기도 한다.

정성적 데이터(Qualitative Data)는 사용자 경험 및 구매 행태를 보여주는 기술적인 데이터를 의미하며, 사람들이 어떻게 생각하고 느끼는지에 좀 더 초점을 맞춘다. 정성적 데이터를 통해 사용자들의 의견과 불만, 구매 동기 등을 파악할 수 있다. 정량적 데이터(Quantitative Data)는 통계에 더 초점을 맞춘 데이터로, 측량하거나 분석이 가능한 수량적 데이터를 의미한다. 보통 정량적 데이터는 사용자의 행동과 의견을 계량화하기 위해 사용된다.

정성적 데이터와 정량적 데이터를 구분하여 다음과 같이 설명될 수 있다.

5. 데이터의 종류

항목내용
순서형 데이터개개의 값들이 이산적이고 값들 사이에 순서가 존재하는 데이터 예) 만족도 5단계- 매우 만족부터 불만족
명목형 데이터분류된 자료로서 독립적인 데이터 예) 성별-남,여, 취미-바둑,독서
이산형 데이터수치적인 값을 가지고 있으나 소수점의 형태로 표현되지 못하는 데이터 예)인구수, 불량품 수
연속형 데이터데이터의 수치의 값이 연속되어 나타나는 데이터 예)몸무게, 시간


**해당 콘텐츠는 저작권법에 의해 보호받는 저작물입니다.
**해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.