엑셀(Excel)

데이터프레임이란 - 엑셀 데이터베이스 이해하기

모르크 2020. 2. 3. 18:00

 

엑셀을 잘하기 앞서 제일 먼저 알고 있어야 되는 부분이 데이터 프레임에 대한 이해다.

 

데이터 프레임이란 데이터 간의 그룹을 말한다. 데이터 요소들을 효율적으로 그룹화하고 참조가 용이하도록 하는 데이터 요소들의 집합이라 볼 수 있다.

 

더 쉽게 말하면 데이터들이 오와 열을 맞춰 정렬된 데이터의 집합이라고 생각하면 된다.

 

엑셀을 다루는데 데이터에 대한 이해가 왜 필요하냐 의문이 들 수 있지만, 데이터 프레임을 모르고 데이터를 집계한다면 난잡한 데이터 집계가 될 수 있으며, 그 데이터를 재활용하기에도 힘들 것이다.

 

예를 들면 Raw data를 활용하여 데이터를 집계한다고 했을 때, 기준을 잘못 잡아 다시 집계를 해야 되는 상황이 오거나 그 Raw data를 활용하여 다른 집계표를 만든다고 했을 때, 데이터 프레임이 안 잡혀있다면 다시 Raw data를 만드는 작업부터 해야 될 것이다.

 

이에 따라 엑셀을 다루기 앞서 데이터 프레임에 대한 이해를 하고 넘어가도록 하자.

 

이해를 돕기 위해 엑셀의 데이터 프레임을 임시로 만들어 보았다.

 

아래 그림을 한번 보자.

 

[데이터프레임]

 

 

이해를 돕기 위해 데이터프레임을 임의로 만들어 보았다.

 

데이터 프레임이란 단어가 생소해서 그렇지 사실 별거 아니다.

 

그림을 보면 알 수 있듯 그냥 데이터를 잘 정렬해놓은 집합이다.

 

이렇게 데이터를 정렬 해놓고 저장해두면 두고두고 필요할 때마다 사용할 수 있다.

 

필자는 금융사무직으로 가끔 일정기간 데이터를 집계할 때가 있다.

 

예를 들면 1년 치 연체율을 집계한다고 했을 때 데이터 정리를 잘해놓으면 그냥 불러와서 기준에 맞춰 집계만 하면 될 것이다.

 

그러나 데이터관리가 잘 안되어있다면 데이터정리부터 해야될 것이다.

 

1년치 데이터를 정리한다는 생각만해도 끔찍하다. 이렇게 불필요한 작업으로 야근을 부르는 일은 없도록 하자.

 

또 데이터프레임을 다루지 않고 엑셀을 한다면 단순 계산기 수준정도로 밖에 사용할 수 없다.

 

때문에 더 고급진(?) 엑셀을 다루기 위해선 데이터프레임의 구조와 원리를 꼭 알아두도록 하자.

 

최근 급부상하는 빅데이터도 큰 데이터 프레임이라고 보면 된다.

 

엑셀은 1,048,576개까지 데이터를 다룰 수 있다는 점에서 약 100만개의 데이터를 다루고 분석할때는 프로그래밍보다 엑셀을 이용하는 것이 더 빠르고 간편할 수 있다.

 

데이터를 얼마나 잘 정리하느냐에 따라 업무효율성과 퇴근시간 달라질 것이다.

 

인공지능, 빅데이터 등 데이터가 힘이 되는 시대이니 만큼 효율적인 데이터관리를 통해 경쟁력을 확보하도록 하자.

 

​※ 요약

1. 데이터프레임은 데이터의 정렬의 집합체이다.

2. 데이터프레임의 구조는 첫번째 열은 데이터의 속성, 두번째 열부터는 첫번째 열을 설명하는 데이터가 들어간다.

 

 

 

엑셀 기본함수 sum을 배워보자!

 

숫자 합계 계산하기 - 엑셀 함수 SUM

엑셀 함수 SUM이란 합계를 말한다. 즉 셀과 셀의 합계를 구하는 기초 함수로 엑셀을 배우는 대부분의 사람들이 처음 접하는 함수이기도 하다. 필자는 sum을 처음 배울 때 그냥 "+"로 사용해도 되지

scikitlearn.tistory.com

 

 

 

엑셀 RANK함수를 이용하여 순위를 구해보자!

 

순위를 구해보자! 엑셀 함수 RANK

이번 시간에는 RANK에 대해 알아보도록 하겠다. 회사에서 지점의 실적을 평가할 때, 직원들의 실적을 평가할 때 등 순위를 구해야 할 때가 많다. 총점수로 내림차순으로 정렬하여 봐도 상관은 없

scikitlearn.tistory.com