본문 바로가기

엑셀(Excel)

데이터프레임이란 - 엑셀 데이터베이스 이해하기

 

엑셀을 잘하기 앞서 제일 먼저 알고 있어야 되는 부분이 데이터 프레임에 대한 이해다.

 

데이터 프레임이란 데이터 간의 그룹을 말한다. 데이터 요소들을 효율적으로 그룹화하고 참조가 용이하도록 하는 데이터 요소들의 집합이라 볼 수 있다.

 

더 쉽게 말하면 데이터들이 오와 열을 맞춰 정렬된 데이터의 집합이라고 생각하면 된다.

 

엑셀을 다루는데 데이터에 대한 이해가 왜 필요하냐 의문이 들 수 있지만, 데이터 프레임을 모르고 데이터를 집계한다면 난잡한 데이터 집계가 될 수 있으며, 그 데이터를 재활용하기에도 힘들 것이다.

 

예를 들면 Raw data를 활용하여 데이터를 집계한다고 했을 때, 기준을 잘못 잡아 다시 집계를 해야 되는 상황이 오거나 그 Raw data를 활용하여 다른 집계표를 만든다고 했을 때, 데이터 프레임이 안 잡혀있다면 다시 Raw data를 만드는 작업부터 해야 될 것이다.

 

이에 따라 엑셀을 다루기 앞서 데이터 프레임에 대한 이해를 하고 넘어가도록 하자.

 

이해를 돕기 위해 엑셀의 데이터 프레임을 임시로 만들어 보았다.

 

아래 그림을 한번 보자.

 

[데이터프레임]

 

 

이해를 돕기 위해 데이터프레임을 임의로 만들어 보았다.

 

데이터 프레임이란 단어가 생소해서 그렇지 사실 별거 아니다.

 

그림을 보면 알 수 있듯 그냥 데이터를 잘 정렬해놓은 집합이다.

 

이렇게 데이터를 정렬 해놓고 저장해두면 두고두고 필요할 때마다 사용할 수 있다.

 

필자는 금융사무직으로 가끔 일정기간 데이터를 집계할 때가 있다.

 

예를 들면 1년 치 연체율을 집계한다고 했을 때 데이터 정리를 잘해놓으면 그냥 불러와서 기준에 맞춰 집계만 하면 될 것이다.

 

그러나 데이터관리가 잘 안되어있다면 데이터정리부터 해야될 것이다.

 

1년치 데이터를 정리한다는 생각만해도 끔찍하다. 이렇게 불필요한 작업으로 야근을 부르는 일은 없도록 하자.

 

또 데이터프레임을 다루지 않고 엑셀을 한다면 단순 계산기 수준정도로 밖에 사용할 수 없다.

 

때문에 더 고급진(?) 엑셀을 다루기 위해선 데이터프레임의 구조와 원리를 꼭 알아두도록 하자.

 

최근 급부상하는 빅데이터도 큰 데이터 프레임이라고 보면 된다.

 

엑셀은 1,048,576개까지 데이터를 다룰 수 있다는 점에서 약 100만개의 데이터를 다루고 분석할때는 프로그래밍보다 엑셀을 이용하는 것이 더 빠르고 간편할 수 있다.

 

데이터를 얼마나 잘 정리하느냐에 따라 업무효율성과 퇴근시간 달라질 것이다.

 

인공지능, 빅데이터 등 데이터가 힘이 되는 시대이니 만큼 효율적인 데이터관리를 통해 경쟁력을 확보하도록 하자.

 

​※ 요약

1. 데이터프레임은 데이터의 정렬의 집합체이다.

2. 데이터프레임의 구조는 첫번째 열은 데이터의 속성, 두번째 열부터는 첫번째 열을 설명하는 데이터가 들어간다.

 

 

 

엑셀 기본함수 sum을 배워보자!

 

숫자 합계 계산하기 - 엑셀 함수 SUM

엑셀 함수 SUM이란 합계를 말한다. 즉 셀과 셀의 합계를 구하는 기초 함수로 엑셀을 배우는 대부분의 사람들이 처음 접하는 함수이기도 하다. 필자는 sum을 처음 배울 때 그냥 "+"로 사용해도 되지

scikitlearn.tistory.com

 

 

 

엑셀 RANK함수를 이용하여 순위를 구해보자!

 

순위를 구해보자! 엑셀 함수 RANK

이번 시간에는 RANK에 대해 알아보도록 하겠다. 회사에서 지점의 실적을 평가할 때, 직원들의 실적을 평가할 때 등 순위를 구해야 할 때가 많다. 총점수로 내림차순으로 정렬하여 봐도 상관은 없

scikitlearn.tistory.com