본문 바로가기

데이터분석(Data analysis)

머신러닝 기초, 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)에 대해 알아보자!

 

안녕하세요 ㅎ

 

오늘은 머신러닝 기초, 지도 학습과 비지도 학습, 강화 학습에 대해 알아보고자 합니다.

 

머신러닝에 대해 잘 모르신다면 아래 링크를 참고해주시면 되겠습니다.

 

AI? 머신러닝? - 인공지능이란 무엇인가.

 

AI? 머신러닝? - 인공지능에 대해 알아보자!

안녕하세요. ㅎ 오늘은 4차 산업의 핵심이자 뜨겁게 달아오르고 있는 인공지능에 대해 알아보려고 합니다. 여러분들은 인공지능에 대해 어떻게 생각하고 계신가요? 요즘 무인 자동차, 로봇, 유튜브, 케이블티브이..

scikitlearn.tistory.com

 

지도학습과 비지도 학습, 강화 학습을 설명드리기 전에 먼저 학습부터 설명드리면 머신러닝에서 학습이란 어떤 문제를 풀기 위해 컴퓨터에게 데이터를 주입시키는 것을 말합니다.

 

즉, 컴퓨터에게 정보를 주입시키고 의사결정을 하게 끔 한다고 보시면 됩니다.

 

그럼 지도학습부터 무엇인지 알아보겠습니다.

 

지도 학습(supervised learning)이란 훈련데이터를 기반으로 어떠한 것을 유추하기 위한 학습입니다.

 

쉽게 말하면 컴퓨터에게 강아지 사진 10만 장과 고양이 사진 10만 장을 학습시키고 강아지나 고양이 사진을 보여주며 맞추게 하는 것으로 정답을 알려주며 학습을 시키는 거라 보시면 되겠습니다.

 

강아지와 고양이를 판단하기 위해 사진을 10만장 학습시키는 이유는 강아지 종류와 고양이 종류가 수 없이 많고 고양이를 닮은 강아지가 있을 수 있고, 반대로 강아지를 닮은 고양이가 있을 수 있기 때문에 이에 따른 정확성을 높이기 위해서입니다. 때문에 지도 학습에서는 데이터를 많이 학습시킬수록 좋다고 보시면 되겠습니다.

 

지도 학습으로 분류와 회귀 문제를 풀 수 있습니다.

 

분류의 대표적인 사례를 예를 들자면 스팸메일 필터와 유튜브 추천 영상 기능입니다.

 

1. 스팸메일 필터

- 스팸메일에 대한 데이터를 학습시켜 필터하는 기능으로 스팸메일에 들어가는 특정 단어, 발신자, 단어 빈도수, 이미지 등 파악하여 분류합니다.

 

2. 유튜브 추천영상

- 이용자의 검색 및 시청 동영상 데이터를 학습시켜 같은 종류의 영상을 추천해주는 기능으로 이용자의 속성과 동영상의 속성을 분류하여 매칭 시켜줍니다.

 

다음 회귀를 대표적인 사례로 예를 들자면 예측모델이 있겠습니다.

 

1. 예측모델

- 독립변수의 변화에 따른 종속변수의 변화를 예측하는 것으로, 예들 들면 아빠 키를 이용하여 아들 키를 예측하는 모델이 되겠습니다. 아빠키, 아들키를 학습시켜 회귀선을 그리고 특정 아빠 키가 있을 때 회귀선에 따른 아들 키를 예측합니다.

 

 

비지도 학습(unsupervised learning)이란 데이터가 어떻게 구성되어있는지 알아내고자 할 때 사용됩니다.

 

즉, 정답을 알려주지 않고 학습시켜 그 데이터가 가지고 있는 의미를 찾을 때 사용된다 보시면 되겠습니다.

 

예를 들자면 사람과 동물의 데이터가 있다고 가정해 보겠습니다.

 

이 데이터를 가지고 비지도 학습을 이용하면 다리 2개를 가진 것은 사람으로 분류하고 다리 4개를 가진 것은 동물로 분류를 할 것입니다.

 

현업에선 지도학습을 설명하고자 하는 변수를 모를 때 비지도 학습을 사용합니다.

 

예를 들어 예측모델을 만들어야 하는데 해당 데이터의 주요 변수인 아빠 키, 아들 키를 모른다고 할 때 비지도 학습을 통해 찾을 수 있다고 보시면 되겠습니다.

 

 

강화 학습(Reinforcement Learning)이란 어떠한 상태를 인식하여 보상을 극대화하는 학습방식으로 바둑천재를 이긴 알파고가 이 학습방법을 사용했습니다.

 

강화 학습은 딥러닝이라고도 불리며, 행동심리학에서 영감을 얻었다고 합니다.

 

머신러닝 알고리즘 중 인간과 학습방식이 제일 비슷하다고 보시면 되겠습니다.

 

예를 들면 사람은 살면서 어떠한 행동을 하고 그에 대한 보상이 주어진다고 볼 때 그 보상이 나쁜 보상이면 다음부터는 그 행동을 안 하거나 최소화 하기 위해 노력할 것이고, 좋은 보상이면 다음에 또 그 행동을 하거나 보상을 극대화하기 위해 신경을 쓸 것입니다.

 

강화학습은 최근들어 개발이 활발하게 진행되고 있는 만큼 핫하지만, 타 학습방법에 비해 상대적으로 난이도가 있기 때문에 쉽게 접근하기가 힘듭니다.

 

또 현업에선 강화학습 보다는 아직까지는 지도학습과 비지도학습을 많이 사용하기 때문에 취업을 준비하는 취준생이라면 지도학습과 비지도학습을 우선적으로 배워야합니다.

 

이상 오늘은 머신러닝 학습종류 및 원리에 대해 알아보았습니다.

 

감사합니다.