본문 바로가기
머신러닝

1 - 1. 머신러닝의 알고리즘 타입 - 지도학습

by Gom Guard 2017. 11. 24.


머신러닝 알고리즘 타입

  • 머신러닝의 알고리즘은 크게 나누면 4가지 정도로 나눌 수 있습니다.


지도학습

지도 학습 (Supervised Learning)은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법이다. 훈련 데이터는 일반적으로 입력 객체에 대한 속성을 벡터 형태로 포함하고 있으며 각각의 벡터에 대해 원하는 결과가 무엇인지 표시되어 있다. 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다. 지도 학습기(Supervised Learner)가 하는 작업은 훈련 데이터로부터 주어진 데이터에 대해 예측하고자 하는 값을 올바로 추측해내는 것이다. 이 목표를 달성하기 위해서는 학습기가 "알맞은" 방법을 통하여 기존의 훈련 데이터로부터 나타나지 않던 상황까지도 일반화하여 처리할 수 있어야 한다. 사람과 동물에 대응하는 심리학으로는 개념 학습(Concept Learning)을 예로 들 수 있다.

위키 백과 - 지도학습 정의


  • 한마디로 요약하자면 지도학습은 예측하고 싶을 때 사용하는 알고리즘 입니다. 여기서 '예측' 이란 미래의 일을 예측하는 것 뿐 아니라 과거의 사건을 알아내는 것도 포함합니다. 

  • 지도학습에 사용되는 데이터들은 변수와 결과 두부분으로 나누어 집니다. 각각 독립변수, 종속변수라고 부르는데 예를 들어보겠습니다.

  • 이런 데이터가 지도학습에서 사용 되는 데이터 입니다. 어떤 사람이 제품을 구매할지 안할지를 예측하고 싶은 상황입니다.

  • 예측하려는 과정에서 사용하는 알고리즘들로는 

    • 최근접 이웃 (Nearest Neighbor)

    • 나이브 베이즈 (Naive Bayes)

    • 의사결정 트리 (Decision Trees)

    • 분류 규칙 학습자 (Classification Rule Learners)

    • 선형 회귀 (Linear Regression)

    • 회귀 트리 (Regression Trees)

    • 모델 트리 (Model Trees)

    • 신경망 (Neural Networks)

    • 서포트 벡터 머신 (Support Vector Machines)

    • 등 ......

  • 여러 알고리즘 들이 존재하며 앞으로 하나씩 어떤 데이터에 어떤 알고리즘을 적용해야 하는지 알아보겠습니다.


댓글0