본문 바로가기

BLOG/머신러닝

[머신러닝] 지도학습과 비지도학습의 차이 및 알고리즘 종류

머신러닝 알고리즘에는 크게 지도학습과 비지도학습, 그리고 강화학습으로 구분되는데요, 지도학습과 비지도학습에 대해서 간단하게 살펴보도록 하겠습니다.

 

 

1. 지도학습(Supervised Learning)

먼저, 지도학습은 학습 데이터에 대한 올바른 input data와 output dataset으로 학습으로 이루어지는데요, 에러를 감소시키도록 학습이 이루어집니다. 즉, 지도학습은 weight(가중치) 값을 바꿔가며 학습을 통해 나온 output data와 올바른 output data와의 차이를 줄이는 방향을 학습됩니다.

 

이러한 지도학습에는 다양한 알고리즘이 있는데요, Regression, Decision Trees, Random Forests, Classification 등이 있습니다. 여기서 Regression과 Classification은 자주 사용되는 알고리즘 중 하나인데요, Regression은 input data가 속한 class가 아닌 'value'를 판단해 데이터의 트렌드를 측정한다는 특징을 갖고 있습니다. 반면, Classification은 input data가 어느 class에 속하는지 판별하는 알고리즘을 말합니다. Regression의 경우 Linear Regression, Polynomial Regression 알고리즘이 있으며, Classification에는 KNN, Trees, Logistic Regression, Naive-Bayes, SVM 등이 있습니다.

 

 

 

2. 비지도학습(Unsupervised Learning)

반면, 비지도학습은 input data에 대한 올바른 output data 없이 학습이 이루어지기 때문에 주로 데이터의 특성을 살펴볼 때 사용된답니다.

 

이러한 비지도학습에는 Clustering, Dimensionality Reduction(SVD, PCA, K-means), Association Analysis(Apriori, FP-Growth), Hidden Markov Model 등의 알고리즘이 있습니다.

 

 

 

한편, 지도학습과 비지도학습에 속하는 알고리즘을 continuous, categorical 특성에 따라 다음과 같이 분류할 수 있답니다. 참고하시기 바랍니다 :D

  Continuous Categorical
Supervised Learning Regression(Linear, Polynomial), Decision Trees, Random Forests Classfication(KNN, Trees, Logistic Regression, Naive-Bayes, SVM)
Unsupervised Learning Clustering & Dimensionality Reduction(SVD, PCA, K-means) Association Analysis(Apriori, FP-Growth), Hidden Markov Model