본문으로 바로가기

Unsupervised Learning 이란?

category 일상기록 2015. 8. 11. 23:57


Unsupervised Learning 이란?


Unsupervised Learning은 Supervised Learning의 반대되는 개념으로 

데이터의 모음이 처음부터 일정하게 구분되어 있는 것이 아니라 

직접 데이터들을 분류하여 그 결과를 나타내는 것을 이야기한다. 





한 가지 예로, 어떤 단어로 기사를 검색하면, 


항상 그 단어를 포함한 기사만 나오는 것이 아닌, 


그와 비슷한 주제에 관한 내용을 전부 수집하여 보여주게 된다. 




블로그 포스트를 네이버, 다음, 구글 등에서 검색 결과로 띄울 때, 


robot이 어떤 자료를 수집하고 특정 기준에 따라 분류하여 검색 결과값으로 나타낸다. (자율 Clustering)



Unsupervised Learning에서 Clustering(분류) 하는데 중요한 점이 있다.


Cocktail party problem을 예로 들 수가 있는데, 


두 명의 사람이 동시에 다른 내용을 듣더라도 


각자 원하는 내용만 집중해서 다 들을 수 있는 것을 얘기한다.




분류의 기준 → 본인이 원하는 정보인셈이다.




정리


결국 Unsupervised Learning은 데이터가 분류되어있지 않고, 


자율학습을 통해 기준을 만들고 그 기준에 따라 분류하는 방법을 얘기하는 것이다.