IT 인터넷

지도 학습 정의, 초심자도 이해 가능한 3가지 주제

lifelaps 2023. 2. 7. 12:44
반응형

지도 학습 이란 무엇인가요?
지도 학습의 이해의 출발은 국어 사전에서 찾으면 더 이해가 쉽다.

지도 학습 정의(supervised learning)는 처음 들으면 어렵게 느껴질 수 있습니다. 하지만, 일상 생활에서 예를들면 이해가 더 쉬울 수 있습니다. 학교 혹은 학원에서 공부할 때, 선생님에게 무언가를 배우신 경험 다들 있으실 겁니다. 지도 학습은 이와 같은 원리입니다. 사람이 인공지능에게 지식을 가르친다고 생각하시면 됩니다. 오늘 포스팅에서는 지도 학습의 정의와 분류와 회귀, 장점과 단점에 대해서 설명하고자 합니다.

 

1. 지도 학습 이란?

지도 학습은 감독관이 일일히 가르쳐주는 학습법입니다. 인공 지능에게 사람이 관여를 해서 하나씩 학습을 시키는 형태를 기본적인 방법으로 이해하시면 됩니다. 조금만 더 전문적으로 설명드리자면, 지도 학습이란 머신 러닝과 인공 지능의 하위 범주로, 데이터를 정확하게 '분류' 혹은 '예측' 하는 알고리즘을 훈련하기 위해서 레이블에 지정된 데이터 세트를 사용하는 것으로 정의가 됩니다. 

  • 단순하다.
  • 효율적이다.
  • 레이블이 지정된 데이터를 사용한다.

함께 읽으면 더 성장하는 글

1. 지도 학습 정의(초보자용) 3가지 주제-심화

2. 머신 러닝 종류 5가지 장점과 단점

3.딥 러닝 머신 러닝 차이점 3가지


2. 분류와 회귀

2.1 분류란?

우리는 같은 성질을 가진 것끼리 구분하는 것을 분류라고 합니다. 큰 마트에서 과일, 정육, 생선 등을 구분하는 하는 것을 분류라고 합니다. 지도 학습 정의 중 '분류'의 유형은 알고리즘을 사용하여 데이터를 특정 범주에 정확하게 할당하는 것을 목표로 합니다. 우리는 분류를 통해서 인공지능에게 아래의 것들을 훈련 시켜 실생활에 적용할 수 있습니다.

  • 스팸 감지: 해당 메일이 스팸인지 아닌지 구분하는 역할을 합니다. 중요한 점은 인간이 알고리즘을 AI에게 학습시킬 때 일일히 스팸인지 아닌지 학습을 시켜서 훈련을 시킵니다. 이 훈련을 마치면 인공 지능은 새로운 메일이 스팸인지 아닌지 구분하게 됩니다.
  • 텍스트 분류: 문장 혹은 글을 이해하고 내용에 따라 분류할 수 있습니다.
  • 전환 예측: 인공 지능에게 데이터와 구매자가 어떤 항목을 과거에 구매하였는지 학습 시킵니다. 이러한 학습 결과를 기반으로 알고리즘이 신규 고객이 유입되었을 때 물건을 구매할 지 말지 예측합니다.

2.2 회귀란?

통계학에서의 회귀 분석은 하나의 종속 변수 y와 두 개 이상의 독립 변수인 x1, x2, … 사이의 관계를 최소 제곱 방법에 의해서 추정하는 방법입니다. 정의가 조금 어려울 수 있지만, 지도 학습에서 중요한 개념 중에 하나 입니다. 오늘은 그 중에서 가장 단순한 선형 모형만 설명하도록 하겠습니다.

 

선형 회귀 모형 이란?

입력 값과 출력 값의 선형 관계를 찾는 것이 알고리즘의 목적입니다. 가격 변화에 따른 판매량 변화 처럼 어떠한 변화 값을 예측하는 모델로 사용합니다.

 

3. 장점과 단점

장점과 단점
지도 학습의 장점과 단점 2가지만 알아보자!

3.1 지도 학습의 장점

1. 예측 기반 데이터로 사용하기 좋다.

지도 학습 알고리즘은 과거 데이터를 기반으로 예측합니다. 과거의 데이터를 통해서 새로운 사건이 일어났을 때 이를 바탕으로 예측을 하는 방법입니다.

 

2. 해석 가능성

입력, 출력 값이 명확하고 잘 정의가 되어 있어서 알고리즘이 예측을 수행하는 방법을 더 명확하게 이해할 수 있습니다.

 

3.2 지도 학습의 단점

1. 과적합

기본 적인 패턴을 벗어나 문제가 복잡해지는 경우 데이터를 인풋 하는 과정에서 과적합이 발생합니다.

2. 제한된 범위

선형 가정이 현실과 맞지 않는 경우에는 적용하기 힘이 듭니다.

반응형