- 인공지능과 머신러닝, 딥러닝은 구별해서 사용해야 합니다. 세 단어의 관계를 정리하면 다음과 같습니다.
“딥러닝은 머신러닝의 일종이고, 머신러닝은 인공지능의 일종이다.”
-
머신러닝은 ‘학습 데이터’로부터 ‘모델’을 찾아내는 귀납적 기법으로 영상 인식과 음성 인식 및 자연어 처리 등의 문제를 푸는 데 효과적입니다.
-
머신러닝의 성패는 일반화를 얼마나 잘 달성하느냐에 달려 있습니다. 학습 데이터와 실제 입력 데이터의 차이로 인한 성능 저하를 막기 위해서는 편향되지 않은 학습 데이터를 충분히 확보해야 합니다.
-
과적합 문제를 해결하기 위한 대표적인 기법으로는 정칙화regularization 와 검증 validation 이 있습니다. 정칙화는 최대한 단순한 모델을 유도하려는 수치해석적인 기법입니다. 검증은 학습 과정에서 과적합 여부를 미리 알아내 이에 대한 조치를 취하려는 목적으로 고안된 기법입니다. 검증의 변형된 형태로 교차 검증이 있습니다.
-
머신러닝은 학습 방법에 따라 지도학습, 비지도학습, 강화학습으로 나눌 수 있습니다. 학습 종류별로 학습 데이터는 다음과 같은 형태로 주어집니다.
학습 종류 | 학습 데이터 |
지도학습 | { 입력, 정답 } |
비지도학습 | { 입력 } |
강화학습 | { 입력, 출력, 출력에 대한 점수 } |
- 지도학습은 모델의 용도에 따라 크게 ‘분류’와 ‘회귀’ 문제로 나눠집니다. 분류는 입력 데이터가 어느 범주에 속하는지를 알아내는 문제입니다. 분류 문제에서 학습 데이터의 정답은 ‘범주’로 주어집니다. 회귀 문제는 값을 예측하는 문제입니다. 학습 데이터의 정답은 ‘값’으로 주어집니다.