R로 하는 머신러닝 Decision Tree와 Random Forest 개념, 사용 예시 설명 및 결과 해석
Decision Tree 정의 Decision Tree란 직역하면 의사결정나무라는 뜻이다. 여러 테스트 결과를 놓고 예, 아니오로 데이터를 결정한다. Decision Tree의 모형을 노드라고 표현하며 상위에 있는 모형을 부모노드, 부모노드와 이어져 있는 의사나무결정을 자식노드라고 한다. 가장 좋은 Decision Tree의 모형은 최소한의 노드 수. 즉 가장 작은 나무 모양 Decision Tree의 단점은 데이터를 여러 분류의 카테고리로 나누어 적용한 값을 예측하기 때문에 overfitting이 일어날 가능성이 높다. 즉, Decision Tree의 모델을 다른 데이터에 적용할 때 일반화가 어렵다는 단점이 있다. Random Forest 정의 이런 Decision Tree의 단점을 보완한 것이 랜덤포..