본문 바로가기
반응형

결정트리3

[머신러닝 with Python] 앙상블(Ensemble) 학습 (2) / 배깅(Bagging) / 랜덤포레스트(Random Forest) / 타이타닉(titanic) 데이터 활용 지난번 포스팅에서는 앙상블 기법의 기본인 보팅(Voting)에 대해서 알아보았습니다. 이번에는 앙상블 기법 중 배깅(Bagging)에 대해서 알아보겠으며, 배깅의 대표적인 모델인 랜덤포레스트에 대해서 알아보겠습니다. 1. 배깅(Bagging)이란? - 배깅(Bagging)이란, Bootstrap Aggregating의 약어로 말 그대로 a) 부트스트랩(Bootstrap) 방법으로 원본 데이터에서 랜덤성과 중복을 허용하여 학습 샘플을 추출하고 b) 정해진 모델로 각각의 샘플에 대해서 학습한 결과를 Aggregating(종합, 집합)해서 최적의 결과를 도출하는 방법을 말합니다. - 이를 정리해서 Bagging 의 작동방식에 대해서 알아보면 아래와 같습니다. 1) 데이터의 부분 집합(Bootstrap 샘플)을.. 2023. 9. 11.
[머신러닝 with Python] 결정 트리(Decision Tree) (2/2) / 과적합(Over-fitting) 이번에는 1) 결정트리(Decision Tree)의 과적합(Overfitting) 무제에 대해 2차원 데이터의 시각화를 통해 알아보겠으며, 2) 이러한 과적합(Overfitting)문제의 해결방안에 대해서 알아보겠습니다. 1. 결정트리(Decision Tree)의 과적합(Overfitting) 문제 (Python 활용) 결정트리(Decision Tree)는 직관적인 설명력을 제공해주는 효과적인 분류(회귀도 가능) 모형이지만, 과적합(Overfitting)이라는 문제 또한 가지고 있습니다. - 과적합(Overfitting)이란, 기계 학습 모델이 훈련 데이터에 너무 맞춰져서, 훈련 데이터에 대한 예측 성능은 높지만 새로운 데이터나 테스트 데이터에 대한 성능이 낮아지는 현상을 의미합니다. - 이는 모델이 훈.. 2023. 9. 8.
[머신러닝 with Python] 결정 트리(Decision Tree) (1/2) / 결정트리 시각화(Graphviz 활용) / 붓꽃(iris) 데이터 이번에 알아볼 것은 분류(Classification) 모델의 대표격인 결정트리 / 결정나무 (Decision Tree) 입니다. 1. 결정트리 / 결정나무(Decision Tree)란? - 결정트리(Decision Tree)는 머신러닝 알고리즘 중 직관적으로 이해하기 쉬운 알고리즘의 대표격입니다. - 분류(Classification) 모델의 대표격이지만, 회귀(Regression) 모델로도 활용할 수 있습니다. - 해당 모델은 스무고개와 같은 if/else 기반의 룰을 연계하여 데이터를 분류 (또는 회귀)를 합니다. - 결정트리(Decision Tree)의 주요 특징은 아래와 같습니다. 1) 계층적 구조: 결정 나무는 계층적으로 구성된 트리 모양의 구조를 가지며, 맨 위에는 "루트 노드"가 있고, 이후에.. 2023. 9. 7.
반응형