본문 바로가기
반응형

오차행렬3

[머신러닝 with 파이썬] 로지스틱 회귀(Logistic Regression) 이번에 알아볼 모델은 로지스틱 회귀(Logistic Regression)입니다. 로지스틱 회귀는 선형 회귀 방식을 분류에 적용한 알고리즘을 말합니다. (이때, 회귀가 선형인가 비선형인가 하는 구분은 독립 변수가 아닌, 가중치(Weight) 변수가 선형인지 아닌지를 따릅니다.) 1. 로지스틱 회귀(Logistic Regression)란? - 로지스틱 회귀는 로지스틱 함수(시그모이드(Sigmoid) 함수라고도 불립니다)를 사용하는 알고리즘으로, 분류(Classification) 문제를 다루는데 사용되는 알고리즘 중 하나입니다. * 로지스틱(Logistic) 함수 ( 시그모이드(Sigmoid) 함수 라고도 불립니다)는 아래와 같습니다. * 이 함수에서 e는 자연 로그의 밑(약 2.71828)이며, x는 입력변.. 2023. 9. 22.
[머신러닝 with Python] 앙상블(Ensemble) 학습 (2) / 배깅(Bagging) / 랜덤포레스트(Random Forest) / 타이타닉(titanic) 데이터 활용 지난번 포스팅에서는 앙상블 기법의 기본인 보팅(Voting)에 대해서 알아보았습니다. 이번에는 앙상블 기법 중 배깅(Bagging)에 대해서 알아보겠으며, 배깅의 대표적인 모델인 랜덤포레스트에 대해서 알아보겠습니다. 1. 배깅(Bagging)이란? - 배깅(Bagging)이란, Bootstrap Aggregating의 약어로 말 그대로 a) 부트스트랩(Bootstrap) 방법으로 원본 데이터에서 랜덤성과 중복을 허용하여 학습 샘플을 추출하고 b) 정해진 모델로 각각의 샘플에 대해서 학습한 결과를 Aggregating(종합, 집합)해서 최적의 결과를 도출하는 방법을 말합니다. - 이를 정리해서 Bagging 의 작동방식에 대해서 알아보면 아래와 같습니다. 1) 데이터의 부분 집합(Bootstrap 샘플)을.. 2023. 9. 11.
[머신러닝 with Python] 오차행렬 or 혼동행렬(Confusion Matrix) / 유방암 데이터(Breast Cancer Data) 활용하여 알아보기 이번에 알아볼 것은 지난 시간에 알아본 정확도 및 기타 분류평가지표를 도출할 수 있는 오차행렬 또는 혼동행렬이라 불리는 Confusion Matrix에 대해서 알아보겠습니다. 1. 오차행렬 / 혼동행렬 (Confusion Matrix) 이란? - Confusion Matrix(오차 행렬)은 분류 모델의 성능을 평가하기 위한 표입니다. - 주로 이진 분류(두 가지 클래스로 분류) 문제를 다룰 때 사용되지만, 다중 분류에서도 그 분류 결과를 한눈에 정리해주는 용도로 사용됩니다. - 이는, 모델이 예측한 결과와 실제 관측된 결과를 비교하는 데에 사용되며 아래 네 가지 주요 항목으로 구성됩니다. 1) True Positive(TP) : 예측값을 Positive로 예측했는데 실제 값 역시 Positive인 경우 .. 2023. 9. 5.
반응형