본문 바로가기
반응형

시각화3

[머신러닝 with Python] 선형회귀(Linear Regression) / 당뇨병(Diabetes) 데이터 활용 / EDA 시각화 포함 이번에는 지난 포스팅에 이어서 선형회귀(Linear Regression)에 대해서 알아보겠습니다. 지난 포스팅에서는 선형회귀의 기본 개념과 예제 데이터를 만들어 파이썬 코딩을 통해, 모델을 구현해보고 이를 시각화 해보았는데요 [머신러닝 with Python] 선형회귀(Linear Regression) / 최소제곱법(Least Square Methods) (1) 이번에는 실제 데이터를 활용해서 선형회귀를 구현해보겠습니다. 분석에 사용될 데이터는 당뇨병(Diabetes) 데이터 이며, 시각화를 위해 단순선형회귀로부터 시작하고 다중 선형회귀로 주어진 데이터를 최대한 활용하여 선형회귀 모델을 만들어 보겠습니다. 1. 당뇨병 데이터(Diabetes) 알아보기 - 해당 데이터의 링크 : https://scikit-.. 2023. 9. 19.
[머신러닝 with Python] 선형회귀(Linear Regression) / 최소제곱법(Least Square Methods) (1) 이번에는 머신러닝의 기본 중 기본인 선형회귀에 대해서 알아보겠습니다. 여기서 "선형"(Linear)은 말 그대로 선의 형태로 결과를 도출함을 의미하며 회귀(Regression)은 특정 상태로 돌아가는 것을 의미합니다. (이는 연어가 다시 태어난 곳으로 돌아가는 것을 회귀라 말하는 것과 큰 범주에서 같은 의미라 보시면 되겠습니다.) 1. 선형회귀(Linear Regression)란? - 선형회귀는 머신러닝과 통계학에서 가장 기본적인 회귀분석 방법 중 하나로, 독립 변수와 종속 변수 간의 관계를 직선의 형태로 나타내는 것을 의미합니다. - 선형 회귀는 독립 변수가 1개인 경우를 단순선형회귀(Simple Linear Regression), 2개 이상인 경우를 다중선형회귀(Multiple)라고 부릅니다. - 이.. 2023. 9. 18.
[머신러닝 with Python] 결정 트리(Decision Tree) (2/2) / 과적합(Over-fitting) 이번에는 1) 결정트리(Decision Tree)의 과적합(Overfitting) 무제에 대해 2차원 데이터의 시각화를 통해 알아보겠으며, 2) 이러한 과적합(Overfitting)문제의 해결방안에 대해서 알아보겠습니다. 1. 결정트리(Decision Tree)의 과적합(Overfitting) 문제 (Python 활용) 결정트리(Decision Tree)는 직관적인 설명력을 제공해주는 효과적인 분류(회귀도 가능) 모형이지만, 과적합(Overfitting)이라는 문제 또한 가지고 있습니다. - 과적합(Overfitting)이란, 기계 학습 모델이 훈련 데이터에 너무 맞춰져서, 훈련 데이터에 대한 예측 성능은 높지만 새로운 데이터나 테스트 데이터에 대한 성능이 낮아지는 현상을 의미합니다. - 이는 모델이 훈.. 2023. 9. 8.
반응형