반응형 전체 글203 [머신러닝 with 파이썬] Pycaret이란? Pycaret을 활용한 머신러닝 이번에 알아볼 것은 pycaret이라는 라이브러리 입니다. 이 라이브러린는 분석하고자하는 데이터에 대해 머신러닝 기법들을 하나씩 적용해서 비교하는 수고를 덜어버릴 수 있는 유용한 라이브러리 입니다. 이를 통해 더 빠르고 효율적으로 데이터를 분석하고 예측할 수 있습니다. 1. Pycaret이란? - Pycaret이란, Python 기반의 오픈 소스 머신러닝라이브러리 중 하나로, 머신 러닝 모델을 쉽게 구축하고 비교하며, 모델을 최적화하고 평가하는데 도움을 주는 도구입니다. - 이를 활용해서, 데이터 과학자는 최소한의 코드 작성으로 다양한 머신러닝 모델을 탐색하고 최적화해볼 수 있습니다. - Pycaret을 활용해서 머신러닝을 통해 구현되는 a) 분류, b) 회귀, c) 클러스터링, d) 이상치 탐지 등 다.. 2023. 9. 24. [머신러닝 with 파이썬] 회귀 트리(Regression Tree) 이번에는 회귀 함수를 기반으로 하지 않고 결정 트리와 같이 트리를 기반으로 하는 회귀방식인, 회귀 트리(Regression Tree)에 대해서 알아보겠습니다. 분류에 사용되는 결정 트리에 관한 내용은 아래 포스팅을 참조하시면 도움이 되실 겁니다![머신러닝 with Python] 결정 트리(Decision Tree) (1/2) / 결정트리 시각화(Graphviz 활용) / 붓꽃(iris) 데이터 [머신러닝 with Python] 결정 트리(Decision Tree) (1/2) / 결정트리 시각화(Graphviz 활용) / 붓꽃(iris) 데이터이번에 알아볼 것은 분류(Classification) 모델의 대표격인 결정트리 / 결정나무 (Decision Tree) 입니다. 1. 결정트리 / 결정나무(Deci.. 2023. 9. 23. [머신러닝 with 파이썬] 로지스틱 회귀(Logistic Regression) 이번에 알아볼 모델은 로지스틱 회귀(Logistic Regression)입니다. 로지스틱 회귀는 선형 회귀 방식을 분류에 적용한 알고리즘을 말합니다. (이때, 회귀가 선형인가 비선형인가 하는 구분은 독립 변수가 아닌, 가중치(Weight) 변수가 선형인지 아닌지를 따릅니다.) 1. 로지스틱 회귀(Logistic Regression)란? - 로지스틱 회귀는 로지스틱 함수(시그모이드(Sigmoid) 함수라고도 불립니다)를 사용하는 알고리즘으로, 분류(Classification) 문제를 다루는데 사용되는 알고리즘 중 하나입니다. * 로지스틱(Logistic) 함수 ( 시그모이드(Sigmoid) 함수 라고도 불립니다)는 아래와 같습니다. * 이 함수에서 e는 자연 로그의 밑(약 2.71828)이며, x는 입력변.. 2023. 9. 22. [머신러닝 with 파이썬] 경사하강법(Gradient Descent) / 확률적 경사하강법(Stochastic Gradient Descent) 이번에 알아볼 것은 경사 하강법입니다. 경사하강법은 최적의 회귀식을 구하기 위해 사용되는 방법인데요. 선형 회귀의 경우 변수가 많으면 많을수록, 최소제곱법을 통해 최적의 계수(Coefficient)와 절편(Intercept)를 계산하기 시간이 오래 걸리게되는 등 많은 코스트가 발생하게 되는데요. 이를 해결하는 방법 중 하나가 경사하강법입니다. 1. 경사하강법(Gradient Descent)란? - 경사하강법의 사전적인 의미는 '점진적인 하강' 입니다. 이 뜻에서 알 수 있듯이 점진적으로 반복적인 계산을 진행하여 비용함수의 w(Weight)를 최소화 시켜가는 것을 말합니다. (여기서 w는, w0는 y 절편, w1,w2....wp는 xp의 계수를 의미합니다) - 선형회귀 모델에서는 실제 값과 예측값의 차이(.. 2023. 9. 21. [딥러닝 with 파이썬] 코랩에서 한국어용 Mecab 설치하기 이번에는 간단한 코드하나 공유합니다. 한국어 자연어분석을 위해 코랩을 사용하던 중 기존 코드들은 에러가 나서 Mecab을 설치하지 못했습니다. 형태소 분석을 위해 Mecab의 한국어용 버전 설치가 꼭 필요한데, 코랩에서 설치하는 코드를 공유합니다. (Redundant한 부분이 있을수도 있으니 필요없는 부분은 제거해서 이용하시면 되겠습니다 :) ) *깃허브에서 Mecab-ko 의 코랩 버전을 다운받기 !git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git * 코랩으로 디렉토리 변경 cd Mecab-ko-for-Google-Colab * Bash shell을 활용해 mecab-ko를 colab에 설치 !bash install_mecab-ko_.. 2023. 9. 20. [머신러닝 with Python] 선형회귀(Linear Regression) / 당뇨병(Diabetes) 데이터 활용 / EDA 시각화 포함 이번에는 지난 포스팅에 이어서 선형회귀(Linear Regression)에 대해서 알아보겠습니다. 지난 포스팅에서는 선형회귀의 기본 개념과 예제 데이터를 만들어 파이썬 코딩을 통해, 모델을 구현해보고 이를 시각화 해보았는데요[머신러닝 with Python] 선형회귀(Linear Regression) / 최소제곱법(Least Square Methods) (1) 이번에는 실제 데이터를 활용해서 선형회귀를 구현해보겠습니다. 분석에 사용될 데이터는 당뇨병(Diabetes) 데이터 이며, 시각화를 위해 단순선형회귀로부터 시작하고 다중 선형회귀로 주어진 데이터를 최대한 활용하여 선형회귀 모델을 만들어 보겠습니다. 1. 당뇨병 데이터(Diabetes) 알아보기- 해당 데이터의 링크 : https://scik.. 2023. 9. 19. [머신러닝 with Python] 선형회귀(Linear Regression) / 최소제곱법(Least Square Methods) (1) 이번에는 머신러닝의 기본 중 기본인 선형회귀에 대해서 알아보겠습니다. 여기서 "선형"(Linear)은 말 그대로 선의 형태로 결과를 도출함을 의미하며 회귀(Regression)은 특정 상태로 돌아가는 것을 의미합니다. (이는 연어가 다시 태어난 곳으로 돌아가는 것을 회귀라 말하는 것과 큰 범주에서 같은 의미라 보시면 되겠습니다.) 1. 선형회귀(Linear Regression)란? - 선형회귀는 머신러닝과 통계학에서 가장 기본적인 회귀분석 방법 중 하나로, 독립 변수와 종속 변수 간의 관계를 직선의 형태로 나타내는 것을 의미합니다. - 선형 회귀는 독립 변수가 1개인 경우를 단순선형회귀(Simple Linear Regression), 2개 이상인 경우를 다중선형회귀(Multiple)라고 부릅니다. - 이.. 2023. 9. 18. [머신러닝 with Python] Light GBM 실습 / 신용카드 사기 검출 데이터(Credit Card Fraud) 활용(2) 이번에는 지난 포스팅에 이어서 신용카드 사기 검출 데이터 (Credict Card Fraud Detection Data)를 Light GBM으로 분석해보겠습니다. [머신러닝 with Python] Light GBM 실습 / 신용카드 사기 검출 데이터(Credit Card Fraud) 활용 [머신러닝 with Python] Light GBM 실습 / 신용카드 사기 검출 데이터(Credit Card Fraud) 활용 이번 포스팅에서는 지난번에 알아봤던 Light GBM을 활용해서 실습을 진행해보겠습니다. 지난 포스팅에서는 작은 수의 데이터를 활용했기에 Light GBM의 성능향상을 크게 확인하지는 못했는데요. 이 jaylala.tistory.com 이번 포스팅에서는 지난 포스팅에서 말씀드렸던 것처럼, 1) .. 2023. 9. 17. 이전 1 ··· 20 21 22 23 24 25 26 다음 반응형