반응형 머신러닝 with Python38 [머신러닝 with 파이썬] 군집화(클러스터링) : K-means & HDBSCAN / 시각화 이번에는 클러스터링의 대표 알고리즘 중 하나인 K-means Clustering과 HDBSCAN에 대해 간략히 알아보겠습니다. 시각화를 기반으로 차이를 설명하겠으며, 각 모델별 자세한 내용들은 다음 포스팅에서 다뤄보겠습니다. 1. 군집화(Clustering, 클러스터링) 이란? - 클러스터링은 비슷한 특성을 가진 데이터들을 그룹화하는데 쓰이는 데이터 분석 방법입니다. - 데이터의 특성만을 기준으로 분류하기에, 비지도 학습(Unsupervised Learning)의 한 형태라 할 수 있습니다. * 비지도 학습(Unsupervised Learning) : 레이블(혹은 정답)이 지정되지 않은 데이터에서 유용한 정보를 추출하는데 사용되는 학습방법 * 비지도학습이라는 점에서 분류(Classification)과 큰.. 2023. 9. 27. [머신러닝 with 파이썬] PCA / 주성분 분석 / 차원축소 /iris 데이터 활용 이번에 알아볼 것은 차원축소 알고리즘의 대표적인 PCA(주성분 분석)에 대해서 알아보겠습니다. Tabular type의 데이터에서 차원을 축소한다는 것은 곧, 변수의 개수(또는 피처의 개수)를 줄인다는 것을 의미하는데요. 너무 많은 피처들이 있을때 이들을 줄이는 것은 어떤 의미이며, 왜 해야되는지 등등에 대해서 PCA를 통해 알아보겠습니다. 1. PCA란- PCA는 Principal Component Analysis의 약자로 주성분 분석으로 불립니다. - 이는 다차원의 데이터에서 차원을 줄이고 주요 정보를 추출하기 위한 통계적인 방법인데요 * 이때 차원은, 피처(feature) 혹은 변수(variable)의 숫자를 의미합니다. * 차원이 높다는 것은 피처 혹은 변수가 많다는 것을 의미하며, 이는 .. 2023. 9. 26. [딥러닝 with 파이썬] GAN (Generative Adversarial Networks) / 생성적 적대 신경망 / MNIST 데이터로 구현 이번에는 GAN, 생성적 적대 신경망에 대해서 알아보겠습니다. 1. GAN이란? - GAN은 Generative Adversarial Network의 약자로, 생성적 적대 신경망으로 불립니다. - 이는 딥러닝을 기반으로 한 모델로서, 이름에서 알 수 있듯이 생성, 즉 기존에 없던 것을 만들어내는 모델입니다. - GAN의 핵심 아이디어 * GAN의 핵심 아이디어는 생성자(Generator)와 구분자(Discriminator)라는 모델을 만들어 서로 경쟁시키는 것입니다. * 생성기는 더 실제와 유사한 데이터를 생성하려고 노력하고, 구분자는 생성기가 생성한 데이터와 실제 데ㅣ터를 구분하려고 노력하는 것입니다. 이러한 경쟁을 통해 생성기는 점차 더 정교한 데이터를 생성하게 되며, 결과적으로 생성된 데이터는 실제.. 2023. 9. 25. [머신러닝 with 파이썬] Pycaret이란? Pycaret을 활용한 머신러닝 이번에 알아볼 것은 pycaret이라는 라이브러리 입니다. 이 라이브러린는 분석하고자하는 데이터에 대해 머신러닝 기법들을 하나씩 적용해서 비교하는 수고를 덜어버릴 수 있는 유용한 라이브러리 입니다. 이를 통해 더 빠르고 효율적으로 데이터를 분석하고 예측할 수 있습니다. 1. Pycaret이란? - Pycaret이란, Python 기반의 오픈 소스 머신러닝라이브러리 중 하나로, 머신 러닝 모델을 쉽게 구축하고 비교하며, 모델을 최적화하고 평가하는데 도움을 주는 도구입니다. - 이를 활용해서, 데이터 과학자는 최소한의 코드 작성으로 다양한 머신러닝 모델을 탐색하고 최적화해볼 수 있습니다. - Pycaret을 활용해서 머신러닝을 통해 구현되는 a) 분류, b) 회귀, c) 클러스터링, d) 이상치 탐지 등 다.. 2023. 9. 24. 이전 1 2 3 4 5 6 7 8 ··· 10 다음 반응형