본문 바로가기
반응형

머신러닝 with Python25

[머신러닝 with Python] 상점 신용카드 매출 예측 (DACON 문제) (2/2) [머신러닝 with Python] 상점 신용카드 매출 예측 (DACON 문제) (1/2)  지난번 포스팅에 이어지는 내용입니다. 이번에는 상점별 매출 특성을 분석해보겠습니다.  제공된 데이터에는 총 1,967개의 상점이 있으며, 시계열 그래프를 통해 데이터에 있는 상점들이 어떤 특성을 가지는지 파악해보겠습니다. 상점의 특징을 계절성이 있는 상점, 추세가 있는 상점, 휴업중인 상점  이렇게 3가지로 분류했습니다. 1) 계절성이 있는 상점 예측할 시기는 봄이고, 1학기, 상반기, 축제 등 다양한 계절성을 가지고 있습니다. 먼저 시각화를 통해 변환된 데이터를 출력해봅니다. # 상점 아이디가 257번인 데이터를 시리즈 객체로 데이터 출력store_257 = time_series(resampling_data, 2.. 2024. 6. 11.
[머신러닝 with Python] 상점 신용카드 매출 예측 (DACON 문제) (1/2) 이번에는 DACON에서 진행되었던 "상점 신용카드 매출 예측" 문제를 해결해가며, 머신러닝 기법을 익혀보도록 하겠습니다.  1. 문제 소개- 해당 대회는 2019년 7월 11일부터 10월 21일까지 이어진 대회입니다. - 해당 대회는 2016년 6월 1일부터 2019년 2월 28일까지의 카드 거래 데이터를 이용해 2019년 3월 1일부터 5월 31일까지의 각 상점별 3개월의 총 매출을 예측하는 문제입니다. * 이때 중요한 것은 3,4,5월이라는 것이며, 새 학기, 새 출발을 의미하는 월들이기에 여러 변수가 발생하고 황사 등 봄철 날씨의 영향을 받을 수 있으며, 가정의 달인 5월이 포함되어 있다는 것도 중요한 변수입니다.  - 문제 유형은 시계열 회귀분석이며, 평가 척도는 MAE(Mean Absolute .. 2024. 6. 10.
[Machine Learning] What is machine learning? What is ML? 1. What is machine learning 1) Machine Learning : Finding Regularity in massive datasets 2) Regularities : Knowledge forms (rules, decision trees) - Machine Learning usually uses inductive knowledge to make predictions. - The procedure of ML : Data -> Finding regularity -> Representation as diverse forms -> Prediction 3) Machine Learning (Compared to traditional programming) - ML : Input -> ML -.. 2024. 3. 6.
[머신러닝 with 파이썬] 군집화(클러스터링) : K-means & HDBSCAN / 시각화 이번에는 클러스터링의 대표 알고리즘 중 하나인 K-means Clustering과 HDBSCAN에 대해 간략히 알아보겠습니다. 시각화를 기반으로 차이를 설명하겠으며, 각 모델별 자세한 내용들은 다음 포스팅에서 다뤄보겠습니다. 1. 군집화(Clustering, 클러스터링) 이란? - 클러스터링은 비슷한 특성을 가진 데이터들을 그룹화하는데 쓰이는 데이터 분석 방법입니다. - 데이터의 특성만을 기준으로 분류하기에, 비지도 학습(Unsupervised Learning)의 한 형태라 할 수 있습니다. * 비지도 학습(Unsupervised Learning) : 레이블(혹은 정답)이 지정되지 않은 데이터에서 유용한 정보를 추출하는데 사용되는 학습방법 * 비지도학습이라는 점에서 분류(Classification)과 큰.. 2023. 9. 27.
반응형