본문 바로가기
반응형

전체 글107

[머신러닝 with Python] 결정 트리(Decision Tree) (2/2) / 과적합(Over-fitting) 이번에는 1) 결정트리(Decision Tree)의 과적합(Overfitting) 무제에 대해 2차원 데이터의 시각화를 통해 알아보겠으며, 2) 이러한 과적합(Overfitting)문제의 해결방안에 대해서 알아보겠습니다. 1. 결정트리(Decision Tree)의 과적합(Overfitting) 문제 (Python 활용) 결정트리(Decision Tree)는 직관적인 설명력을 제공해주는 효과적인 분류(회귀도 가능) 모형이지만, 과적합(Overfitting)이라는 문제 또한 가지고 있습니다. - 과적합(Overfitting)이란, 기계 학습 모델이 훈련 데이터에 너무 맞춰져서, 훈련 데이터에 대한 예측 성능은 높지만 새로운 데이터나 테스트 데이터에 대한 성능이 낮아지는 현상을 의미합니다. - 이는 모델이 훈.. 2023. 9. 8.
[머신러닝 with Python] 결정 트리(Decision Tree) (1/2) / 결정트리 시각화(Graphviz 활용) / 붓꽃(iris) 데이터 이번에 알아볼 것은 분류(Classification) 모델의 대표격인 결정트리 / 결정나무 (Decision Tree) 입니다. 1. 결정트리 / 결정나무(Decision Tree)란? - 결정트리(Decision Tree)는 머신러닝 알고리즘 중 직관적으로 이해하기 쉬운 알고리즘의 대표격입니다. - 분류(Classification) 모델의 대표격이지만, 회귀(Regression) 모델로도 활용할 수 있습니다. - 해당 모델은 스무고개와 같은 if/else 기반의 룰을 연계하여 데이터를 분류 (또는 회귀)를 합니다. - 결정트리(Decision Tree)의 주요 특징은 아래와 같습니다. 1) 계층적 구조: 결정 나무는 계층적으로 구성된 트리 모양의 구조를 가지며, 맨 위에는 "루트 노드"가 있고, 이후에.. 2023. 9. 7.
[머신러닝 with Python] 오차행렬 or 혼동행렬(Confusion Matrix) / 유방암 데이터(Breast Cancer Data) 활용하여 알아보기 이번에 알아볼 것은 지난 시간에 알아본 정확도 및 기타 분류평가지표를 도출할 수 있는 오차행렬 또는 혼동행렬이라 불리는 Confusion Matrix에 대해서 알아보겠습니다. 1. 오차행렬 / 혼동행렬 (Confusion Matrix) 이란? - Confusion Matrix(오차 행렬)은 분류 모델의 성능을 평가하기 위한 표입니다. - 주로 이진 분류(두 가지 클래스로 분류) 문제를 다룰 때 사용되지만, 다중 분류에서도 그 분류 결과를 한눈에 정리해주는 용도로 사용됩니다. - 이는, 모델이 예측한 결과와 실제 관측된 결과를 비교하는 데에 사용되며 아래 네 가지 주요 항목으로 구성됩니다. 1) True Positive(TP) : 예측값을 Positive로 예측했는데 실제 값 역시 Positive인 경우 .. 2023. 9. 5.
[머신러닝 with Python] 정확도(Accuracy)란? / 유방암(Breast Cancer) 데이터 사용 이번에 알아볼 것은 머신러닝의 분류(Classification) 문제 중 정확도(Accuracy)에 관한 것입니다. 1. 정확도(Accuracy)란? 정확도(Accuracy)란, 분류 모델의 성능을 평가하는 지표 중 하나로, 전체 예측 중 올바르게 분류된 비율을 나타냅니다. 이를 식으로 표현하면 아래와 같은데요. 즉, 정확도는 모델이 얼마나 많은 샘플을 올바르게 분류하는지를 측정하는 지표를 말합니다. 정확도의 값은 0에서 1사이의 범위를 가지며, 1에 가까울수록 올바르게 분류된 샘플의 수가 많다는 것을 의미합니다. 예를 들어, 정확도가 0.85라면 모델이 전체 데이터 중 85%를 올바르게 분류했다는 의미입니다. 2. 파이썬 코딩으로 알아보는 정확도의 의미 (유방암(Breast Cancer) 데이터 사용).. 2023. 9. 4.
Comparison 3 ETFs : SPY, SCHD and JEPI Exchange-traded funds (ETFs) are a popular investment option for many investors, offering a convenient and cost-effective way to gain exposure to various markets and asset classes. When considering which ETF to invest in, it is important to compare different ETFs based on several key criteria, such as expense ratio, asset class, tracking error, liquidity, and performance, among others. In this b.. 2023. 2. 4.
나스닥(NASDAQ) 100 ETF, QQQ에 대해서 알아보기 나스닥(NASDAQ) 100 ETF인, QQQ에 대해서 알아보겠습니다. 미국 내 산업별 탑 기업들을 모아놓은 지수인 NASDAQ 100을 담은 상품인 QQQ는 미국 기업들의 성장성에 초점을 맞춘 상품인데요. 나스닥 100이라는 지수를 통해 미국의 산업 성장성을 보다 보니 해당 ETF 이러한 특성을 바탕으로 성과를 추종하는 상품입니다. 해당 상품의 파생 상품인 SQQQ와 TQQQ도 인기가 정말 많은 상품인데요. 최근 성장주들의 반등세가 나타나면서 나스닥 100의 지수는 신고가를 경신하였는데요. 나스닥 100을 담은 ETF인 QQQ는 어떠한 특징을 가지고 있는지 알아보겠습니다. 1.QQQ란? QQQ란? QQQ의 Full name은 Invesco QQQ Trust입니다. QQQ는 나스닥 상장 주식 중 100개.. 2021. 6. 27.
S&P500 ETF, VOO에 대해서 알아보기 1.VOO란? VOO란? VOO의 Full name은 Vanguard S&P500 ETF입니다. 이 VOO는 S&P 위원회(Committee)가 선택한 미국 대형주 및 중형주들 총 500개를 시가 총액 가중치를 적용하여 만든 포트폴리오의 지수의 성과를 추종하는 ETF입니다. VOO는 S&P500의 지수를 거의 동일하게 추종하나, 여타 SPY나 IVV처럼 S&P500과의 일부에서 차이가 발생하는 포트폴리오 구성을 가지고 있습니다. 해당 포트폴리오 내의 주식 구성이 시가 총액을 추종하기에 균형 있고 광범위하게 미국 시장 내의 중/대형주들에 대한 노출을 제공하고 있습니다. 발행기관은 Vanguard입니다. MSCI ESG 평가등급은 BBB로, 10점 만점 중 5.65점을 받았습니다. 발행일 : 10년 9월 7.. 2021. 6. 22.
알셋 이홈(Alset Ehome INTERNATIONAL INC/ 티커 : AEI) 주가 상승 원인에 대해서 알아보기 알셋 이홈(Alset Ehome International INC)이란? 1) 알셋 이홈(Alset Ehome/티커:AEI) Alset EHome Inc. 는 주로 미국에서 주거용 부동산을 개발, 판매, 관리 및 임대하고 있으며, 주거용 부동산에서 다른 부동산 유형으로 확장할 수 있는 사업 모델을 가지고 있습니다. 현재 주력 개발 사업은 총 두 개이며, a) 텍사스 주 매그놀리아에 위치한 Black Oak의 Alset과 b) 미국 메릴랜드 주 Frederick 카운티에 위치한 Ballenger Run입니다. 2) 알셋 이홈 인터내셔널(Alset EHome International)은 주로 미국, 싱가포르, 홍콩, 호주 및 한국에서 운영되는 EHome 개발 및 디지털 전환 기술에 자회사를 통해 참여하는 다각.. 2021. 6. 22.
반응형