본문 바로가기
반응형

분류 전체보기165

[머신러닝 with Python] Kernel PCA란? 이번에 알아볼 내용은 PCA의 변형 형태인 Kernel PCA입니다. 기존 PCA 관련 내용은 아래 포스팅을 참조해서 보고 오시면 좋으실 것 같습니다. [머신러닝 with 파이썬] PCA / 주성분 분석 / 차원축소 /iris 데이터 활용 [머신러닝 with 파이썬] PCA / 주성분 분석 / 차원축소 /iris 데이터 활용이번에 알아볼 것은 차원축소 알고리즘의 대표적인 PCA(주성분 분석)에 대해서 알아보겠습니다. Tabular type의 데이터에서 차원을 축소한다는 것은 곧, 변수의 개수(또는 피처의 개수)를 줄인다는jaylala.tistory.com 1. Kernel PCA- Kernel pCA란, 비선형 데이터의 주요 구성요소를 찾기 위해 커널 트릭을 사용하는 PCA의 확장 버전입니다. - 일반적.. 2024. 11. 24.
[머신러닝 with Python] 불균형 데이터 처리(3) : TomekLink활용 이번에는 지난번 포스팅에 이어서 불균형 데이터 처리에 대해서 알아보도록 하겠습니다. [머신러닝 with Python] 불균형 데이터 처리(2) : 불균형 클래스 분류 문제 평가지표 이번에 알아볼 것은 TomekLink라는 기법입니다. 1. Tomek Link란?- Tomke Link는 데이터셋의 클래스 불균형을 줄이기 위해 언더샘플링을 하는 방식 중 하나로, 주로 이진 분류(Binary Classification)에서 사용됩니다. - 이는, 이상치나 경계에 위치한 샘플을 제거하여 두 클래스 간의 경계를 더 명확하게 만드는 것인데요 * 두 데이터 포인트 사이의 가까운 쌍을 기반으로 작동하며, 만약 두 포인트 A, B가 서로 다른 클래스에 속하고, 다른 데이터 포인트들보다 서로 더 가까운 경우, 이 두 포인.. 2024. 11. 23.
[딥러닝 with Python] Anomaly Detection이란? (이상 탐지) 1. Anomaly Detection이란?1) Anomaly Detection의 정의   - Anomaly Detection은 인공지능을 사용해 특정 시스템이나 데이터에서 예상되는 정상적인 패턴이나 규범에서 크게 벗어나는 데이터를 식별하는 기술을 말합니다. - 이러한 이상탐지는 주어진 시스템의 "정상" 행동이 무엇인지 학습한 후, 이와 맞지 않는 데이터 포인트나 행동을 이상으로 판단하여 경고를 하는 것을 말합니다. 2) Anomaly Detection의 필요성 - 보안 위협, 시스템 오류, 또는 사기 탐지와 같이 중요한 응용 분야에서 널리 사용되며, 예를 들어 금융 기관에서는 이상탐지를 통해 사기 거래를 조기에 식별하고, 제조업에서는 장비의 이상 여부를 조기에 감지하여 유지보수를 진행합니다. 3) Ano.. 2024. 11. 22.
[머신러닝 with Python] 불균형 데이터 처리(2) : 불균형 클래스 분류 문제 평가지표 이번에는 지난 시간에 알아본 "Credit Card Fraud Detection" 데이터를 활용해서 불균형 클래스 분류 문제에서 활용되는 평가지표 들에 대해서 알아보겠습니다.[머신러닝 with Python] 불균형 데이터 처리(1) : Credit Card Fraud Detection Data에 대해 EDA 1. 불균형 클래스 분류 문제에 활용되는 평가지표들- 불균형 클래스 문제에서는 단순한 Accuracy는 신뢰할 수 없는 평가지표가 됩니다. 지난 시간에 알아봤던 Credit Card Fraude Detection 데이터에서도 사기 탐지 거래 비율이 겨우 0.172% 밖에 안되기에 아무런 로직없이 단지 "정상" 이라고 내뱉는 Dummy Classifier를 만들어도 Accuracy는 99.8%가 넘게 .. 2024. 11. 21.
반응형