본문 바로가기
반응형

분류 전체보기165

[머신러닝 with Python] 불균형 데이터 처리(1) : Credit Card Fraud Detection Data에 대해 EDA 이번에는 불균형 데이터 처리에 대표적으로 사용되는 데이터 셋인 Credit Card Fraud Detection Data에 대해서 알아보겠습니다. 1. Credit Card Fraud Detection- 해당 데이터셋은 유럽의 신용카드 소지자들이 2013년 9월 동안 사용한 거래 데이터를 포함하고 있으며, 신용카드 사기 탐지를 위한 머신러닝 모델 학습에 적합하게 설계되어 있는 데이터 입니다. - 데이터 정보 요약 * 기간 : 2일 동안 발생한 거래 데이터 * 사기 거래 건수 : 492건 (전체 284,807건 중 약 0.172%) * 데이터 불균형 : 사기 거래 비율이 0.172%에 불과해 데이터의 클래스가 매우 불균형한 분류 문제를 해결해야 합니다. * 평가지표 : 클래스의 불균형성으로 인해 단순한 A.. 2024. 11. 20.
[딥러닝 with Python] Self Supervised Learning(SSL) (6) : Sequential Structure 활용 이번에는 Sequential Structure를 활용해서 Self Supervised Learning을 하는 3가지 모델에 대해서 알아보겠습니다. - CPC (Contrastive Predictive Coding)- VINCE(View Invariant Contrastive Learning for Visual Representations)- FlowE 1. Sequential Structure를 활용하는 SSL 모델 1) CPC (Contrastive Predictive Coding) - CPC는 데이터의 미래 정보를 예측하는 방식으로 SSL을 하는 모델입니다.- 이는 미래정보를 예측하는 방식을 통해 유용한 Feature를 추출하며, Negative와 Positive Samples를 모두 활용합니다.- .. 2024. 11. 19.
[딥러닝 with Python] Self Supervised Learning (SSL) (5) : Invariance 활용 이번에는 SSL에서 Invariance를 활용하는 모델들 중  Different Modality를 활용하는 모델들에 대해서 알아보겠습니다. 알아볼 모델은  - CMC(Contrastive Multiview Coding / Matching view와 Unmatching view라는 다른 modality)- CLIP(Contrastive Language-Image Pretraining / Language 와 Image라는 다른 modality) 입니다. 1. CMC(Contrastive Multiview Coding)- CMC는 다양한 시각 정보를 제공하는 멀티뷰 데이터를 Contrastive Learning으로 학습하는 모델입니다. - 해당 모델은 서로 다른 뷰가 동일한 객체를 나타내고 있다는 사실을 학습.. 2024. 11. 18.
[딥러닝 with Python] Self Supervised Learning(SSL) (4) : Invariance 활용 이번에는 지난 시간에 이이서 SSL 간 Invariance를 활용하는 모델들에 대해서 알아보겠습니다. 오늘 알아볼 모델은 BYOL(Bootstrap Your Own Latent)와 DINO입니다. 1. BYOL(Bootstrap Your Own Latent)- BYOL은 Online 네트워크와 Target 네트워크 구성되어 Contrastive Learning을 하는 방식입니다.- 기존의 다른 Contrastive Learning과는 다르게 Negative sample이 필요하진 않습니다. - 작동 방식은 * 두 네트워크에 서로 다른 증강된 데이터를 입력하고 * Online 네트워크의 출력과 Target 네트워크의 출력을 비교하면서 학습을 하며 * 이때 Target 네트워크는 학습이 되지는 않고, 대신 .. 2024. 11. 17.
반응형