반응형 머신러닝 with Python38 [머신러닝 with Python] TPOT을 활용한 Iris 데이터 분류(AutoML) 이번에는 지난번에 알아본 여러 AutoML 라이브러리 중 TPOT을 활용해 Iris 데이터에 대한 분류를 진행해보고자 합니다. 1. TPOT이란?- TPOT은 자동화된 머신러닝, 즉 AutoML의 도구로, 데이터를 전처리하고 최적의 머신러닝 모델과 하이퍼파라미터를 튜닝할 수 있는 라이브러리입니다. - 자세한 내용은 아래 포스팅을 참조하시면 되겠습니다.[머신러닝 with Python] AutoML이란? (AutoML의 정의, 종류 등) [머신러닝 with Python] AutoML이란? (AutoML의 정의, 종류 등)AutoML은 머신러닝 모델 개발 과정을 자동화하여 효율성을 극대화하는 도구입니다. 모델 선택, 하이퍼파라미터 튜닝, 데이터 전처리 등을 자동으로 처리하기에 머신러닝의 진입 장벽을 낮추어주j.. 2024. 12. 11. [머신러닝 with Python] 유전 알고리즘이란? TPOT에서 최적화 활용(AutoML) 1. 유전 알고리즘이란?(Genetic Algorithm, GA)- 유전 알고리즘(GA)은 진화론의 자연 선택원리에서 영감을 얻은 최적화 기법으로, 주어진 문제의 최적 해를 탐색할때 활용됩니다.- 이 알고리즘은 생물학적 진화 과정인 유전자 선택, 교차, 변이를 모방하여 작동하며, 복잡한 문제를 해결할 때, 전통적인 방법 대신 유전 알고리즘을 활용 시 효율적으로 최적화를 수행할 수 있습니다. - 이와 같은 유전 알고리즘을 통해 TPOT에서는 최적 파이프라인 및 하이퍼 파라미터 튜닝을 하고 있는데요[머신러닝 with Python] TPOT을 활용한 Iris 데이터 분류(AutoML) - 유전 알고리즘의 핵심 개념을 TPOT 알고리즘에서 적용되는 내용과 함께 알아보도록 하겠습니다.1) 개체(Populati.. 2024. 12. 11. [머신러닝 with Python] AutoML이란? (AutoML의 정의, 종류 등) AutoML은 머신러닝 모델 개발 과정을 자동화하여 효율성을 극대화하는 도구입니다. 모델 선택, 하이퍼파라미터 튜닝, 데이터 전처리 등을 자동으로 처리하기에 머신러닝의 진입 장벽을 낮추어주며, 전문가들에게도 반복적인 작업을 줄여주기에 업무 효율성을 높여주는데요 1. AutoML이란- AutoML은 머신러닝의 반복적이고 복잡한 작업을 자동화하여 모델 개발 시간을 줄이고, 성능을 최적화하는 기술을 말합니다.- AutoML 도구를 사용하면 아래와 같은 작업들이 자동으로 이루어지게 됩니다. a) 모델 선택 : 데이터에 적합한 알고리즘 탐색 b) 하이퍼파라미터 튜닝 : 성능 향상을 위한 최적의 매개변수 조합 탐색 c) 데이터 전처리 : 결측치 처리, feature selection, scaling 등 d) 성.. 2024. 12. 10. [머신러닝 with Python] LDA란?(Latent Dirichlet Allocation란?) / 토픽 모델링을 위한 기법 이번에는 자연어처리(NLP)에서 토픽 모델링 방법 중 하나인 LDA에 대해서 알아보도록 하겠습니다. 1. LDA란? (Latent Dirichlet Allocation이란?)- LDA란 Latenet Dirichlet Allocation의 약자로, 문서 집합에서 숨겨진 주제(Latent Topic)을 찾아내는데 사용되는 토픽 모델링(Topic Modeling) 기법을 말합니다. - 이는 문서 내 단어들이 특정 주제에 속해있으며, 문서들이 여러 주제를 혼합한 형태로 구성된다는 확률적 가정에 기반하고 있습니다.- 이러한 LDA는 검색엔진 최적화(SEO), 콘텐츠 분석, 추천 시스템, 그리고 문서 요약과 같은 분야에서 널리 활용되고 있는 방법입니다. - LDA에 핵심 메커니즘은 아래와 같이 요약해볼 수 있습.. 2024. 12. 2. 이전 1 2 3 4 ··· 10 다음 반응형