반응형 전체 글165 [논문 리뷰] ShapeNet : A Shapelet-Neural Network Approach for Multivariate Time Series Classification (시계열 분류) [본 포스팅은 "ShapeNet : A Shapelet-Neural Network Approach for Multivariate Time Series Classification"(AAAI 2021 / Li et al.) 을 리뷰하였습니다] 이번에 알아볼 논문은 시계열 데이터 분류에서 활용되는 Shapelet을 효과적으로 추출하는 Neural Net을 제시하는 " ShapeNet : A Shapelet-Neural Network Approach for Multivariate Time Series Classification" 입니다. Shapelet은 시계열 분류에서 특정 클래스와 다른 클래스를 구분하는 특정 클래스의 부분 시계열이라고 보시면 되겠습니다.이에 대한 자세한 내용은 이전 포스팅을 참고바랍니다... 2024. 10. 26. [개념 정리] Shapelet이란? (시계열 분류) 이번에 알아볼 개념은 Shapelet 입니다. Shapelet은 시계열 분류(Time series Classification)에서 활용되는 부분 시계열을 의미합니다. 더 자세히는 어떤 의미인지 다음 내용들을 통해서 알아보겠습니다. 1. Shapelet이란? - Shapelet은 시계열 데이터의 분류(Time Series Classification)와 패턴 인식(Pattern recognition)에서 중요한 부분적인 패턴 또는 하위 sequence를 의미합니다. - 이는, 시계열 데이터에서 특정 클래스와 관련된 중요한 패턴을 찾아내고, 그 패턴이 나타나는 위치나 빈도를 바탕으로 분류 문제를 해결해나가는데 사용됩니다. - 시계열 분류의 의미에서 Shapelet을 해석해보자면, * Shapelet은 특정 클.. 2024. 10. 25. [딥러닝 with Python] Mexican Hat Wavelet Transform을 활용한 시계열 데이터 처리 이번에는 시계열 데이터 분석에서, 잡음을 최소화 시키고 시계열상 특정 패턴을 극대화 시키는 Mexican Hat Wavelet Transform에 대해서 알아보겠습니다. 개념 정리 뿐만 아니라 파이썬 코드를 활용해서 예제 데이터에 대한 변환 및 결과 시각화 또한 진행해보겠습니다. 1. Mexican hat wavelet transform- Mexican Hat Wavelet(Ricker Wavelet이라고도 불립니다)은 Gaussian 함수의 2차 미분 형태로 정의된 wavelet 입니다. 이를 수식적으로 알아보면 아래와 같습니다. * 여기서 t는 시간 축을 뜻하고, sigma는 scale을 뜻하고 이 값을 조정하면 wavelet의 넓이와 진폭이 조절되게 됩니다.* sigma 값이 클수록 wavele.. 2024. 10. 24. [웹크롤링 with Python] 멜론차트 데이터 가져오기 이번 시간에는 간단한 코드 몇 줄만을 가지고 멜론차트 데이터를 가져오는 실습을 해보겠습니다. 실습은 재현성을 위해 코랩 무료버전에서 진행했으며, 이번 실습간에는 별다른 패키지 없이 코랩에 내장된 패키지들을 그대로 활용하기에 정말 쉽고 간단합니다. 1. 웹크롤링을 통해 멜론차트 데이터 가져오기 - 멜론차트와 같은 표(Table)의 형태로 되어있는 웹페이지를 발견하시면 아래와 같은 방법으로 쉽게 데이터를 크롤링 하실 수 있습니다. - 먼저, 데이터를 얻고 싶은 사이트를 들어가줍니다. 이번 실습간에는 멜론차트를 활용해보겠습니다. https://www.melon.com/chart/index.htm Melon음악이 필요한 순간, 멜론www.melon.com * 해당 페이지는 24년 10월 16일 13시를 기준.. 2024. 10. 23. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (4) (표 추출) 이번에는 지난 시간에 이어서 pdf에서 표를 추출하는 방법에 대해서 자세히 알아보겠습니다. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (3) (표 추출) 1. PDFPlumber로 표 추출하기- 이번에는 기존과는 좀 다른 데이터를 활용해보겠습니다. 기존에는 pdf에서 선으로 행과 열의 구분이 비교적 명확한 편이었다면 이번에는 선에 대한 표시가 잘 나와있지 않은 데이터를 활용해볼 건데요 - 해당 데이터는 san-jose-pd-firearm-sample 이라는 데이터입니다. https://github.com/jsvine/pdfplumber/blob/stable/examples/pdfs/san-jose-pd-firearm-sample.pdf pdfplumber/exam.. 2024. 10. 22. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (3) (표 추출) 이번에는 지난 시간에 이어서 pdf plumber를 활용해 표 내용을 추출하는 방법에 대해서 알아보겠습니다. 지난 시간에는 표 내용을 추출하는 기본적인 방법에 대해서 알아보았다면, 이번에는 병합된 셀 부분들로 인해 행 또는 열 간 구분이 잘 안되는 상황에 대해, 보다 세분화해서 표를 추출하는 방법에 대해서 알아보겠습니다. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (2) (표 추출) * 재현의 용이성을 위해 코드는 구글 코랩 무료버전에서 실행하였습니다. 1. PDFPlumber를 활용한 표 추출- 이번 실습간에 활용할 데이터는 background-checks 이며, 아래 링크에서 다운로드 받으실 수 있습니다.https://github.com/jsvine/pdf.. 2024. 10. 21. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (2) (표 추출) 지난 시간에는 PDFPlumber를 활용해서 pdf 파일 내의 이미지에 대해서 추출해보았는데요. 이번에는 pdf파일내의 표(Table)을 추출해보도록 하겠습니다 PDFPlumber에 대한 전반적인 내용은 지난 포스팅을 참조해주시면 되겠습니다.[업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (1) **아래 작성되는 코드는 결과의 재현성을 위해 구글 코랩 무료버전을 활용해서 작성했습니다.** 1. PDFPlumber를 활용한 표(Table) 추출 - 먼저, 실습에 활용할 데이터를 다운로드 받아주겠습니다. * 이번에 활용할 데이터는 PDFPlumber에서 예재로 제공하는 ca-warn-report 로 아래 그림과 같습니다.* 해당 pdf 파일은 여러 page로 구성되.. 2024. 10. 20. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (1) (그림 추출) 업무간, PDF로 보내온 대량의 문서의 내용을 정리해야할 때 많은 스트레스를 받아본 경험이 있으실 겁니다. 저는 이러한 상황에서, 웹사이트에서 제공해주는 무료 PDF to excel 변환기나, ChatGPT등 생성형 AI로 이를 처리하려고 했을때 내가 원하는 형태의 정보로 가공되지 않았던 경험이 종종 있었는데요. 그래서 위와 같은 사이트들의 근간이 되는 알고리즘에 대해서 확인해보자는 마음으로 PDF 문서내용을 추출하는 Python library에 대해서 알아보았습니다. 이번에 활용할 Library는 PDFPlumber입니다. https://github.com/jsvine/pdfplumber GitHub - jsvine/pdfplumber: Plumb a PDF for detailed information.. 2024. 10. 19. 이전 1 ··· 4 5 6 7 8 9 10 ··· 21 다음 반응형