반응형 분류 전체보기167 [딥러닝 with Python] Mexican Hat Wavelet Transform을 활용한 시계열 데이터 처리 이번에는 시계열 데이터 분석에서, 잡음을 최소화 시키고 시계열상 특정 패턴을 극대화 시키는 Mexican Hat Wavelet Transform에 대해서 알아보겠습니다. 개념 정리 뿐만 아니라 파이썬 코드를 활용해서 예제 데이터에 대한 변환 및 결과 시각화 또한 진행해보겠습니다. 1. Mexican hat wavelet transform- Mexican Hat Wavelet(Ricker Wavelet이라고도 불립니다)은 Gaussian 함수의 2차 미분 형태로 정의된 wavelet 입니다. 이를 수식적으로 알아보면 아래와 같습니다. * 여기서 t는 시간 축을 뜻하고, sigma는 scale을 뜻하고 이 값을 조정하면 wavelet의 넓이와 진폭이 조절되게 됩니다.* sigma 값이 클수록 wavele.. 2024. 10. 24. [웹크롤링 with Python] 멜론차트 데이터 가져오기 이번 시간에는 간단한 코드 몇 줄만을 가지고 멜론차트 데이터를 가져오는 실습을 해보겠습니다. 실습은 재현성을 위해 코랩 무료버전에서 진행했으며, 이번 실습간에는 별다른 패키지 없이 코랩에 내장된 패키지들을 그대로 활용하기에 정말 쉽고 간단합니다. 1. 웹크롤링을 통해 멜론차트 데이터 가져오기 - 멜론차트와 같은 표(Table)의 형태로 되어있는 웹페이지를 발견하시면 아래와 같은 방법으로 쉽게 데이터를 크롤링 하실 수 있습니다. - 먼저, 데이터를 얻고 싶은 사이트를 들어가줍니다. 이번 실습간에는 멜론차트를 활용해보겠습니다. https://www.melon.com/chart/index.htm Melon음악이 필요한 순간, 멜론www.melon.com * 해당 페이지는 24년 10월 16일 13시를 기준.. 2024. 10. 23. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (4) (표 추출) 이번에는 지난 시간에 이어서 pdf에서 표를 추출하는 방법에 대해서 자세히 알아보겠습니다. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (3) (표 추출) 1. PDFPlumber로 표 추출하기- 이번에는 기존과는 좀 다른 데이터를 활용해보겠습니다. 기존에는 pdf에서 선으로 행과 열의 구분이 비교적 명확한 편이었다면 이번에는 선에 대한 표시가 잘 나와있지 않은 데이터를 활용해볼 건데요 - 해당 데이터는 san-jose-pd-firearm-sample 이라는 데이터입니다. https://github.com/jsvine/pdfplumber/blob/stable/examples/pdfs/san-jose-pd-firearm-sample.pdf pdfplumber/exam.. 2024. 10. 22. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (3) (표 추출) 이번에는 지난 시간에 이어서 pdf plumber를 활용해 표 내용을 추출하는 방법에 대해서 알아보겠습니다. 지난 시간에는 표 내용을 추출하는 기본적인 방법에 대해서 알아보았다면, 이번에는 병합된 셀 부분들로 인해 행 또는 열 간 구분이 잘 안되는 상황에 대해, 보다 세분화해서 표를 추출하는 방법에 대해서 알아보겠습니다. [업무자동화 with Python] PDF문서내용 추출(PDFPlumber 활용) (2) (표 추출) * 재현의 용이성을 위해 코드는 구글 코랩 무료버전에서 실행하였습니다. 1. PDFPlumber를 활용한 표 추출- 이번 실습간에 활용할 데이터는 background-checks 이며, 아래 링크에서 다운로드 받으실 수 있습니다.https://github.com/jsvine/pdf.. 2024. 10. 21. 이전 1 ··· 11 12 13 14 15 16 17 ··· 42 다음 반응형