본문 바로가기
반응형

분류 전체보기165

[딥러닝 with Python] GraphSAGE를 활용한 논문 분류(Node Classification) 이번에는 지난번에 알아본 GNN 중 GraphSAGE 방법을 활용해서 노드 분류(Node Classification)을 진행해보겠습니다. 실습에 활용할 데이터는 Cora 입니다. 1. Cora Dataset 설명 Cora 데이터셋은 그래프 데이터 분석에서 널리 사용되는 표준 데이터 중 하나입니다. 특히, 논문 간의 인용 관계를 나타내는 정보와 함께 그래프 신경망(GNN)을 학습하고 평가하는데 자주 사용됩니다. Cora 데이터셋의 구성은 아래와 같습니다. 1) 노드 : Cora 데이터셋에서의 각 노드는 개별 논문을 의미합니다. 2) 엣지 : 노드 간의 엣지는 논문 간의 인용 관계를 나타냅니다. 예를 들어, 논문 A가 논문 B를 인용했다면 A와 B 사이에 엣지가 존재합니다. 3) 노드 특징(Node Feat.. 2024. 12. 9.
[업무자동화 with Python] PDF Plumber로 PDF 표 추출하기 (실습) 이번에는 실제 자료를 바탕으로 PDF Plumber의 활용성을 알아보겠습니다. 1. 실습 간 활용할 데이터 : 24년 네이버 반기 보고서 이번에 사용할 자료는 네이버의 2024년 반기 사업보고서 입니다.  https://kind.krx.co.kr/common/disclsviewer.do?method=search&acptno=20240318001166 [NAVER] 사업보고서(일반법인)본 문서는 최종문서가 아니므로, 최종 정정문서를 반드시 확인하시기 바랍니다.kind.krx.co.kr 공개된 자료입니다. 위 데이터는 총 442페이지이며 수백개의 표로 구성되어있는 자료 입니다.   2. PDF Plumber를 통해서 표 추출하기  표 추출을 위해서 코랩에서 PDF Plumber를 활용해 보았습니다. [업무자.. 2024. 12. 8.
[딥러닝 with Python] LangGraph란? 1. LangGraph란? LangGraph는 자연어 처리(NLP)와 인공지능(AI) 응용 프로그램 개발을 위한 프레임워크로, 복잡한 언어 모델과 상호작용하면서 데이터를 효율적으로 처리하고 활용할 수 있는 시스템을 제공하고 있습니다. https://www.langchain.com/langgraph LangGraphDeploy your LLM app instantly with LangServe.www.langchain.com Lang Graph의 주요 특징은 아래와 같습니다. 1) 복잡한 언어 모델 통합 - GPT, BERT와 같은 대규모 언어 모델과 손쉽게 통합하여, 언어 모델의 강력한 기능을 활용하 수 있도록 지원 - 여러 모델 간의 상호작용을 효율적으로 관리하여, 응답 생성 및 데이터 분석 2) 다양.. 2024. 12. 7.
[딥러닝 with Python] LSTM을 활용한 회귀 분석 이번 포스팅은 지난번에 알아본 LSTM의 개념을 바탕으로 실습을 해보는 내용입니다. 1. LSTM을 활용한 회귀 분석- LSTM은 RNN의 한 종류로, 시계열 데이터 분석에 효과적인 구조를 가지고 있습니다. LSTM은 시간 의존성이 긴 데이터에서도 중요한 패턴을 학습할 수 있도록 설계되었으며, 회귀 분석에서는 연속적인 값 예측, 주가 분석, 온도 예측 등 다양한 연속형 데이터 문제에 활용될 수 있습니다. - LSTM을 시계열 데이터의 회귀 분석에 활용 시 다음과 같은 장점들이 있습니다. 1) 시간 의존성 학습 : 시계열 데이터에서 이전 시점의 정보를 사용해 현재 시점의 결과를 예측할 수 있습니다. 2) 장기 의존성 해결 : LSTM의 게이트 구조(입력, 망각, 출력 게이트)는 RNN의 단점인 장기 의존성.. 2024. 12. 3.
반응형