본문 바로가기

deepseek1

[딥러닝 with Python] 논문 리뷰 : DeepSeek-R1 이번에 알아볼 논문은 25년 1월 22일 따끈따끈하게 나와서 큰 파장을 주고 있는 "DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning" 이라는 논문이 되겠습니다. 1. DeepSeek-R1 : 들어가기 전 "DeepSeek-R1"은 강화 학습(Reinforcement Learning, RL)을 통해 대형 언어 모델(LLM)의 추론 능력을 향상시키는 방법론을 제안하고 있습니다. 이 논문은 LLM의 reasoning(추론) 능력을 개선하는 데 있어 RL의 강력한 잠재력을 보여주었습니다. 본격적으로 논문 리뷰를 하기 전에 기존에 LLM을 학습하는 방식인 Self-Supervised Learning 기반 방법과.. 2025. 1. 28.

이전 1 다음

티스토리툴바