본문 바로가기

728x90

ML

(1)

강화학습 1 강화학습이란?"순차적 의사결정 문제 에서 누적 보상을 최대화 하기 위해 시행착오를 통해 행동을 교정하는 학습 과정"쉽게 말해, "시행착오를 통해 발전해 나가는 과정"그림 1 과 같이 머신러닝의 한 부류로 비지도 및 지도 머신러닝과 다르게 정적 데이터셋에 의존하는 것이 아니라 역동적인 환경에서 동작하며 수집된 경험으로 부터 학습한다.대표사진 삭제사진 설명을 입력하세요.강화학습이란?쉽지만 추상적인 버전 “시행착오(train and error)를 통해 발전해 나가는 과정어렵지만 좀더 명확한 버전 “순차적 의사결정 문제에서 누적 보상을 최대화 하기 위해 시행착오를 통해 행동을 교정하는 학습과정”순차적 의사결정 문제에이전트가 시간 순서대로 행동을 선택하고 환경으로부터 피드백을 받아 학습하는 문제결과에서 얻은 보상..

이전 1 다음

728x90

티스토리툴바