2016-06-18 8 views
-3

심층 q- 학습이란 무엇입니까? 그것은 깊은 보강 학습과 동일합니까? 깊은 신경 네트워크는 어떻게 발생합니까? 깊이있는 q- 학습을 할 수있는 심층 신경 회로망에 무엇이 추가되어야 하는가?심층 q- 학습이란 무엇입니까?

누군가 깊은 Q 학습을위한 자습서를 보낼 수 있습니까? 나는 단지 그것을 위해 현재 사용되고있는 알고리즘을 배우고 싶다.

감사합니다.

+0

SOF에서 "좋은"질문을 구성하는 요소를 읽으십시오. – javadba

+0

내가 한 일 주제에 대해 구체적이고 구체적으로 말하고 다른 사람과 관련성이 있다고 말합니다. 주제 : 심층 q- 학습 구체적 : 깊은 q- 학습에 대해 배우고 싶은 내용을 말씀드립니다. 다른 사람들과 관련성이 있습니다. 신경 네트워크는 깊고 q-learning이 무엇인지 알고 싶어 할지를 배우고 싶어합니다. 내 질문에 무엇이 잘못 되었나요? – Soham

+1

"책, 도구, 소프트웨어 라이브러리, 자습서 또는 기타 오프 사이트 리소스를 추천하거나 찾도록 요청하는 질문이 스택 오버플로에 대해 논쟁의 여지가 있으므로 의견이 분분하기 때문에"오프 토픽 "으로 마감하도록 투표를 마감했습니다. 답변 및 스팸 대신 문제를 설명하고 지금까지 해결 된 문제를 설명하십시오. " 귀하의 경우에는 q- 학습에 대한 자습서를 의미합니다. btw 나는 downvote하지 않았다 - 주로 ur가 단지 여기에서 시작하기 때문에 1 차적으로. 그러나 그렇게하는 것이 정당화 될 수 있습니다. – javadba

답변

3

기본 Q- 학습자가 선형 신경망 또는 선형 신경망 대신 깊은 신경망 인 Q- 학습 = Q- 학습. base-estimator는 Q-function의 메모리로 사용됩니다 (state-action 쌍을 어떤 값으로 맵핑합니다; 대부분의 어플리케이션에서 테이블이 너무 커집니다). 신경망은 일반적인 함수 - 근사자 (충분한 네트워크 복잡성이 주어짐)이므로 Q 함수의 근사치로 사용할 수 있습니다. 이러한 딥 뉴럴 네트워크는 Q-Learning 내부의 도구/구성 요소 역할을합니다. Non-Deep 또는 Deep-Networks를 사용하는 경우 응용 프로그램에 종속됩니다 (이들을 분류하는 유효한 규칙도 없음).

Q-Learning은 강화 학습의 일부 형식이기 때문에이를 심층 강화 학습으로 설명 할 수도 있지만 DRL은 다른 접근법 (딥 신경망을 사용하지만 Q- 학습은 사용하지 않음)을 설명 할 수도 있습니다. 딥 Q 학습의 사용을 설명

유명한 현대 종이이다

Mnih, 볼로디미르, 등. "심화 학습을 통한 아타리 놀이." arXiv preprint arXiv : 1312.5602 (2013).