답변

12

강화 학습 문제를 해결하기 위해 명시 적으로 겨냥 된 진화 방법이 있습니다. 하위 필드는 일반적으로 LCS (Learning Classifier Systems) 또는 가끔 Genetics-Based Machine Learning (GBML)의 이름을 사용합니다.

그 외에도 질문에 대한 대답이 명확하지 않은 것으로 알고 있습니다. 기본적으로 "기계 학습이란 무엇인가?" 우리가 그 질문에 대답하는 방법에 대해 모두 동의 한 정경은 없습니다. 어떤 경우에는 EC가 해당 하위 필드의 일부일 수 있습니다. 다른 사람들에게는 그렇지 않습니다. 나는 선반에서 몇 권의 ML 교과서를 샘플링했으며 진화론 적 방법에 관한 자료는 약 절반에 불과했습니다. 나는 15 년 전에 그 비율이 더 높아 졌을 것이라고 생각하지만, 패션이 바뀌고 기계 학습은 이제 통계의 하위 필드에 가깝습니다. EC 방법은 그 금형에 잘 맞지 않습니다.

+0

이것은 가장 좋은 답변이지만, 계속 검색 할 것입니다 ... 훌륭한 답변을 해주셔서 감사합니다! –

5

진화 연산 또는 진화 알고리즘은 신경망에 적용될 때 (신경 진화에서와 같이) 평범한 알고리즘과는 조금 다르게 작동하지만 확실하게 강화 학습의 한 형태로 분류 될 수있는 최적화 알고리즘입니다 강화 학습 알고리즘.

일반적으로 유전자 알고리즘이나 진화 전략과 같은 진화 알고리즘에서는 최적화 할 전체 개체군이 있습니다. 그 개인들 각각에 대해, (적합성의 생존에서와 같이) '적합성'을 결정하기 위해 품질 함수가 사용되며, 다음 세대를 위해 최고의 개인이 선택됩니다. 그 '부모'는 다음 무작위로 복제, 수정, 돌연변이 또는 심지어 서로 재결합됩니다. 정확히 어떻게 다른 알고리즘마다 조금씩 다릅니다. 마지막으로, 새로운 돌연변이 및/또는 재조합 된 부모가 다음 세대의 개체군을 형성하고, 원하는 품질에 도달하거나 품질 수준이 떨어질 때까지 프로세스가 다시 시작됩니다.

신경 진화의 경우 개인은 무작위로 변화하는 가중치로 변형되는 신경망입니다 (반면 고전적 신경망에서는 매우 정밀한 수학적 규칙에 따라 가중치가 업데이트 됨). 또는 토폴로지가 변경 될 수도 있습니다. 개인의 품질은 훈련 데이터에서 얼마나 잘 수행되는지에 따라 결정됩니다.

죄송합니다. 여기에 열심히 과학적으로 언급 한 적은 없지만 어쩌면 이것도 여전히 문제를 해결하는 데 도움이 될 것입니다.

+0

답변을 주셔서 감사합니다.하지만 주된 문제는 신뢰할 수있는 참조에서 강화 학습과 관련하여 진화 알고리즘을 분류하는 것입니다. –

+1

나는 동의하지 않습니다. RL은 일련의 상태 및 동작을 통해 환경과의 상호 작용이 필요합니다. 진화 알고리즘은이 곰팡이에 적합하지 않습니다. – danelliottster

5

강화 학습 [1]과 진화 연산 [2]의 주된 차이점은 원래의 의미에서의 RL이 환경 (예 : reinforcement learning의 Wikipedia 기사 참조)에서 학습자에게 적용되는 반면 EC 검색을 최적화하기 위해 '진화론적인'영감을받은 방법을 사용하는 검색 알고리즘의 클래스에 대한 좀 더 일반적인 용어입니다. 나는 EC를 전혀 기계 학습으로 분류하지 않을 것이며, 나는 그 근원을 발견하지 못했다.

[1] 강화 학습 : 소개 - RS 서튼, AG 바토 - 1998 - 캠브리지 대학교 보도

[2] 진화 연산 무엇입니까? - DB Fogel - IEEE, 2000

+0

좋은 답변이지만 ML 방법 중 하나가 진화론이라고 말하는 대학의 발표를 보았습니다. 더하기 여기에서보십시오 : http://local.wasp.uwa.edu.au/~derek/files/ncca/talks/ecg/research/html/ec.html 그것은 "몇몇 저자는 ML를 특정한 유형의 ML로 분류합니다" , 우리가 필요로하는 것은 정확히 이것에 대해 언급 한 어떤 참고 문헌이다. –

+0

[1]은 진화론 적 계산의 공통적 인 사용법 인 계획 문제를 해결하기 위해 RL을 사용할 수 있다는 점을 언급했다. – danelliottster

0

그래서 진화 연산은 어디에 있습니까? 강화 학습의 방법입니까? 또는 기계 학습의 별도 방법? 아니면 전혀?

나는 EC와 ML을 서로 구별한다. 그러나 거기에는 유익한 몇 가지 훌륭한 응용 프로그램이 함께 사용됩니다. 이것은 꽤 오랜 기간 동안 작은 연구 분야 였지만, EC와 ML을 결합한 분야에서 약간의 열매가 맺혀 있다는 느낌이 듭니다. 나는 많은 사람들이 그 아이디어를 통해 인내심을 갖지 못한다고 생각합니다.