cross_validation.train_test_split의 random_state 인수가 부울이 아닌 정수인 이유를 알아야합니다. 임의 할당을 플래그 지정하는 것이지 아니니까요.왜 cross_validation.train_test_split의 argument random_state가 부울이 아닌 정수인
0
A
답변
2
random_state
은 임의성의 플래그 일뿐만 아니라 사용할 임의의 시드입니다. random_state = 3
을 선택하면 데이터 세트를 "무작위로"분할하지만 매번 동일한 분할을 재현 할 수 있습니다. 나는. 동일한 데이터 셋을 사용하는 각 호출은 동일한 분할을 생성합니다. random_state
매개 변수를 지정하지 않은 경우에는 그렇지 않습니다.
따옴표를 사용하는 이유는 실제로는 의사 랜덤입니다. 위키 백과는 다음과 같이 의사 난 설명 :
의사 랜덤 과정이 무작위로 보이지만 없는 과정이다. 의사 랜덤 시퀀스는 일반적으로 통계적 무작위성을 나타내지 만 완전히 결정 론적 인 인과 과정에 의해 생성됩니다. 그런 프로세스는 진정으로 무작위의 프로세스보다 생성하기가 쉽습니다. 은 동일한 번호를 정확히 생성하기 위해 몇 번이고 반복적으로 사용할 수 있다는 이점이 있습니다. 소프트웨어 테스트 및 수정에 유용합니다.
0
켈빈의 대답을 조금 더 확장하려면 임의의 열차 테스트 분할을 원할 경우 random_state
매개 변수를 지정하지 마십시오. 이 아닌 경우 번으로 무작위로 기차 테스트 분할 (예 : 동일하게 재생 가능한 분할이 필요할 때마다)을 원하는 경우 random_state
을 원하는 정수로 지정하십시오.