답변

2

random_state은 임의성의 플래그 일뿐만 아니라 사용할 임의의 시드입니다. random_state = 3을 선택하면 데이터 세트를 "무작위로"분할하지만 매번 동일한 분할을 재현 할 수 있습니다. 나는. 동일한 데이터 셋을 사용하는 각 호출은 동일한 분할을 생성합니다. random_state 매개 변수를 지정하지 않은 경우에는 그렇지 않습니다.

따옴표를 사용하는 이유는 실제로는 의사 랜덤입니다. 위키 백과는 다음과 같이 의사 난 설명 :

의사 랜덤 과정이 무작위로 보이지만 없는 과정이다. 의사 랜덤 시퀀스는 일반적으로 통계적 무작위성을 나타내지 만 완전히 결정 론적 인 인과 과정에 의해 생성됩니다. 그런 프로세스는 진정으로 무작위의 프로세스보다 생성하기가 쉽습니다. 은 동일한 번호를 정확히 생성하기 위해 몇 번이고 반복적으로 사용할 수 있다는 이점이 있습니다. 소프트웨어 테스트 및 수정에 유용합니다.

0

켈빈의 대답을 조금 더 확장하려면 임의의 열차 테스트 분할을 원할 경우 random_state 매개 변수를 지정하지 마십시오. 이 아닌 경우 번으로 무작위로 기차 테스트 분할 (예 : 동일하게 재생 가능한 분할이 필요할 때마다)을 원하는 경우 random_state을 원하는 정수로 지정하십시오.