cross-validation

    0

    1답변

    sklearn.LassoCV가 교차 검증을 수행하는 방법을 알고 싶습니다. 특히 나는 샘플이 폴드에서 어떻게 세분되는지를 알고 싶다. 그것은 무작위 적이거나 결정론적인 과정입니까? 예를 들어 100 개의 샘플이 있고 십자가 유효성 검사를 10 번 사용한다고 가정하고 모든 샘플을 폴드로 보내는 기능을 F라고 생각하십시오. F (1:10) = 1, F (11:

    1

    1답변

    평균 제곱 오류가 발생하면 506 행의 데이터 집합이 있습니다. 평균 제곱 오류가 발생하면 평균 제곱의 평균을 계산합니다. 내가 찾은 오류들. 이것은 내가 그것을 실행할 때마다 변하고 있습니다. 예상 되나요? 그렇다면 누군가 내가 왜 그것을 실행 할 때마다 변하는 지 설명해 주시겠습니까? 내가 먼저 행을 셔플, CV 아웃 하나를 남겨하려면, DF 그런 다음

    9

    2답변

    이전에 R에서 작성한 일부 glm 모델에 대해 10 배 교차 유효성 검사를 수행하려고합니다. boot 패키지의 cv.glm() 기능에 대해 약간 혼란 스럽습니다. 나는 많은 도움말 파일을 읽었습니다. 다음 공식을 제공 할 때 : library(boot) cv.glm(data, glmfit, K=10) 여기서 "데이터"인수는 전체 데이터 집합 또는 테스

    1

    1답변

    저는 libSVM (선형 커널 포함)을 사용하여 데이터를 학습하고 교차 검증 (10 배)했습니다. 데이터는 단일 데이터 포인트로 표시되는 1800 fMRI 휘도 보셀로 구성됩니다. svm-train의 training-set-file에는 약 88 개의 데이터 포인트가 있습니다. +1 1:0.9 2:-0.2 ... 1800:0.1 -1 1:0.6 2:0.9 .

    0

    1답변

    이것은 바보 같은 질문 일 수 있지만 데이터에 SVM을 수행했으며 최상의 RMSE 값을 제공하므로 C = 0.5 일 때 모델이 가장 적합했습니다. 어느 쪽이 위대한가. 나는 다음을 수행하여, 그 위에 열 번 10 크로스 배 유효성 검사를 수행 : - 당신이 할 때 당신이 얻을 것이다으로 ctrl <- trainControl(method = "repeated

    0

    2답변

    신경망에서 피팅을 피하기 위해 조기 정지 방법을 사용하고 싶습니다. 나는 60-20-20 (60)에 내 데이터 집합을 구분 한 - 교육 (20) - 검증 20 세트 - 테스트 초기 정지를 구현하는 동안 나는 의심의 여지가 을 설정합니다. 훈련 세트를 사용하여 1 에포크의 가중치를 업데이트합니다. 교육 세트를 사용하여 네트워크에서 오류가 발생했습니다. 유효성

    2

    1답변

    나는 지금 Kaggle Machine Learning 경연 대회에 참가하고 있으며, 빠른 질문이 있습니다. 이 대회에서 알고리즘 유효성을 평가하기 위해 교차 검증을 사용하는 이유는 무엇입니까? 확실히이 대회에서 실제 실제 데이터와 비교하여 알고리즘을 테스트 한 공개 리더에서 점수를 얻으면 알고리즘 유효성을보다 정확하게 나타낼 수 있습니까?

    1

    2답변

    SVM 라이트에서 벡터 공간 모델을 사용하여 SVM 분류기를 작성하려고합니다. 1000 개의 문서와 각 문서를 벡터화하기 위해 사용할 사전을 가지고 있습니다. 1000 개의 문서 중 600 개가 교육용 세트로, 나머지 400 개는 교차 확인 세트와 테스트 세트로 균등하게 분할됩니다 (각 200 개). 이제 분류 모델을 생성하기 위해 내 훈련 세트 600 (

    2

    3답변

    이미지 분류에 새로운 점입니다. 현재 SVM (Support Vector Machine) 방식으로 4 개의 이미지 그룹을 multisvm 함수로 분류하고, 알고리즘은 매번 교육 및 테스트 데이터를 무작위로 선택하며 성능은 매번 달라집니다. 어떤 사람들은 교차 검증을 제안했는데 왜 교차 검증이 필요한지 이해하지 못했고 이것의 주요 목적은 무엇입니까? . 내

    2

    1답변

    그래서 나는 현재 사용하고있는 데이터 세트와 유사한 데이터 세트를 모델링하기 위해 신경망을 사용한 종이를 읽었습니다. 160 개의 사례 (회귀 모델링)를 모델로하려는 160 개의 설명자 변수가 있습니다. 내가 읽은 종이는 다음과 같은 매개 변수를 사용했습니다 : - '각 분할마다 10 개의 개별 열차 테스트 폴드에 대한 모델이 개발되었습니다. 33 개의 입