random-forest

    0

    1답변

    R randomForest 모델을 PMML로 내보내고 있습니다. 결과 PMML은 항상 DataDictionary 요소의 첫 번째 요소로 클래스를 가지며, 항상 사실은 아닙니다. 이 문제를 해결하거나 사용자 지정 확장 요소를 사용하여 PMML을 늘리는 방법이 있습니까? 그렇게하면 클래스 색인을 거기에 넣을 수 있습니다. pmml 패키지 설명서와 pmmlTra

    5

    3답변

    내 데이터 집합의 중요한 기능을 결정하기 위해 sklearn의 RandomForestClassifier를 사용했습니다. 상대 이름 대신 실제 기능 이름 (x1, x2, x3 등)을 반환 할 수있는 방법 (중요한 기능은 '12', '22'등)을 반환 할 수 있습니까? 아래는 중요한 기능을 반환하기 위해 현재 사용하고있는 코드입니다. important_feat

    4

    1답변

    randomForest 패키지의 randomForest 함수를 사용하여 가장 중요한 변수를 찾습니다. 내 데이터 프레임을 urban이라고하고 응답 변수는 수익을 나타냅니다. 이 x 변수와 관련된 소스 코드에 Error in randomForest.default(m, y, ...) : data (x) has 0 rows : urban.random.fore

    0

    1답변

    random forest example을 실행하는 동안 java.lang.ArrayIndexOutOfBoundsException: 100 오류가 발생했습니다. 여기에서 100은 나무의 수에 묶입니다. 지도 부분은 100 % 완료되었으며 축소는 0 %입니다. 나는 hadoop-1.2.1과 mahout-distribution-0.7을 사용합니다. 나는 또한 같

    2

    1답변

    포리스트의 각 트리에 OOB 오류를 가져 오는 방법이 있습니까? 이 패키지는 'importanceSD'에 대한 액세스를 제공하지만 각 트리에 OOB 오류를 얻는 방법을 찾지 못했습니다.

    1

    1답변

    R 패키지 '파티'를 사용 중입니다. 개별 트리의 정보에 액세스 할 수있는 방법이 있습니까? 어떤 샘플 (어떤 기능이 선택되었는지, 시간 등)은 OOB 샘플 인 트리 생성에 사용되며, 트리의 OOB 오류는 무엇입니까? 'randomForest'패키지는 완전한 정보가 아닌 부분을 제공하는 것 같습니다. RF는 블랙 박스이지만, 더 밝을 수도 있습니다.

    0

    1답변

    나는 큰 데이터 세트 단백질 사이의 거리 (RMSD)을 나타냅니다 (> 30 만 명 관찰)이있다. 나는 어떤 두 단백질 사이의 거리를 예측하기로되어있는 회귀 모델 (Random Forest)을 만들고있다. 내 문제는 그러나 내 데이터의 분포가 높은 거리의 대부분이 큰하도록 바이어스, 나는 가까운 일치 (짧은 거리)에 더 관심이 있다는 것입니다. 모델이 먼

    0

    1답변

    weka 탐색기를 사용합니다. train/test split 백분율이 있습니다. trainset에서 반복 인스턴스가 있을지 여부는 지정된 percentage.i에서 trainset 및 testset으로 데이터 세트를 가져옵니다. weka RF.and 반복 여부가 결과에 영향을줍니다. RandomForest 난 부트 스트랩을 사용하고 trainset 인스턴스

    8

    1답변

    Scikit과 함께 Python에서 임의의 포리스트를 사용하는 데 어려움을 겪고 있습니다. 내 문제는 텍스트 분류 (3 가지 클래스 - 긍정/부정/중립)에 사용하고 추출한 기능은 주로 단어/유니그램 (word/unigrams)이기 때문에 이것을 숫자 기능으로 변환해야합니다. 나는 그것을 할 수있는 방법을 발견 DictVectorizer의 fit_transf

    0

    1답변

    저는 C++의 초보자이며 Leo Breimen의 무작위 포레스트 알고리즘을 구현하려고합니다. https://code.google.com/p/randomforest-matlab/에 대한 코드가있는 MATLAB의 임의 포리스트 (Random Forest) 알고리즘으로 작업했으며 필자의 논문에 98 % 의 정확도로 테스트하고 훈련 할 수있게되었습니다. 이제는 C