random-forest

    0

    1답변

    다음과 같은 코드를 사용하여 범주 형, 숫자 형, 문자열 형의 범주 형 기능을 혼합 한 다음 단호한 형식으로 코드화 한 다음 핫 코드 형 범주 형 기능을 모두 어셈블합니다 숫자 기능을 사용하여 무작위로 숲을 굴려 결과 트리를 인쇄합니다. 트리 노드가 원래 기능 이름 (예 : Frame_Size 등)을 갖기를 원합니다. 어떻게해야합니까? 일반적으로 어떻게 하

    0

    1답변

    저는 기계 학습과 파이썬에 익숙하지 않습니다. 이제 임의의 포리스트를 적용하여 대상의 이진 결과를 예측하려고합니다. 내 데이터에는 24 개의 예측 변수 (1000 개의 관측치)가 있는데, 그 중 하나는 범주 형 (성별)이고 다른 모든 변수는 수치입니다. 숫자로 된 값 중에는 유로화로 (매우 비뚤어지고 스케일링 된) 볼륨과 숫자 (atm에서의 트랜잭션 수)의

    0

    1답변

    Apache Spark의 RandomForestRegressor에 숫자 및 범주 형 기능을 전달하는 방법 : Java의 MLlib? 수치 또는 범주 형으로 할 수 있지만 함께 구현하는 방법을 모르겠습니다. (단지 수치 예측에 사용하는 기능) 밖에있는 사람들을위한 String[] featureNumericalCols = new String[]{ "

    0

    1답변

    아래에 표시된 것과 같은 데이터 세트가 있습니다. 실제 시나리오에서는 행 수가 10000에서 1000000 사이입니다. 더 많은 열이 있지만 핵심 문제는이 두 필드를 중심으로 회전합니다. 알려진 레이블 나는 종류를 알고 -'Apple ','블루 베리 ','오렌지 ','추 ' 데이터 집합을 DataFrame ({'ROWID':1,2,3,4,5,6,7,8,9

    2

    1답변

    이항 분류를위한 임의의 포레스트 분류기를 만들려고합니다. 이 프로그램을 실행할 때마다 왜 내 정확도 점수가 다른지 설명 할 수 있습니까? 점수는 68 % - 74 % 사이에 차이가 있습니다. 또한 매개 변수를 조정 해 보았지만 정확도가 74 이상으로 올라갈 수는 없습니다. 이에 대한 제안도 환영 할 것입니다. GridSearchCV를 사용하여 시도했지만 괜

    1

    1답변

    sklearn에서 randomforest를 사용하여 이진 분류를 수행 할 때. 예측 클래스를 얻으려면 clf.predict(X)을 사용할 수 있음을 알고 있습니다. 내가 clf.predict_proba(X)를 사용할 때,이 같은 배열 모양 얻을 : 내가 첫 번째 열은 예측의 확률을 나타냅니다 생각을? 클래스가 1 일 확률 인 열을 어떻게 얻을 수 있습니까?

    0

    2답변

    제 생각에 RF는 기능을 무작위로 선택하므로 과하게 맞추기 어렵습니다. 그러나 sklearn의 그라데이션 부스팅은 overfitting을 방지하는 데 도움이 될 수있는 max_features 옵션을 제공합니다. 그래서, 왜 아무도 랜덤 포레스트를 사용합니까? 그라디언트 부스팅 대 주어진 데이터를 기반으로하는 임의의 포리스트를 언제 사용할 수 있는지 설명 할

    -1

    1답변

    "작은 max_feature가 임의의 포리스트에서 overfitting을 줄인다"는 부분을 이해하지 못합니까? 또한 랜덤 포레스트에서 포기한다는 것은 무엇을 의미합니까?

    0

    1답변

    Pyspark에서 임의의 포리스트 알고리즘을 실행하려고합니다. Pyspark documentation에는 VectorAssembler가 숫자 또는 부울 데이터 유형 만 허용한다는 점이 언급되어 있습니다. 따라서 데이터에 Stringtype 변수가 포함되어 있고 도시 이름을 말하면 랜덤 포리스트 분류/회귀를 계속 진행하기 위해 도시 이름을 한 번 핫 인코딩해

    0

    2답변

    임의의 포리스트와 관련하여 질문이 있습니다. 사용자와 아이템의 상호 작용에 대한 데이터가 있다고 가정 해보십시오. 항목 수는 약 10,000 개입니다. 임의의 포리스트에 대한 내 출력은 사용자가 (추천 시스템과 같은) 상호 작용할 가능성이있는 항목이어야합니다. 모든 사용자에게 과거에 상호 작용 한 항목을 설명하는 기능을 사용하고자합니다. 그러나 범주 형 제