MICROARAY DATA 용 데이터 마이닝 소프트웨어 인 WEKA에서 기존 데이터 세트에서 중복 튜플을 제거하려면 어떻게해야합니까? 중복을 제거하는 코드는 JAVA에 있어야합니다. 즉는 데이터 세트는 여기 H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S
RBF 커널을 지원 벡터 시스템과 함께 사용하는 경우 두 매개 변수가 있습니다 (C 및 γ). 하나의 문제에 대해 C와 γ가 가장 좋은 것은 미리 알지 못한다. 따라서 어떤 종류의 모델 선택 (매개 변수 검색)이 수행되어야합니다. 목표는 우수 (C; γ)를 식별하여 클래스가 알 수없는 데이터 (즉, 테스트 데이터)를 정확하게 예측할 수 있도록하는 것입니다.
저는 현재 불균형 한 데이터 세트를 다루어야하는 반면 기계 학습 문제로 난폭 해지고 있습니다. 즉, 6 개의 클래스 ('1', '2'... '6')가 있습니다. 불행히도 예를 들어 클래스 '1'에 150 개의 예제/인스턴스, '2'90 인스턴스 및 클래스 '3'에만 20. 이러한 클래스에 대해 사용 가능한 인스턴스가 없기 때문에 다른 모든 클래스는 "훈련"
Weka에 대한 새 필터를 구현하려고합니다. 나는 weka를 디버깅 할 수 있도록하기 위해 무엇을해야하는지 알고 싶습니다. 그래서 weka에서 필터를 실행하려고 시도 할 때 예외를 얻고 있기 때문에 무엇이 잘못되었는지를 볼 수 있습니다. 현재 나는 그러나 나는 등 WEKA를 다시 시작, 올바른 위치에 대처, jar 파일을 생성하는 많은 시간을 낭비하고, 시
14 개의 숫자 열을 포함하는 ARFF 파일이 있습니다. 각 열의 값을 (actual_value - min(this_column))/(max(this_column) - min(this_column))으로 수정하여 각 열마다 별도로 정규화를 수행하려고합니다. 따라서 열의 모든 값은 [0, 1] 범위에 있습니다. 한 열의 최소값과 최대 값은 다른 열의 값과 다