현재 분류 자 모델을 학습 중입니다. 어제 나는 당신이 또한 창조 된 분류 모델을 테스트한다면 더 정확할 것이라는 것을 알았다. 인터넷에서 모델 테스트 방법을 찾으려고했습니다 : testing openNLP model. 그러나 나는 그것을 작동시키지 못한다. 이유는 1.5 대신 OpenNLP 버전 1.83을 사용하고 있기 때문입니다. 누구나 Open
문제가 데이터 세트를 분리하는 방식인지 또는 내가 잘못하고 있는지 알 수 없지만 프로그램을 실행할 때마다 정확도가 달라집니다. 아무도 내가 문제를 찾을 수 있도록 도와 줄 수 있습니까? 주셔서 감사합니다 여기 내 코드입니다 : 여기 import pandas as pd
import matplotlib.pyplot as plt; plt.rcdefaults()
R에 익숙하지 않습니다. lda를 사용하여 생성 된 그리드의 모든 점을 분류하려고합니다. 훈련 세트는 rmvnorm(n,mean,sigma)을 사용하여 무작위로 생성 된 두 개의 포인트 그룹입니다. `여기서 # number of samples
n=100;
# parameters: G2
meanG1 = matrix(
c(2, 2), # the
다음 작업을 위해 python 스크립트를 작성하는 데 도움이 필요합니다. 훈련 데이터 형식 : Record contains: Result:
------------------- ---------
(x,f,r,t,w) -> Positive
(x,f,d,z,w,m,d) -> Positive
(x,f,e,o,p) -> Neg
저는 연구에서 데이터 소스에 큰 어려움에 직면하고 있습니다. 기본적으로 나는 후 처리를 위해 등록 된 여섯 가지 유형의 이벤트가 있습니다. 이 이벤트는 프로세스에서 사용되는 일종의 이온 및 장치에서 이벤트가 발생하는 위치와 관련됩니다. 이미지 1은 각 유형의 짝수에 대한 평균 곡선을 보여줍니다. 이미지 1 내 목표는 내가 각각의 곡선으로부터 추출 된 네 개
이진 분류 작업이 있다고 가정 해 봅시다.이 작업을 수행 할 신경망을 작성합니다. 두 가지 프레임 워크가 있습니다. 첫 번째는 네트워크가 클래스 중 하나에 속할 가능성을 나타내는 하나의 출력 단위를 가지므로 이진 교차 엔트로피를 사용하여 손실을 계산할 수 있으며, 두 번째 네트워크는 두 가지입니다 출력 단위는 두 클래스에 속한 확률을 나눠서 나타내며, so
그래서 데이터 분류를위한 Gaussian Class Conditional 모델을 훈련시키는 EM 알고리즘을 구현하려고합니다. 나는 공분산 행렬을 계산하는 방법을 알 수 없기 때문에 지금은 M 단계에 머물러 있습니다. 문제는 큰 데이터 세트가 있고 for 루프를 사용하면 각 지점을 통과하는 것이 느려질 수 있습니다. 난이 식을 이용하여 계산 된 평균을 사용하
의사 결정 트리 분류자를 구축 중이며 정보 획득을 계산하는 방법을 찾았습니다. 이것은 바보 같은 질문 일지 모르지만이 방법의 분할이 숫자 또는 범주 속성인지 궁금합니다. 나는 임계 값 (중간 값)이 숫자 스플릿에 사용되었다고 생각했기 때문에 혼란 스럽다. 그러나이 방법은 문자열 값을 사용한다. 도움을 주시면 감사하겠습니다. 당신이 향하고 코드는 코멘트를 보