배열의 각 요소를 8 개의 다른 배열 요소로 검사하여 첫 번째 배열 요소에있는 요소 중 하나가 해당 범주에 속하는지 확인하고자하는 문자열 배열이 있습니다. 단순히 문자열 배열을 분류하고 싶습니다. 그래서 나는 8 개의 다른 배열 (8 개의 카테고리를 가지고 있기 때문에)을 확인해야합니다. 하나씩 반복하지 않고 이것을 수행하는 효율적인 방법을 알고 싶습니다.
저는 94 개의 텍스트를 분류하려고합니다. trainset의 범주가 testset의 범주에 존재하지 않으면 naiveBayes가 제대로 작동하지 않으므로 무작위로 확인했습니다. 카테고리에 문제가 없었습니다. 그러나 분류 기준은 testset에서 작동하지 않았습니다. 이 분류는 잘 작동 Df.dtm<-cbind(Df.dtm, category)
dim(Df.
수천 개의 위키피디아 자료로 구성된 레이블이없는 데이터 세트가 있습니다. 이 기사는 내용면에서 밀접한 관련이있는 기사 모음으로 그룹화됩니다. 이 세트 중 하나가 주어지면 모든 기사가 속한 공통 주제를 결정하고 싶습니다. 예 : {미적분, 행렬, 정수론} 내가 공통 주제 수학 것을 확인할 수 있습니다 자신의 제목으로 관련 기사의 다음과 같은 설정을 감안할 때
저는 프로젝트에서 문제를 해결하고 있습니다. 과 같은 유형의 열이있는 DB가 있습니다. "15 분 휴식" 또는 "30 분 여유 시간" 카테고리가있는 다른 열을 만들고 싶습니다. 내가 파이썬을 사용하여 유형의 범주를 할당하는 방법을 { "short":["10","5","15","10min","5min","15min","shorter"],
"middle":[
내가, 내가 분류는 하나의 하위 유형의 모델링의 과정입니다 ... 이해하지 않는 사이트에서있어 ... 나 데이터베이스에 그것의 어떤 역할이 무엇인지 분류 알려 (또는 서브 클래스)를 두 개 이상의 고유 한 상위 유형 (또는 수퍼 클래스)이 포함 된 관계로 대체하십시오. 지금까지 논의 된 모든 관계는 단일 별개의 상위 유형입니다. 그러나 수퍼 유형이 다른 엔
은 내가 분류 모델 훈련을 위해 다음 코드를 사용하고 있습니다 : Indexing events with TwoPass using cutoff of 0
Computing event counts... done. 1474 events
Indexing... done.
Collecting events... Done indexing in 0,03
저는 https://www.kaggle.com/c/titanic의 타이타닉 데이터 세트를 사용하고 있습니다. 저는 "0-4", "1-5", "2-6", "3-7"등과 같은 다른 연령 그룹을 만들고 생존율이 다른 연령 그룹을 찾고 싶습니다. 최고. 내 나이 그룹은 정수 간격 [0,80] 내에 있습니다. 원래 데이터 세트의 "Age"열에는 NAs도 포함됩니다.
OpenNLP 버전 1.8에서 분류기를 작성하려고하지만 아래 코드를 사용하면 계속 NullPointerException으로 표시됩니다. 내가 도대체 뭘 잘못하고있는 겁니까? public class test
{
public static void main(String[] args) throws IOException
{
훨씬 작은 R 데이터 프레임 (12 행)의 날짜 범위 정의를 기반으로 대형 R 데이터 프레임 (200 만 행 이상)의 각 행을 어떻게 분류합니까? id date sex
1 160520 2016-11-22 1
2 1029735 2016-11-12 1
3 1885200 2016-11-05 1
4 2058366 2015-09-26 2
5 205836
이전 변수의 분류 인 다른 변수 (동일한 데이터 세트에서도 괜찮습니다)를 빌드하는 방법을 찾고 싶습니다. 버킷의 수를 선택합니다 (백분위 수를 컷오프로 사용하는 exemples의 경우 : p10, p20, p30 등). 이제 변수의 백분위 수를 proc univariate으로 추출하는 작업을 수행합니다. 그러나 이것은 백분위 수 (내 cutoffs) 만 제