term-document-matrix

0열

1답변

큰 데이터 세트에서 텍스트 마이닝을하고 있습니다. TDM과 DTM을 만들 수 있었고 TDF & IDF를 사용하여 분석을 수행 할 수있었습니다. 그러나 R에서 Bi Grams에 대한 Term Document Matrix 또는 Document Term Matrix를 만들 수 있습니까? 비슷한 시설을 Mahout에서 사용할 수 있지만 R에서이 작업을 수행 할 방

4열

2답변

용어 당 빈도 - R TM DocumentTermMatrix

저는 R이 매우 새롭고 DocumentTermMatrixs에 대해 머리를 감쌀 수 없습니다. TM 패키지로 만든 DocumentTermMatrix가 있는데 용어와 용어가 있지만 그 접근 방법을 알 수는 없습니다. 이상적으로, 내가 좋아하는 것 : 현재 Term # "the" 200 "is" 400 "a" 200 내 코드는 다음

0열

2답변

파이썬을 사용하여 csv에서 용어 - 문서 행렬 읽기

클래식 csv 판독기가 용어 - 문서 배열에서 작동하지 않는 이유는 csv 파일의 첫 번째 열이 값이 아닌 용어라는 것입니다. 따라서 파일의 구문은 다음과 같습니다 "";"label1";"label2";"label3" ... "term1";1;0;8;... "term2";0;0;3;... .................................

1열

2답변

텍스트 파일에서 용어 문서 행렬 만들기

텍스트 파일 하나를 읽고 textmining 패키지를 사용하여 용어 문서 행렬을 만들려고합니다. 각 줄을 한 줄씩 추가해야하는 용어 문서 행렬을 만들 수 있습니다. 문제는 한 번에 전체 파일을 포함하고 싶다는 것입니다. 다음 코드에서 누락 된 부분은 무엇입니까? 미리 제안 해 주셔서 감사합니다. import textmining def term_docum

1열

1답변

R : 문서 기간의 문서에서 '사기'와 관련된 상위 10 개 용어 찾기 R

나는 1944.txt, 1978.txt라는 이름으로 39 개의 텍스트 파일로 구성된 코퍼스를 가지고 있습니다. 2013.txt. 저는이를 R에 가져오고 TM 패키지를 사용하여 문서 용어 매트릭스를 만들었습니다. 용어 'fraud'와 관련된 단어가 1945 년에서 2013 년까지 어떻게 변했는지 조사하려고합니다. 원하는 출력 결과는 행 제목으로 년을 포함하고