text-analysis

    4

    2답변

    저는 말렛 주제 모델링 샘플 코드를 사용하고 있으며 잘 실행되지만이 문장의 매개 변수가 실제로 무엇을 의미하는지 알고 싶습니다. documentation에서 instances.addThruPipe(new CsvIterator(new FileReader(dataFile), "(\\w+)\\s+(\\w+)\\s+(.*)",

    2

    1답변

    저는 선으로 주어진 텍스트를 분석하려고합니다. 파이썬에서 sckit-learn 패키지의 TF-IDF- 벡터화를 사용하여 라인을 벡터화하고 싶습니다. 문제는 벡터화가 단어 또는 n-gram으로 수행 될 수 있지만 라인에 대해 수행되기를 바랄 뿐이며, 각 라인을 단일 단어로 벡터화하는 작업을 이미 배제했기 때문입니다. 단어와 그 의미는 고려되지 않을 것이다).

    1

    3답변

    아래 문장은 처리하고자하는 문장입니다. 앞면에 두 개의 해시 (##2312435)와 나머지 텍스트로 시작하는 ID로 구성됩니다. 나는 단어가 likely 인 문장을 찾을 수있는 정규 표현식이 필요하며 전체 문장과 ID를 검색합니다. 문장 : ## 2312435 존이 집에 없습니다. 존은 자정 이후 집에 올 가능성이 있습니다. 또 다른 관련 문장이 아닙니다.

    -4

    1답변

    R 패키지를 사용하여 분석 한 4,500 개의 긴 텍스트 데이터 세트가 있습니다. 특정 단어가 포함 된 문장 만 분석하고 싶습니다. 어떻게해야합니까? 나는 모든 문장의 두 번째 세트를 생성하는 R을 사용할 수 있습니다 감사을

    2

    1답변

    문장의 길이가 길어질수록 Stanford Parser의 구문 분석 시간이 늘어난다는 것을 이미 알고 있습니다. 나는 정확성에 타협하지 않고 구문 분석 시간이 줄어들도록 문장을 잘라내는 창조적 인 방법을 찾는데 관심이 있습니다. 예 : 우리는 알려진 명사구를 한 단어 명사로 대체 할 수 있습니다. 마찬가지로, POS 태그 정보를 사용하여 손에 잡히기 전에 하

    0

    2답변

    일부 텍스트 분석을 수행하는 프로그램을 작성 중입니다. 약식 단어를 원래 단어로 푸는 것이 분석의 정확성을 향상시킬 것이라고 생각합니다. 그러나 구현할 생각은 없습니다. 나는 조금씩 검색했지만 어떤 기사 나 논문을 찾을 수 없다. (또는 어쩌면 나는 다만 적당한 키워드를 찾아 낼지도 모른다) 기본적으로 내가 필요로하는 것은 다음과 같다 : 단어 W가 주어진

    0

    1답변

    content_transformer 함수가 tm 패키지에서 제거되었습니다 0.6-2 ?? library(tm) docs<-Corpus(DirSource("Dname")) docs<-tm_map(docs,content_transformer(gsub), pattern="using",replacement="use") Error: could not find

    0

    1답변

    필자가 아는 한, LDA 모델링을위한 주제는 Python/R에서 수정해야합니다. 그러나 결과는 다음과 같이 나타납니다. topic=10 문서, 9 개의 주제는 모두 '건강'에 관한 것이고이 문서에 대한 주제의 수는 실제로 2입니다. 어떻게하면 각 주제의 키워드를 검토하지 않고도 실제로 구별되는 실제 주제를 직접 계산할 수 있습니까? P. 나는 인터넷 검색을

    1

    1답변

    나는 R에 업로드 한 연설을 분석 중입니다. 내 데이터 프레임에는 메타 데이터가있는 각 연설과 연설의 전체 텍스트가 포함되어 있습니다. 하지만 음성을 전체적으로 분석하는 것이 아니라 특정 단어 주변의 텍스트 청크를 분석하는 방법을 찾는 것입니다. 예를 들어 "RED"에 대한 참조 전후 50 단어 ... 새 데이터 프레임을 만들 수 있습니까? 각 행이 세그먼

    0

    1답변

    Google 스토어 메타 데이터를 작업 중이며 데이터 프레임으로 사용하고 있습니다. | 나만의 연락처 카드 읽기 | 장치에서 계정 찾기 | RUNNING의 앱 검색 |이 가 중요한 로그 데이터 읽기 : 각 응용 프로그램 당 하나의 셀 내에서 요청 된 권한에 대한 자세한 내용은 긴 텍스트로, 예를 들어,이 연락처 읽기 | "|" 문자를 다른 셀 (열)에 추가