nlp

    3

    4답변

    자연어 사용을위한 좋은 API와 공용 데이터 세트 (사전, 구문)가 있습니까? 특히 영어와 한국어 간 번역 작업에 좋은 단어가 있습니까?

    3

    5답변

    콘텐츠를 기준으로 텍스트의 카테고리를 자동으로 찾는 방법은 무엇입니까?

    13

    2답변

    "긍정적"대 "부정적인"산업별 문장 (즉, 영화 리뷰)을 분석하는 최선의 방법을 결정하는 데 도움이 필요합니다. 전에 OpenNLP와 같은 라이브러리를 보았습니다.하지만 너무 저급입니다. 기본적인 문장 구성 만 제공합니다. 내가 필요로하는 것은 상위 레벨의 구조입니다 : - 잘하면 단어 목록으로 - 내 데이터 집합에 희망적으로 훈련 가능합니다 고마워요!

    13

    6답변

    며칠 전, 저자가 .NET을 사용하는 일반적인 자연 언어 DSL 파서에 대한 아이디어를 토론하는 블로그 항목 (http://ayende.com/Blog/archive/2008/09/08/Implementing-generic-natural-language-DSL.aspx)을 읽었습니다. 필자 생각으로는 텍스트가 구문 분석되고 문장과 동일한 이름을 사용하는 클

    9

    2답변

    도시/지역 또는 원산지와 함께 텍스트에 자동으로 레이블을 지정하는 좋은 알고리즘은 무엇입니까? 블로그가 뉴욕에 관한 것이라면, 어떻게 프로그래밍 방식으로 말할 수 있습니까? 어느 정도 확실하게이를 수행한다고 주장하는 패키지/논문이 있습니까? 나는 tfidf 기반의 접근 방식, 적절한 명사 교차점을 살펴 보았지만 지금까지 성공하지 못했고 아이디어를 감상 할

    4

    8답변

    나는 "어휘 인코딩"이라는 단어를 사용하여 더 나은 언어를 찾지 못했습니다. Word는 틀림없이 Letter와는 달리 의사 소통의 기본 단위입니다. 유니 코드는 알려진 모든 알파벳의 각 문자에 숫자 값을 할당하려고합니다. 한 언어에 대한 편지는 무엇인가, 다른 언어에 대한 문양입니다. 유니 코드 5.1은 현재이 글리프에 100,000 개 이상의 값을 할당합

    25

    4답변

    간단하지만 "충분히 좋은"명명 된 엔티티 인식 라이브러리 (및 사전)를 Java 용으로 찾고 있는데 전자 메일 및 문서를 처리하고 다음과 같은 일부 "기본 정보"를 추출하려고합니다. 이름 , 장소, 주소 및 날짜 나는 주변을 둘러 보았고, 대부분 무거운 쪽과 전체 NLP 프로젝트에있는 것처럼 보입니다. 어떤 권장 사항이 있습니까?

    37

    7답변

    이들을 각각의 단어로 나눌 수 있기를 바랍니다. wicked weather liquid weather drive our trucks go compact slim projector 표현 내 속임수. 그러나 내가 멈추지 않을 경계가 없기 때문에, 내가 핵심이 될 수있는 어떤 종류의 대문자도 없으며 사전에 대한 어떤 종류의 참조가 필요할지도 모른다고

    20

    4답변

    1 컵 밀가루, 2 레몬 껍질과 1 컵 포장 된 갈색 설탕 등 줄에 적용 가능한 양, 측정, 항목 및 설명으로 조리법 성분을 분석해야합니다. 최선의 방법은 무엇입니까? 이? 나는 nltk를 사용하는 것이 최선의 방법이라고 가정하고 있기 때문에 프로젝트에 파이썬을 사용하는 것에 관심이 있지만 다른 언어들에 대해서 열려 있습니다.

    3

    2답변

    TF-IDF (term frequency - inverse document frequency)은 정보 검색의 주요 요소입니다. 그것은 적절한 모델이 아니며, 새로운 용어가 코퍼스에 도입되었을 때 무너지는 것 같습니다. 쿼리 나 새 문서에 새로운 용어가있을 때, 특히 빈도가 높은 경우 사람들이 어떻게 처리합니까? 전통적인 코사인 검색에서는 전체 일치에 영향을