2012-08-29 10 views
1

내 이전 질문은 애매한 이유로 닫혔습니다. 이 질문에 대한 조언을 원합니다. 저는 현재 Question and Answer Application에 대해 연구 중이며, 이것에 맞춰진 방법은 Parsing입니다. 여기서 아이디어는 프로그램이 어떤 종류의 Word가 말하고 있는지를 결정할 것이고, 프로그램은이 질문의 Topic/Idea이 무엇인지 결정할 것입니다.나만의 영어 사전을 만들거나 기존 영어 어휘 사전을 사용해야합니까?

예 :

What is Computers?

  1. 무엇 - 의문 대명사.
  2. 은 - 동사입니다.
  3. 컴퓨터 - 주제.

컴퓨터는 PDF/TXT 파일에서 Computer이라는 단어를 검색합니다. 여기에있는 질문은 Should i make my own Simple Lexicon? or use a existing one입니다. 나는 간단한 라이브러리 만 필요로합니다. 너희들은 어떻게 생각하니?

추신 : 내가 선택한 언어로 자바 스크립트를 사용하고 있습니다.

고맙습니다.

+2

가. 가치가있는 일이라 할지라도, 가능하다면 그렇게 물어봐야한다면 아마 자바 스크립트 용 NLP 라이브러리를 작성할 수는 없을 것입니다. – geoffspear

+2

질문이 "컴퓨터입니까?"가 아니기 때문에 질문이 [잡지] (http://en.wikipedia.org/wiki/Computer_ (magazine))를 언급하지 않는다는 것을 어떻게 알 수 있습니까? 또는 "... 컴퓨터입니까?" – Bergi

+0

큰 문제는 어휘 자체가 아니라 영어 문법을 파싱하는 것입니다. 그것은 깊은 언어 지식이 필요합니다. 미안하지만, 당신은 가지지 않는 것 같지만 잘못되었을 수도 있습니다. 그리고 그 지식으로도 아무도 컴퓨터를 정확하게 * 영어 문장을 구문 분석 할 수 없었습니다. – kapa

답변

2

그런 식으로 영어를 구문 분석하면 컴퓨터가 불가능합니다.

  • 영어는 종종 위치를 표시합니다. 단어는 문장의 나머지 부분에서 문맥을 모른 채 카테고리에 할당 될 수 없습니다.
  • 영어에는 상황이 필요합니다. 'it', 'he'또는 'the'와 같은 단어는 문장의 다른 단어를 나타내며 문장의 의미에 대한 지식을 필요로합니다.

통계적 접근 방법에 더 많은 행운이있을 수 있습니다.

위키 피 디아 페이지에 대한 정보를 충분히있다 : 그것은 우리 중 누구도 가능하게 평가할 수 프로그래머와 같은 능력의 의견을 묻는 있기 때문에이 하나가 종료됩니다

http://en.wikipedia.org/wiki/Natural_language_processing