information-extraction

    4

    2답변

    단락에서 간단한 문장을 추출하는 데 사용할 수있는 알고리즘이 있습니까? 내 궁극적 인 목표는 나중에 작성된 간단한 문장에 대해 다른 알고리즘을 실행하여 작성자의 정서를 결정하는 것입니다. 나는 Chae-Deug Park와 같은 출처에서 이것을 연구했지만 아무도 간단한 데이터를 훈련 자료로 준비하는 것에 대해서는 논의하지 않고있다. 사전

    1

    1답변

    일부 개념에 대한 일부 문서와 온톨로지가 있습니다. 주어진 문서에서 자동으로 개념을 추출하고 트리플을 생성하는 프레임 워크가 있습니까? 온톨로지에는 특별한 속성이 있어야합니까? 나는 UIMA를 찾았지만, 내가 UIMA 이해로까지이 같은 단지 뭔가 수행 할 수 있습니다 이 ConceptMapper 와 온톨로지와 사용이 사전을 연결을 유지하는 몇 가지 사전을

    11

    2답변

    일부 국가 및 언어의 수천 개의 뉴스 기사 모음에서 "엔티티 이름"을 추출하는 Python 스크립트를 작성하고 있습니다. 놀랍도록 DBPedia 구조의 knwoledge를 사용하고 싶습니다. 예를 들어 "이집트의 아티스트"의 이름과 "캐나다의 회사"이름을 조회하고 싶습니다. 는 (이 정보는 SQL 형태라면, 나는 아무 문제가 없었을 것입니다.) 나는 DBP

    0

    1답변

    가변 스텝 크기 (구체적으로 ode113 적분기 사용)의 통합 프로세스 중에 시간의 경과에 따라 파일에 저장되는 가속도를 통해 신체 위치가 결정됩니다 (즉, 두 개의 열 , 하나는 시간, 나머지는 가속). 그러나 언급 된 프로세스를 통해 실패한 통합 단계가 있기 때문에 가속 데이터의 파일에는 위치 데이터에 대한 해당 행보다 많은 행이 있습니다. 어떻게하면

    1

    1답변

    내 회사 온라인 상점의 제품 웹 페이지를 부분적으로 자동화하기 위해 짧고 비 균일 한 제품 설명에서 데이터를 추출하려고합니다. 불행히도, 설명은 일정하지 않습니다. 이 사이트 덕택에 정규식에 대해 충분히 배웠습니다. 제품 측정 방법에서는 실패한 테스트가 있습니다. w. This product is 68 cm by 22 cm by 73 cm -- Length

    0

    1답변

    이것은 사용 가능한 클래스, 코드, 교사, 시간, 위치의 전체 목록을 가져 오는 대학용 프로그램에서 가져온 것입니다. 이 정보에 액세스하려면 대학의 보안 웹 사이트에 로그인하고 개별 수업을 검색해야합니다. 어떻게 프로그램 (iphone 앱 등을 보았습니다.)에서 대학, 학급 검색을하고 CURRENT 및 클래스의 업데이트 된 명부를 표시합니다. 프로그램이 A

    1

    2답변

    원시 자연 텍스트를 구문 분석하고 날짜를 설명하는 모든 구를 찾는 것입니다. 내가 마크 업 날짜에 대한 모든 참조와 함께 상당히 큰 시체를 가지고 : I met him <date>yesterday</date>. Roger Zelazny was born <date>in 1937</date> He'll have a hell of a hangover <dat

    4

    2답변

    나는 연속 파서와 의존성 파서에 대해 읽었습니다. 그러나 혼란스러워서 최선의 선택이 될 수 있습니다. 나의 작업은 영어 위키 백과 텍스트에서 관계를 추출하는 것입니다 (다른 소스도 나중에 포함될 수 있습니다). 흥미로운 두 엔티티 사이의 의미 론적 경로 (가장 중요한 정보 만 포함)가 필요합니다. 예 : 텍스트 형식 : "미국에서는 당뇨병이 모두가 알고 있

    2

    1답변

    Perl로 플래시 비디오를 다운로드 중입니다. C#에서 할 수있는 것처럼 플래시 비디오에서 변수를 검색하는 것과 같은 플래시 비디오와 상호 작용할 수있는 방법이 있습니까? 예를 들어 C#에서는 Shockwave Flash Object을 양식에 넣은 다음 GetVariable/SetVariable을 해당 개체에 추가 할 수 있습니다. do/do not do

    1

    3답변

    HTML 페이지에서 텍스트 블록을 추출하려면이 작업을 위해 보일러 파이프를 사용하고 있습니다. 그것은 페이지의 한 텍스트에 대해 잘 작동하지만, 블로그와 같은 일부 페이지는 페이지에 여러 텍스트를 가지고 있습니다. 나는 모든 텍스트를 추출하길 원하지만 각 텍스트를 하나의 텍스트가 아닌 별개의 텍스트로 식별하려고합니다. 이 작업을 수행 할 수있는 라이브러리가