text-processing

    20

    3답변

    날씨에 관한 질문을하기위한 프로그램을 작성하고 싶습니다. 무엇을보고 시작해야 할 알고리즘과 기법이 있습니까? 예 : 시카고에서 이번 주말 날씨가 맑을까요? 의도를 알고 싶습니다. = 날씨 쿼리 날짜 = 이번 주말, 위치 = 시카고입니다. 사용자는 여러 가지 형태로 동일한 쿼리를 표현할 수 있습니다. 제한된 양식을 해결하고 시작하는 방법에 대한 아이디어를 찾

    0

    2답변

    내 응용 프로그램 용 WYSYWIG JavaScript HTML 편집기를 찾고 있습니다. I`ve 이미 this 목록에서 예를 들어, 그들 중 일부를 시도했지만 일부는 ... 요구 사항 몇 가지 기본 기능을 누락 너무 복잡하고 있습니다 그것은의 최신 안정 버전과 함께 작동합니다 : 모질라 파이어 폭스, 구글 크롬, 오페라, 인터넷 익스플로러 (그리고 애플

    0

    3답변

    좋아 내가 처리하고있어 자바 클래스와 searchlogs,하지만 난 로그에서 까다로운 부분 우연히 어떤 점에서 : 일반적으로 로그 라인은 다음과 같이 : 217 yahoo.com 2006-05-16 16:35:31 첫 번째 숫자는 사용자 ID이고, 그 이후의 문자열과 그 이후의 시간 소인입니다. 지금까지 그렇게 좋았습니다. 나는 사용자 ID를 추출하고

    -2

    1답변

    나는 기본적으로 내 프로젝트의 트윗을 처리하고있다. 나는 이모티콘을 분리하려고 시도하고 있는데, 별도의 배열에 저장하면 (더 처리해야하는 짹짹에서 제거함). 아무리 노력해도 문자열에서 < 3을 감지 할 수 없습니다. str_replace() 또는 preg_replace()도 작동하지 않는 것 같습니다. 나는 '<'기호의하는 substr_count가 ($ S

    1

    2답변

    , 즉 bla bla bla ###FOO WORLD### bla bla bla bla bla bla ###FOO BOB###, ###FOO ALICE###bla bla bla 같은 몇 가지 패턴을 포함 할 수 찾아 간단한 패턴 주위를 대체하는 것은 bla bla bla HELLO WORLD bla bla bla bla bla bla HELLO BOB

    1

    3답변

    I의 데이터 만 몇 줄의 파일을 가지고, 각 라인은 같은 것입니다 : a:b:c:d 그래서 예를 들면 : 나는 하나 개의 파일에 모든의를 얻으려면 0.0:2000.00:2000.04:2000.02 , b 두 번째 파일 등 어떻게?

    6

    1답변

    단어 삭제 (stop frequency) 및 형태소 분석 (stemming)의 영향을받는 용어 빈도 (frequency frequency, TF)와 역 문서 빈도 (inverse document frequency, IDF)는 어떻게됩니까? 감사합니다.

    0

    1답변

    영어 문장의 구문 분석 구문 (구문 구문 분석의 압축 된 형식)에서 구문 분석 트리 (Java 개체)를 생성하려고합니다. 나는 같은 것을 위해 자바를 사용하고 있으며 효율적인 트리도 정의 할 필요가있다. 예 : 설명을 : (ROOT (S (NP (PRP I)) (VP (MD would) (VP (VB love) (S (VP (TO to) (VP (VB go

    0

    1답변

    내가 이맥스와 HTML 파일의 무리를 프로세스에게 문자 메시지를 보내려, 그래서 수행 find . -type f -name "*.html" | while read myFile; do emacs emacs --no-site-file --no-init-file --batch \ -script myScript.el --find-file "$my

    0

    1답변

    나는 이메일 세트를 텍스트 파일에 가지고있다. 나는 그것에서 몸을 추출하고 싶다. 샘플 문서는 다음과 같습니다. Email: 1 =============== MIME-Version: 1.0 Received: by 10.68.8.6 with HTTP; Sat, 7 Apr 2012 01:04:45 -0700 (PDT) Date: