text-processing

    5

    4답변

    매우 큰 파일을 처리하는 프로그램이 있습니다. 이제 처리 진행 상황을 보여주는 진행률 막대를 표시해야합니다. 이 프로그램은 단어 단위로 작동하고 한 번에 한 줄씩 읽으며 단어 단위로 나누어 하나씩 처리합니다. 따라서 프로그램이 실행되는 동안 처리 된 단어의 수를 알 수 있습니다. 여하튼 파일의 단어 수를 미리 알고 있다면 쉽게 진행 상황을 계산할 수 있습니

    6

    4답변

    Mathematica에서 느린 로딩을 구현해야합니다. 나는 600 MB CSV 텍스트 파일을 처리해야합니다. 이 파일은 중복 기록이 많이 포함되어 메모리에 그들 모두를로드하는 그래서 그 대신 1;0;0;13;6 1;0;0;13;6 .......... 2;0;0;13;6 2;0;0;13;6 .......... etc. 를, 나는 기록이 레코드가

    0

    2답변

    후 텍스트를 제거 : /쉬/매트/BlackHyper/블랙/건메탈 나는 변수 값 "BlackHyper"후 모든 텍스트를 제거하는 방법 이 될 : "/ 쉬/매트/BlackHyper" 을 나는 RTRIM 시도 : $ param = "BlackHyper"; $ str = "/ 팅클/매트/BlackHyper/Black/Gunmetal"; rtrim ($ str, $

    0

    2답변

    <option>s을 다음 HTML 양식 <select>에서 선택할 수있는 방법이 있나요? [ 'a', 'b', 'c', 'd'] ? <select name="sel"> <option value="a">a</option> <option value="b">b</option> <option value="c">c</option>

    -2

    3답변

    텍스트가 있는데 모든 행에서 마지막 3 단어를 제거하고 싶습니다. 어떻게 할 수 있습니까? 이 매우 구체적인 설명을

    1

    3답변

    파이썬에서 n 그램 계산을하려고하는데 내 텍스트 데이터 구성에 MySQL (MySQLdb 모듈)을 사용할 수 있다고 생각했습니다. 고유 숫자 ID (자동 증가) 및 언어 varchar 필드 (예 : "en", "de", "es"등)로 인덱싱 된 문서를 나타내는 약 10mil 레코드가 꽤 큽니다. ..) select * from table은 너무 느리고 메모

    4

    3답변

    이 질문은 Output of ZipArchive() in tree format 질문의 일반화 된 버전입니다. 누군가가 이미 쓴 경우, 나는이 (* nix에서 스크립트 명령 줄) 유틸리티 작성에 시간을 낭비하고 직전 , 찾아 좋은 생각이 될 것입니다. 입력 : /fruit/apple/green /fruit/apple/red /fruit/apple/yell

    2

    1답변

    Gmail은 이메일 텍스트 오른쪽에있는 열에 정말 좋은 광고를 게재합니다. 페이스 북도 마찬가지다. Facebook에 표시되는 광고는 종종 나에게 관심사와 관련이 있습니다. 분명히 그들은 이용 가능한 정보를 전처리한다. Gmail은 내 이메일의 텍스트를 스캔하고 키워드를 추출한 다음 관련 광고를 게재합니다. Facebook에서도 마찬가지입니다. 그들에게는

    0

    1답변

    현재 다양한 정보 비트를 추출하기 위해 정규식을 사용하여 텍스트 보고서를 구문 분석하고 있습니다. 이 접근 방식이 작동하는 동안 정규 표현식을 유지하는 것이 점점 어려워집니다. Antlr이 장기적으로 작업을 수행하는 더 좋은 방법을 제공 할 수 있는지 궁금합니다. BTW, 전 Antlr을 사용하지 않았습니다. AFAIK, Antlr은 주로 구문 분석에 사용

    0

    1답변

    비 고정 폭 글꼴의 줄 바꿈을 구현하는 데 어려움을 겪고 있습니다 (글꼴이 다를 수 있음). 나는이 모든 것을 시도했지만 해결책을 찾지 못했습니다. 어떤 팁?