text-processing

5열

4답변

매우 큰 파일을 처리하는 프로그램이 있습니다. 이제 처리 진행 상황을 보여주는 진행률 막대를 표시해야합니다. 이 프로그램은 단어 단위로 작동하고 한 번에 한 줄씩 읽으며 단어 단위로 나누어 하나씩 처리합니다. 따라서 프로그램이 실행되는 동안 처리 된 단어의 수를 알 수 있습니다. 여하튼 파일의 단어 수를 미리 알고 있다면 쉽게 진행 상황을 계산할 수 있습니

6열

4답변

큰 텍스트 파일 처리

Mathematica에서 느린 로딩을 구현해야합니다. 나는 600 MB CSV 텍스트 파일을 처리해야합니다. 이 파일은 중복 기록이 많이 포함되어 메모리에 그들 모두를로드하는 그래서 그 대신 1;0;0;13;6 1;0;0;13;6 .......... 2;0;0;13;6 2;0;0;13;6 .......... etc. 를, 나는 기록이 레코드가

0열

2답변

내가 변수에서 동적 링크 빌드가 특정 단어

후 텍스트를 제거 : /쉬/매트/BlackHyper/블랙/건메탈 나는 변수 값 "BlackHyper"후 모든 텍스트를 제거하는 방법 이 될 : "/ 쉬/매트/BlackHyper" 을 나는 RTRIM 시도 : $ param = "BlackHyper"; $ str = "/ 팅클/매트/BlackHyper/Black/Gunmetal"; rtrim ($ str, $

0열

2답변

html 선택 목록에서 선택

-2열

3답변

텍스트에서 단어/숫자 제거

텍스트가 있는데 모든 행에서 마지막 3 단어를 제거하고 싶습니다. 어떻게 할 수 있습니까? 이 매우 구체적인 설명을

1열

3답변

MySQL에서 직렬 텍스트 파일 읽기 성능에 가깝습니다.

파이썬에서 n 그램 계산을하려고하는데 내 텍스트 데이터 구성에 MySQL (MySQLdb 모듈)을 사용할 수 있다고 생각했습니다. 고유 숫자 ID (자동 증가) 및 언어 varchar 필드 (예 : "en", "de", "es"등)로 인덱싱 된 문서를 나타내는 약 10mil 레코드가 꽤 큽니다. ..) select * from table은 너무 느리고 메모

4열

3답변

`find`와 비슷한 출력을`tree`와 같은 출력으로 변환합니다.

이 질문은 Output of ZipArchive() in tree format 질문의 일반화 된 버전입니다. 누군가가 이미 쓴 경우, 나는이 (* nix에서 스크립트 명령 줄) 유틸리티 작성에 시간을 낭비하고 직전 , 찾아 좋은 생각이 될 것입니다. 입력 : /fruit/apple/green /fruit/apple/red /fruit/apple/yell

2열

1답변

Gmail/Facebook은 상황에 맞는 광고를 게재하기 위해 어떤 알고리즘을 사용합니까?

Gmail은 이메일 텍스트 오른쪽에있는 열에 정말 좋은 광고를 게재합니다. 페이스 북도 마찬가지다. Facebook에 표시되는 광고는 종종 나에게 관심사와 관련이 있습니다. 분명히 그들은 이용 가능한 정보를 전처리한다. Gmail은 내 이메일의 텍스트를 스캔하고 키워드를 추출한 다음 관련 광고를 게재합니다. Facebook에서도 마찬가지입니다. 그들에게는

0열

1답변

ANTLR은 텍스트 보고서를 분석하는 데 적합합니까?

현재 다양한 정보 비트를 추출하기 위해 정규식을 사용하여 텍스트 보고서를 구문 분석하고 있습니다. 이 접근 방식이 작동하는 동안 정규 표현식을 유지하는 것이 점점 어려워집니다. Antlr이 장기적으로 작업을 수행하는 더 좋은 방법을 제공 할 수 있는지 궁금합니다. BTW, 전 Antlr을 사용하지 않았습니다. AFAIK, Antlr은 주로 구문 분석에 사용

0열

1답변

고정 폭 글꼴이 아닌 단어 줄 바꿈에 대한 트릭이 있습니까?

비 고정 폭 글꼴의 줄 바꿈을 구현하는 데 어려움을 겪고 있습니다 (글꼴이 다를 수 있음). 나는이 모든 것을 시도했지만 해결책을 찾지 못했습니다. 어떤 팁?