큰 데이터 세트 (1GB의 순수 압축 텍스트)가 있습니다.큰 데이터 세트를 조작하기위한 언어 또는 도구를 권장하십시오.
는 지금은 예를 들어, 데이터의 정보를 기반으로 데이터 집합을 다시 작성 해요 :
- 전원을 켜고 2009-10-16을 일이 발생 횟수와 시간을 카운트
- 금요일 에 그들이 마지막으로
지금 자바에서이 모든 작업을하고 있습니다. 나는이 유형의 일을하기 위해 실제로 설계된 도구 나 언어를 아는 사람이 있는지 궁금합니다. Java에서는 가능하지만 많은 보일러 플레이트 코드를 작성하고 있습니다.
Perl/PHP/Python 전쟁에서 어떤 위치를 차지하고 있더라도 텍스트 조작은 Perl이 실제로 두드러지는 영역입니다. – mob