2017-05-15 7 views
0

텍스트 파일의 줄을 버퍼로 읽어 들이고 버퍼가 가득 차면 줄을 출력하여 모든 줄이 버퍼를 통과 한 후에 출력이 부분적으로 정렬되도록합니다.텍스트 줄의 점 식별

출력은 블록 블록으로 표시되므로 각 블록의 끝을 출력으로 표시해야합니다. 출력은 텍스트의 줄이므로 텍스트에 어떤 문자가 포함될 수 있으므로 마커로 사용할 문자를 모르겠습니다. 아스키 null 또는 단위 구분 기호를 사용하여 생각하고 있지만 텍스트로있을 수 있기 때문에 이것이 신뢰할 수 있는지 확실하지 않습니다.

+1

문제를 식별하기 위해 시도한 코드를 게시 할 수 있습니다. –

+0

출력 파일에 분리 가능한 "레코드"가있을 경우 텍스트 문서가 아닙니다. 그것은 구조화되어 있습니다. 많은 구조화 된 파일 형식이 있습니다. 텍스트 레코드에 임의의 문자를 허용하면서 레코드를 분리 할 수있는 레코드 하나를 선택하십시오. (BTW-XML은 특정 문자를 허용하지 않기 때문에 직접 사용할 수 없습니다.) 출력 파일에 어떤 특성이 있어야하는지 명확하지 않습니다. 아마도 추가 가능해야 할 필요가 있을까요? 다른 프로그램에서 읽습니까? –

답변

0

당신이 선을 구별하는 방법을 잘 모르는 경우가

Hash<int,Buffer> myMap = new HashMap<>(); 
0

같은 모든 buffergroup 뭔가에 대한 키를 설정할 수 있도록,지도를 사용할 수 있습니다, 당신이 문장 토크 나이 도구를 살펴 보시기 바랍니다 이는 일반적으로 NLP에서 사용됩니다. 이 프로그램에는 선을 구분하는 패턴이 있습니다. 그렇게하면, 당신은 모든 데이트를 보낼 수 있고 사용하는 캐릭터에 대해 걱정하지 않고 라인을 얻을 수 있습니다. 완벽하게 작업을 수행하는 Java 용 라이브러리가 많이 있습니다 (텍스트가 영어로되어 있음).