UTF-8로 변환하려는 Windows-1252 단어 문서가 있습니다. doc 파일을 pdf로 올바르게 변환하려면이 작업을 수행해야합니다. 이것은 내가 현재 그것을 할 방법은 다음과 같습니다 그러나문자를 올바르게 표시하지 않는 변환 된 워드 문서 (Windows-1252에서 UTF-8까지)
Path source = Paths.get("source.doc");
Path temp = Paths.get("temp.doc");
try (BufferedReader sourceReader = new BufferedReader(new InputStreamReader(new FileInputStream(source.toFile()), "windows-1252"));
BufferedWriter tempWriter = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(temp.toFile()), "UTF-8"))) {
String line;
while ((line = sourceReader.readLine()) != null) {
tempWriter.write(line);
}
}
, 내가 Word에서 변환 된 파일 (temp.doc
)을 열 때, 올바르게 일부 문자를 표시하지 않습니다. Ü은 예를 들어 ¼이 될 것입니다.
어떻게 해결할 수 있습니까? 새로운 BufferedReader (UTF-8 인코딩 사용)를 만들고 temp
을 읽으면 문자가 IDE의 콘솔에 올바르게 표시됩니다.
사이드 댓글 :'Files.newBufferedReader'와'Files.newBufferedWriter'를 사용하면 코드가 훨씬 간단 해집니다 :) –