내 데이터베이스에 PDF 파일에 대한 BLOB 데이터가 있습니다. 유효한 Blob 파일이 유효한 PDF 파일인지 확인하고 싶습니다. 일부 도움말 나를 위해.바이트 배열을 검사하는 방법은 유효한 pdf 파일 또는
0
A
답변
2
모든 pdf 파일은 magic number 25 50 44 46 (ASCII로 된 % PDF)로 시작합니다.
+0
4 바이트가 나머지를 올바른 PDF 파일 *로 분류합니까? – Sinatr
+3
@Sinatr * 모든 것을 * 읽으 려하지 않으면 알 수 없습니다. –
+2
'유효한'PDF 파일이 무엇인지 전혀 알지 못합니다. 파일의 시작 부분에있는 매직 번호는 그것이 PDF 파일임을 나타냅니다. –
PDF로 작업하는 라이브러리 중 하나를 사용해 볼 수 있습니다. 파일을 열 때 (바이트) 또는 작업 중 하나를 수행하는 동안 (예 : 마지막 페이지에서 마지막 문자열 가져 오기) PDF가 PDF가 아닌 경우 throw됩니다. – Sinatr