2014-12-08 5 views
0

:GSA - 문서를 마지막으로 수정 한 날짜 (PDF/DOC 등) GSA의 문서에 따르면

PDF or XPS documents typically have metadata such as: 
<MT N="CreationDate" V="D:20040107111105Z"/> 
<MT N="ModDate" V="D:20040209162220+01'00'"/> 
The search appliance can automatically pick up these formats without any special formatting configuration. 

그러나 불행하게도이 작동하지 않는 것 같습니다. Google 사이트에는 PDF, DOC 및 기타 파일이 있으며 최종 수정 날짜는 GSA 검색 결과의 해당 <MT> 항목에 표시됩니다. 그러나 <FS NAME="date">에는 공백 값이있어 GSA가 날짜를 추출 할 수 없음을 나타냅니다. GSA 콘솔의 '문서 날짜'페이지에서 날짜 형식을 지정해도 도움이되지 않습니다.

GSA가 문서의 마지막 수정 날짜를 "확인"하는 방법은 무엇입니까? 참고 : 우리의 경우 (AEM 발송자/캐싱 간섭)가 올바르지 않기 때문에 웹 서버의 마지막 수정 HTTP 헤더 값을 사용할 수 없습니다.

답변

0

GSA는 문서 속성에서 메타 데이터를 추출 할 수 있지만 GSA가 해당 ModDate/CreationDate를 사용하여 <FS NAME="date">을 "문서 날짜"구성없이 채울 수 있는지 확실하지 않습니다.

"이 경우에는 웹 서버의 마지막으로 수정 된 HTTP 헤더 값을 사용할 수 없으므로 사용할 수 없습니다." 귀하의 웹 서버가 잘못된 값을 가진 마지막으로 수정 된 헤더를 반환하고 있다는 것을 의미합니까?

최종 수정 된 응답 헤더가 GSA의 다른 모든 메타 데이터보다 우선합니다. 따라서 서버가 올바른 값을 반환 할 수없는 경우 응답에서 Last-Modified 헤더를 제거해야합니다.

문서 날짜 아래에서 형식을 지정하는 동안 java Simpledateformat (yy-MM-dd)을 사용하는 사람이 많았지 만 GSA는 strptime 형식 만 이해할 수 있습니다. GSA가 <FS NAME="date">을 채우지 못하는 주된 이유 중 하나입니다. 따라서 strptime에 날짜 형식을 사용해야하며 필수 필드가 아니므로 빈칸으로 두십시오.

+0

감사합니다. Mohan. 예, 웹 서버는 실제 날짜가 아닌 캐시 된 버전이기 때문에 잘못된 날짜를 반환합니다. 그리고 네, 우리는 헤더 수정 아파치 아파치에서 마지막 수정을 억제하기 위해 이러한 문서에 대한 설정을 완료했습니다. 문서 날짜 설정을 시도했지만 (원본 게시물도 노트로 사용) GSA는 여전히 날짜를 인식하지 못합니다. ModDate에 초, 시간대 등이 있고 GSA에서 시간 필드 (HH)까지만 표현할 수 있기 때문일 수 있습니다. 어떤 경우 든이 구성은 다른 파일 형식 (DOC 등)이 있기 때문에 실행 가능한 솔루션이 아닙니다. – Vasan