2017-04-04 6 views
0

제안 사항은 내 프로젝트에 큰 도움이 될 것입니다.아마존 빙하 - 접두어 기반 파일 검색

장기간 보관을 위해 Amazon 빙하를 사용하여 크론 작업의 출력을 저장할 계획입니다. 크론 작업 출력은 각 파일 이름 형식 아래이 될 것이다 매일 &에 생성됩니다

03-04-2017-output-1.txt 
03-04-2017-output-2.txt 
04-04-2017-output-1.txt 
04-04-2017-output-2.txt 

이 날짜 접두사를 가진 파일의 통합은 하나의 파일을 검색 할 수 있습니까? 예를 들어, 03-04-2017에 생성 된 파일을 검색하려고하므로 03-04-2017-output-1.txt, 03-04-2017-output-2.txt를 포함하는 하나의 zip 파일 가능합니까? 파일 이름을 기반으로 파일을 선택하고 검색 하시겠습니까?

AWS 아마존 빙하의 문서를 방문하여 MB를 기반으로 파일 이름을 기반으로 검색 할 수있는 범위 검색에 대해 알고 있었습니까?

+1

당신이하고있는 일을 꽤 확신하지 않는 한, 글래스를 사용하지 마십시오. 파일을 검색하는 방법을 살펴보면 빙하 뒤에 숨겨진 비용을 알 수 없을 것입니다. 스토리지 요구 사항을 추정 한 다음 표준 및 IA에서 S3 가격을 읽어보십시오. 여기에 다른 사람들 "수업"을 배우는 것이 좋습니다 -> https://medium.com/@karppinen/how-i-ended-up-paying-150-for-a-single-60gb-download- from-amazon-glacier-6cb77b288c3e – mootmoot

+0

안녕하세요 @mootmoot, 경고 해 주셔서 감사합니다. 아마존의 빙하에 대해 염두에 두십시오. 업로드 및 다운로드 비용. 아직도 장기간 보관을 위해 빙하를 선택했으나 자주 액세스하지 않았습니다. 검색하는 동안 파일 이름을 기준으로 파일을 통합하는 모드가 가능한지 여부를 알고 있습니까? – DPK

답변

0

zip 파일 안에 파일 저장소를 언급 했으므로 모든 저장소 서비스와 관련이 없습니다. ZIP 내용을 파기하면 CPU 리소스가 낭비되고 위험한 행위 (예 : 아카이브 폭탄/우편 폭탄)가 발생하기 때문입니다.

저장된 개체를 직접 처리해야합니다.

IMHO, 가장 좋은 방법은 S3 storage inventory을 만드는 것입니다. 압축 된 로그 파일에 적절한 날짜/접두사 접두사/접미어가 지정되어 있는지 확인하십시오. 중간 표준 내용을 S3 표준 및 표준 IA 저장소에 저장하려는 경우에도 유용합니다. AWS Glacier FAQ

Q에 의해 언급 한 바와 같이

: 나는 아마존 빙하에 저장 한 내용을 아카이브 내가 볼 수 있을까요?

예. Amazon Glacier에 업로드 데이터의 고유 인덱스를 유지해야하지만 볼트의 모든 아카이브의 인벤토리는 재해 복구 또는 간혹 조정 목적으로 유지 관리됩니다. 볼트 인벤토리는 하루에 한 번 약 번 업데이트됩니다. 볼트 인벤토리를 JSON 또는 CSV 파일로 요청할 수 있으며, 크기, 생성 날짜 및 보관 파일 설명 (업로드 중에 을 제공 한 경우)을 포함하여 보관소의 보관 파일에 대한 세부 정보가 포함됩니다. 인벤토리는 최신 인벤토리 업데이트 당시의 볼트가 인 상태를 나타냅니다.