저는 커다란 대학에서 일하고 있으며 대부분 내 부서의 백업 요구 사항은 중앙 네트워크 서비스에서 제공합니다. 그러나 사용자 중 상당수는 의료 이미징 스캔과 같은 대용량 파일 모음을 가지고있어 사용 가능한 중앙 저장소를 초과합니다.사용자 파일 용 Linux 데이터웨어 하우스 시스템?
저는 부서별 리소스를위한 향상된 백업 솔루션을 제공하고자하며 직원들이 이러한 컬렉션을 보관할 수있는 Linux 서버를 설정했습니다. 그러나 거의 액세스하지 않는 대량의 파일에 의해 서버에 저장되는 것을 막을 수 있습니다. 나는이 문제를 다루는 시스템을 가지고 있지만 휠을 재발 명하지 않기를 원합니다.
내 개념 :
- 사용자가 서버에 파일을 복사합니다.
- 예약 된 작업은 별도의 저장 장치에있는 모든 파일의 전체 - - 날짜 복사가 얼마 동안 액세스하지 않은
- 파일입니다 (1TB의 외장 드라이브는 현재이를 위해 책정 입니다) 유지 서버에서 삭제되었지만 드라이브에 남아있어 라이브 환경에 많은 헤드 룸을 유지합니다.
- 간단한 인터페이스는 (아마도 웹 기반)는 사용자가 그들이 필요로하는 사람, 라이브 서버에 저장 드라이브에서 복사 를 요청할 수있는 에서 모든 파일 목록에 액세스 할 수 있습니다. 이메일 개의 파일이 복사되면 알림이 전송됩니다.
이 개념은 PACS (영상 저장 및 통신 시스템) 나는 이전 작업에 대해 들어 있지만 직접 사용하지 않은 기준으로합니다. 이는 비슷한 방식의 "니어 라인"백업을 사용하여 방대한 양의 데이터에 대한 액세스를 제공하는 동시에 네트워크의 다른 부분을 방해하지 않는 시간에 로컬 시스템으로의 전송을 허용합니다. "데이터 보유"가 직접 액세스 쉘빙에서 제시되는 것보다 훨씬 많은 많은 박물관 및 학술 도서관에서 사용되는 것과 유사한 원리입니다.
내 요구 사항에 맞는 간단한 오픈 소스 시스템이 있습니까? 다른 패러다임을 사용하지만 여전히 내 필요에 맞는 다른 시스템이 있습니까?
필자가보기에 이러한 파일 중 일부에는 환자를 식별 할 수있는 정보가 포함되어 있습니다. 그래서 데이터를 클라우드로 내보내는 대신 로컬 서브넷에서 설정하기를 원합니다 (사실 장기 저장소의 암호화는 특히 이동식 드라이브에서 고려해야 할 또 다른 사항입니다). 감사합니다. – basswulf
아, 전 med에서 일했는데 환자 데이터는 언급하지 않았습니다. 위와 동일하게 할 것이지만, GPG에있는 모든 파일을 포장하기 전에 포장하십시오. 열쇠가 충분하면 안전해야합니다. 또는 HDFS. 지금 대답을 업데이트 중입니다. – mixonic