2016-09-22 4 views
3

전체 CRAN 저장소를 다운로드하는 데 필요한 공간은 얼마입니까? 모든 파일을 압축 한 상태로 유지하면 모든 패키지를 보유한 폴더의 크기는 얼마나됩니까? 이 질문에 대한 명확한 답을 찾을 수 없습니다. 3GB에 대해 읽었지만 200GB에 도달했습니다. 내 댓글 당전체 CRAN 저장소를 다운로드하는 데 필요한 공간은 얼마입니까?

+3

_real_ 답변은 "의존적"입니다. 소스 만 원하십니까? 하나 또는 소수의 플랫폼 용 바이너리? 전체 또는 부분 기록? HTML 파일? 회계 RDS 파일? 역사적인 현재 R 소스? CRAN의 repo를 로컬로 가질 수 있도록 CRAN을 미러링 할 필요는 없습니다. 나는 커스텀'rsync' 설정 (매일)을 가지고 있으며, pkg 소스, macOS 바이너리, 풀 R 소스, 모든 HTML (CRAN 체크 포함)과 다른 비트들과 미러링하기로 선택한 부분 집합에 대해 60GB 미만의 디스크를 가지고있다. . – hrbrmstr

답변

5

:

rsync -rtlzv --delete cran.r-project.org::CRAN/bin/macosx/mavericks/contrib/3.2/ /cran/bin/macosx/mavericks/contrib/3.2/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/bin/macosx/mavericks/contrib/3.3/ /cran/bin/macosx/mavericks/contrib/3.3/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/doc/ /cran/doc/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/bin/macosx/tools/ /cran/bin/macosx/tools/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/web/ /cran/web/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/src/ /cran/src/ 
rsync -tlzv --delete -a --include="NEWS" --include="*.shtml" --include="*.html" --include="*.pkg" --include="*.dmg" --include="*.gz" --exclude="*" cran.r-project.org::CRAN/bin/macosx/ /cran/bin/macosx/ 
rsync -tlzv --delete -a --include="*.html" --include="*.shtml" --include="*.svg" --include="*.png" --exclude="*" cran.r-project.org::CRAN/ /cran/ 
rsync -rtlzv --delete cran.r-project.org::CRAN/src/contrib/PACKAGES.gz /cran/src/contrib/PACKAGES.gz 

(rsync 제표의 최적화 된 세트하지 않은) 아주 잘 내 모든 시스템을 지원하는 매우 완전한 기능을 지역 크랑의 REPO 저를 가져옵니다. 나는이 시스템에서 쓸데없는 일이 없기 때문에 유일한 RESTudio의 미러를 사용하여 테스트를 계속합니다.하지만 리눅스와 macOS 시스템은 pkgs와 완벽하게 작동합니다.

의견에서 말했듯이, 이것은 60GB 미만입니다.

완전히 기능을 발휘하려면 웹 서버를 설치해야하며 PITA는 Apache를 사용하지만 Apache는 1990 년 웹 기술 설정 CRAN을 유지해야합니다. 설정은 독자에게 남겨진 연습 과제입니다.

참고 : 거울을 사용하고 파일 시스템 주변의 너겟을 탐구 할 가치가 있습니다. "회계"및 기타 통찰력을 얻기위한 많은 RDS 파일은 웹 사이트의 1990 년대 HTML 파일에서 시작하지 못합니다.

자신 만의 로컬 미러를 사용하면 정보 누설이 줄어들고 GitHub README.md 배지에 표시되는 ("IMO 매우 정확하지 않은)"# 다운로드 "패키지 수에 기여하지 못하며 제공하지 않는 거울에 대해 개인 정보를 보호합니다 통나무를 보관하지 않거나 돼지 사용량을 채굴하는 것에 부합하지 않습니다.

+0

# 다운로드가 매우 정확하지 않은 이유는 무엇입니까? – pdb

+0

Travis pkg installs (또는 다른 CI 설치)가 포함되어 있는지 확실합니다. 그렇다면 확실히 결과가 왜곡됩니다. 플러스 RStudio만이 아닙니다. – hrbrmstr

+0

R 재단에 사소한 이득을 위해 거대한 대역폭 청구서를 걸어달라고 요청하는 것 같습니다. 왜 그냥 무작위 repos를 사용하지? – pdb