인구 통계국의 population projections에서 2060 년까지의 기사를 작성하고 있는데 압축되지 않은 상태에서 3.3MB의 .csv 파일로 구성되어 있습니다.이론적 텍스트 파일의 크기 계산
파일은 537,781 개의 값으로 구성되며 각 값은 5-7 자리이며 3,455,372자를 차지합니다. 파일을 gzip으로 압축하면 1550063 바이트 (1.47MB)가됩니다.
나는 그것이 3.5 인치 플로피에 들어갈 수 있다고 진실되게 말하고 싶다. 최대 용량은 1.44 MB이다. 이것은 참조 포인트 일 뿐이며, 그렇게하는 방법에 대한 지침이 필요한 사용자에게는 조언이 아닙니다.
위의 문자 수를 기준으로 텍스트 파일의 이론적 크기를 계산하는 방법이 있습니까? 우리가 실제로 3.5 인치 플로피와 드라이브를 가지고 있다면 정보 손실없이이 파일을 디스크에 저장할 수 있습니까? 감사!
엔트로피를 계산하는 것이 가능합니다 (자동화해도 꽤 쉽습니다). 하나는 파일의 전체 내용을 검사해야합니다. (값의 범위를 알면 과대 평가 될 수 있습니다 : 가장 작은 값과 가장 큰 값은 무엇입니까?) – delnan
가장 작은 값은 0이고 최대 값은 420267733 여기에서 계산 된 값 https://gist.github.com/4287201 –