나는 루트에서 리프로 트리를 가로 지르고 기호가 나타나는 횟수에 따라 # = 000011이라는 인코딩 예제를 얻는 우선 순위 큐를 사용하여 Java에서 허프만 인코딩 알고리즘을 구현했습니다 입력에. 모든 것이 잘되고, 나무가 잘 짜여지고 인코딩은 예상대로 진행됩니다. 그러나 출력 파일은 원래 파일보다 더 커집니다. 나는 현재 '0'을 &에 추가하고 있습니다
나는 주식 시장 데이터를 어쨌든 압축하는 작업을하고 있습니다 ... 데이터는 파일에 저장되어있어 매일의 주가가 한 줄로 표시되는 등 매우 큰 파일입니다. 예 123.45 234.75 345.678 889.56 ..... 지금 질문 허프만 같은 표준 알고리즘을 이용하여 데이터를 압축 (일명 리던던시를 감소)하는 방법은 또는 산술 코딩 또는 LZ 코딩 ...
file = BZ2File(SOME_FILE_PATH)
p = xml.parsers.expat.ParserCreate()
p.Parse(file)
다음은 bz2로 압축 된 xml 파일을 구문 분석하는 코드입니다. 불행하게도 그것은 메시지와 함께 실패합니다 즉시 압축 BZ2 XML 파일을 구문 분석 할 수있는 방법이 TypeError: Parse()
가능한 중복 : 절대적으로 엄청난 될 Programming Logic: Finding the smallest equation to a large number. 나는 알레프 - 널 세트에서 임의의 수 (모든 양의 정수)를 취할 것 알고리즘을 찾고 있어요 (가능성) 계산 가능한 숫자가 표현하려고하는 정수 값보다 적은 공간을 차지한다면 (특히 부동 소수점이 아닌
새로운 호스트의 서버에 업로드해야하는 큰 디렉토리가 있는데, 그렇게 큰 디렉토리 (32GB)를 전송하지 않았기 때문에, 제가 누락 된 것이 있는지 궁금합니다. 이제 가장 좋은 방법은 zip 파일로 압축하고 서버에 업로드 한 다음 압축을 푸는 것입니다. 그러나 어떤 이유로 든 내 zip 파일은 여전히 약 32GB입니다! 나는 이미 파일 업로드를 시도했으며
C++에서 비트셋을 파일 (아마도 iostream을 사용하여)로 쓰는 공간을 절약 할 수 있는지 궁금합니다. 비트 셋을 비트 8의 크기로 분해 한 다음 각 개별 비트 세트를 파일에 쓰면 공간이 절약됩니까? 이것에 대한 당신의 생각은 무엇입니까? 이것은 데이터 압축의 의도입니다.
lighttpd/php5 서버에서 가장 좋은 방법은 내 웹 페이지의 html 소스를 gzip으로 만들고 싶습니다. zlib.output_compression = On
zlib.output_handler = On
하지만 단지 투명 압축 될 것으로 보인다 : 나는 내 php.ini 파일을 편집하여 그것을 할 노력했다.