on-disk

    0

    4답변

    색인화 할 파일 (구체적으로는 fasta 파일)이 있으므로 파일 내의 하위 문자열을 빠르게 찾은 다음 원래 fasta 파일 내의 위치를 ​​찾을 수 있습니다. 많은 경우에 Trie 또는 하위 문자열 배열을 사용하면 쉽게 처리 할 수 ​​있습니다. 불행히도 색인을 생성해야하는 문자열은 800MB 이상이므로 메모리에서 허용되지 않는 방식으로 처리하므로 합리적인

    5

    2답변

    필자는 약 5 억 개의 128 비트 정수를 가지고 있으며 연간 약 100M을 더합니다. 아무것도 삭제되지 않습니다. 숫자는 규모와 시간에 따라 균일하게 분포합니다. 기본적으로 DB에 번호가 이미 있는지 여부를 반환하는 추가 작업이 필요합니다. 또한이 시스템에 너무 많은 RAM을 사용하고 싶지 않으므로 모든 것을 메모리에 저장하는 것이 내가 원하는 것이 아닙

    6

    3답변

    누구나 B + Tree 온 디스크 구현을 어디에서 찾을 수 있는지 알고 있습니까? 나는 Google을 통해 앞으로 그리고 뒤로 갔고 불행하게도 나는 현명한 것을 찾지 못했습니다. 다른 스레드는 아마도 sqlite, sqljet 또는 bdb에서 트리를 가져올 것을 제안했지만이 트리는 전체 데이터베이스에 중첩되어 있으므로 B + 트리를 실제로 "그냥"필터링 할

    37

    4답변

    STL을 사용하여 알고리즘을 개발하는 것을 즐긴다. 그러나 데이터 세트가 힙에 비해 너무 큰 반복 문제가 발생한다. 디스크 기반의 STL 컨테이너 및 알고리즘, 즉 힙이 아닌 디스크에 저장된 데이터 구조의 드롭 인 대체를 검색했습니다. 친구가 최근에 나를 stxxl으로 지적했습니다. 너무 복잡해지기 전에 다른 디스크 기반 STL 대체품을 고려해야합니까? 참

    2

    4답변

    많은 수의 정수를 저장해야합니다. 정수의 입력 스트림에 중복이있을 수 있습니다. 그 중 하나를 구분하기 위해서는 이 필요합니다. 처음에는 stl 세트를 사용했지만 정수가 너무 많이 입력되면 OutOfMem이 발생했습니다. 은 아마도 상기 요구 사항과 함께 번호를 저장할 수있는 C++ 컨테이너 라이브러리를 찾고 있습니다. 즉, 컨테이너가 모든 번호를 유지하려