hyperloglog

    0

    2답변

    많은 수십만 개의 키가있는 Redis 데이터베이스가 있습니다. 시간이 지남에 따라 내가 쓰고 읽은 키가 변경되어 더 이상 사용하지 않는 키가 많이 있습니다. 대부분 TTL도 없습니다. Redis 데이터베이스에있는 키의 몇 퍼센트가 더 이상 사용되지 않는지 알고 싶습니다. 나는 hyperloglog를 사용하여 쓰여지는 키의 수의 카디널리티를 추정 할 수 있다

    1

    1답변

    1 2 3 및 3 4에는 3 및 2 고유 항목이 있습니다. 이제 병합 된 세트의 고유 항목을 계산해 봅시다. 카운터 3 + 2 = 5을 합산하면 잘못 될 것입니다 (uniq(1 2 3 3 4) = 4이어야합니다). 카운터를 사용하는 할 방법이 있습니까? 각 카운터에 대해 상수 메모리 데이터 구조를 나타내는 추가 데이터를 사용하는 것이 좋습니다. 작은 오류도

    0

    1답변

    나는 antirez.com과 Wikipedia 그리고 HLL이 무엇이고 어떻게 작동하는지에 대한 다른 출처를 읽었지 만, "Leading Zeroes"이라는 용어를 사용할 때마다 나는 비틀 거린다. HyperLogLog에 관해 이야기 할 때 그것이 무엇을 의미하는지 설명하십시오.

    0

    3답변

    해시의 비트 패턴에 k가 0 인 경우 예상 크기가 2 k + 1 인 것으로 간주되는 이유는 무엇입니까? 2가 아니면 안된다 k? 앞에 0 (k)를 갖는 확률은 I는 K 대신에 K + 1을 사용하는 경우 항상 크기의 정확한 추정을 얻는 1/(2 K)하고, 따라서 크기 내 코드 2 K 이어야되어야 . 그러나 나는이 논리 뒤에있는 논리를 이해하지 못한다.

    0

    1답변

    시간 범위 (시간 단위)에 걸쳐 앱의 순 방문자수를보고하려는 유스 케이스가 있습니다. 예 : 0시에 {A, B, C, D}의 방문자를 추적했으며 시간 1에 {C, D, E, F}가 있다고 가정하고 2시에는 {E, F, A , B} 그리고 3시에는 {A, C}가 있습니다. 1 시간에서 3 시간 사이에 몇 명의 순 방문자가 있었는지에 대한 답변을해야하며 동시에

    2

    1답변

    내가 메시지를 카운트하는 redis에서 메시지를 삭제할 수있는 규정이 있는지를 봅시다.

    0

    1답변

    HyperLogLog 알고리즘을 구현하여 다양한 잠재 고객 세그먼트 (또는 필터)의 개별 사용자 수를 계산하려고합니다. 나는 사용자 카산드라 + 스파크 배치. Cassandra가 HyperLogLog 유형을 지원하는지 궁금합니다. 좋은 시도이지만 끝나지 않은 http://vilkeliskis.com/blog/2013/12/28/hacking_cassandr

    0

    1답변

    레디 스 및 MongoDB를 (HyperLogLog) - { "_id" : ObjectId("58114e5e43d6420b7db4e15c"), "browser" : "Chrome", "name": "hyades", "country" : "in", "day" : "16-10-21", "ip" : "0.0.

    0

    1답변

    고유 방문자에 대해보고 할 수 있어야하지만 모든 가능한 순열을 미리 계산하지 않고 여러 테이블을 만드는 것을 피하십시오. 단순한 예를 들어 ,이 전 다음과 같은 열이 날짜 (월/년) country_id 페이지 ID가있는 테이블에 월간 순 방문자수를보고해야 가정 해 봅시다 는을 device_type_id monthly_uniques 드루이드 (Druid)와

    0

    1답변

    주어진 키의 고유 값을 계산하려면 Redis 구현을 사용하고 있습니다. 키는 시간 창을 기반으로합니다. 달력 시간이 변경되면 들어오는 값의 수를 재설정하려고합니다. Jedis를 통해 값을 '지우는'API를 직접 볼 수 없습니다. SET는 해시를 손상시킬 수 있으므로 여기에서 사용할 수 없습니다. 특정 키의 수를 정확하게 "재설정"할 수있는 방법이 있습니까?