큰 금액의 부분 집합

subset sum problem은 NP 완성으로 유명하지만 문제의 버전을 다소 빨리 해결할 수있는 다양한 방법이 있습니다.큰 금액의 부분 집합

일반적인 동적 프로그래밍 알고리즘에는 대상 합계가 증가하는 공간이 필요합니다. 내 질문은 : 우리는이 공간 요구 사항을 줄일 수 있습니까?

나는 원소 수가 적지 만 매우 큰 목표 합계로 부분 합계 문제를 풀려고합니다. 지수 시간 알고리즘 (및 shortcut method)에 대해 요소 수가 너무 많고 대상 합계가 일반적인 동적 프로그래밍 방법에 비해 너무 큽니다.

문제를 설명하는 장난감 문제를 생각해보십시오. A = [2, 3, 6, 8] 세트가 주어지면 합계가 target = 11 인 하위 세트 수를 찾습니다. 답을 볼 수있는 모든 하위 집합을 열거하는 것은 2 : (3, 8)과 (2, 3, 6)입니다.

동적 프로그래밍 솔루션

은 물론, 같은 결과를 제공 - ways[11] 반환 2 :

def subset_sum(A, target): 
    ways = [0] * (target + 1) 
    ways[0] = 1 
    ways_next = ways[:] 
    for x in A: 
     for j in range(x, target + 1): 
      ways_next[j] += ways[j - x] 
     ways = ways_next[:] 

    return ways[target]

지금 합 target = 1100 설정 A = [200, 300, 600, 800]을 대상으로 고려한다. 분명히 여전히 2 가지 해결책이 있습니다 : (300, 800) 및 (200, 300, 600). 그러나 ways 어레이는 100 배 증가했습니다.

동적 프로그래밍 스토리지 배열을 채울 때 특정 가중치를 건너 뛸 수 있습니까? 내 예제 문제에 대한 입력 집합의 가장 큰 공통 분모를 계산할 수있는 다음 해당 상수로 모든 항목을 줄일 수 있지만이 내 실제 응용 프로그램에 대해 작동하지 않습니다.

This SO question과 관련이 있지만 이러한 대답은 내가 생각한 접근 방식을 사용하지 않습니다. this page에하기 Akshay에 의해 두 번째 코멘트는 말한다 : n은 매우 작은 수있는 경우에

이 .... (예 : 6)와 합이 매우 큰 다음 공간의 복잡성 것 (예를 들어 100 만.) 너무 큽니다. 큰 공간의 복잡성을 피하려면 HASHTABLES를 사용할 수 있습니다.

이것은 내가 찾고있는 것에 더 가깝지만 실제로 구현할 수없는 것처럼 보입니다. 이게 진짜 가능하니?

덧붙여 편집 : : 해결할 문제의 작은 예. 1 가지 해결책이 있습니다.

target = 5213096522073683233230240000 A = [2316931787588303659213440000, 1303274130518420808307560000, 834095443531789317316838400, 579232946897075914803360000, 425558899761116998631040000, 325818532629605202076890000, 257436865287589295468160000, 208523860882947329329209600, 172333769324749858949760000, 144808236724268978700840000, 123386899930738064691840000, 106389724940279249657760000, 92677271503532146368537600, 81454633157401300519222500, 72153585080604612224640000, 64359216321897323867040000, 57762842349846905631360000, 52130965220736832332302400, 47284322195679666514560000, 43083442331187464737440000, 39418499221729173786240000, 36202059181067244675210000, 33363817741271572692673536, 30846724982684516172960000, 28604096143065477274240000, 26597431235069812414440000, 24794751591313594450560000, 23169317875883036592134400, 21698632766175580575360000, 20363658289350325129805625, 19148196591638873216640000, 18038396270151153056160000, 17022355990444679945241600]

실제 문제가 : 당신이 연결된 특정 의견에

target = 262988806539946324131984661067039976436265064677212251086885351040000 A = [116883914017753921836437627140906656193895584300983222705282378240000, 65747201634986581032996165266759994109066266169303062771721337760000, 42078209046391411861117545770726396229802410348353960173901656166400, 29220978504438480459109406785226664048473896075245805676320594560000, 21468474003260924418937523352411426647858372626711204170357987840000, 16436800408746645258249041316689998527266566542325765692930334440000, 12987101557528213537381958571211850688210620477887024745031375360000, 10519552261597852965279386442681599057450602587088490043475414041600, 8693844844295746252297013588993057072273225278585528961549928960000, 7305244626109620114777351696306666012118474018811451419080148640000, 6224587137040149683597270084426981690799173128454727836375984640000, 5367118500815231104734380838102856661964593156677801042589496960000, 4675356560710156873457505085636266247755823372039328908211295129600, 4109200102186661314562260329172499631816641635581441423232583610000, 3639983481521748430892521260443459881470796742937193786669693440000, 3246775389382053384345489642802962672052655119471756186257843840000, 2914003396564502206448583502127866774917064428556368433095682560000, 2629888065399463241319846610670399764362650646772122510868853510400, 2385386000362324935437502594712380738650930291856800463373109760000, 2173461211073936563074253397248264268068306319646382240387482240000, 1988573206351200938616141104476672789688204647842814753019927040000, 1826311156527405028694337924076666503029618504702862854770037160000, 1683128361855656474444701830829055849192096413934158406956066246656, 1556146784260037420899317521106745422699793282113681959093996160000, 1443011284169801504153550952356872298690068941987447193892375040000, 1341779625203807776183595209525714165491148289169450260647374240000, 1250838556670374906691960338012080744048823137584838292922165760000, 1168839140177539218364376271409066561938955843009832227052823782400, 1094646437211014876720019400903392201607763016346356924399106560000, 1027300025546665328640565082293124907954160408895360355808145902500, 965982760477305139144112620999228563585913919842836551283325440000, 909995870380437107723130315110864970367699185734298446667423360000, 858738960130436976757500934096457065914334905068448166814319513600, 811693847345513346086372410700740668013163779867939046564460960000, 768411414287644482489363509326632509674989232073666182868912640000, 728500849141125551612145875531966693729266107139092108273920640000, 691620793004461075955252231602997965644352569828303092930664960000, 657472016349865810329961652667599941090662661693030627717213377600, 625791330255672395317036671188673352614551016483550865168079360000, 596346500090581233859375648678095184662732572964200115843277440000, 568931977371436071675467087219123799753953628290345594563299840000, 543365302768484140768563349312066067017076579911595560096870560000, 519484062301128541495278342848474027528424819115480989801255014400, 497143301587800234654035276119168197422051161960703688254981760000, 32044045508347054897310957784092466595223632570186240000, 456577789131851257173584481019166625757404626175715713692509290000, 438132122515529069774235170457376054037925971973698044293020160000, 420782090463914118611175457707263962298024103483539601739016561664, 404442609057972047876946806715939986830088526993021531852188160000, 389036696065009355224829380276686355674948320528420489773499040000, 374494562534633427030238036407319297168052779889230688624970240000, 360752821042450376038387738089218074672517235496861798473093760000, 347753793771829850091880543559722282890929011143421158461997158400, 335444906300951944045898802381428541372787072292362565161843560000, 323778155173833578494287055791985197213007158728485381455075840000, 312709639167593726672990084503020186012205784396209573230541440000, 302199145693704480473409550206308504954053507241841138853071360000, 292209785044384804591094067852266640484738960752458056763205945600, 282707666261699891568916593460940582033071824431295083135592960000, 273661609302753719180004850225848050401940754086589231099776640000, 265042888929147215048611399412486748738992254650755607041456640000, 256825006386666332160141270573281226988540102223840088952036475625, 248983485481605987343890803377079267631966925138189113455039385600, 241495690119326284786028155249807140896478479960709137820831360000, 234340660761814501342824380545368657996226388663143017230461440000, 227498967595109276930782578777716242591924796433574611666855840000, 220952578483466770957349011608519198854244960871423861446658560000, 214684740032609244189375233524114266478583726267112041703579878400, 208679870295533683104133831435857945991878646837700655494453760000, 202923461836378336521593102675185167003290944966984761641115240000, 197401994025105141026072179446079922264038329650750423033879040000, 192102853571911120622340877331658127418747308018416545717228160000, 187014262428406274938300203425450649910232934881573156328451805184, 182125212285281387903036468882991673432316526784773027068480160000, 177425404985627474536673746714144021883127046501745489011223040000, 172905198251115268988813057900749491411088142457075773232666240000, 168555556186474170249629649778586749838977769381324948621621760000, 164368004087466452582490413166899985272665665423257656929303344400]

출처

2013-08-25 bbayles

일반적으로 불가능합니다 (또는 적어도 알려진 방법이 없습니다). 그렇지 않으면 NP 완료되지 않습니다. 구체적인 경우에는 작업을 수행하는보다 효율적인 방법이 있지만 데이터 세트에 대한 추가 정보가 없으면 말할 수 없습니다. – Antimony

보통 공간을 감당할 여유가 없으면 시간을 감당할 여유가 없습니다 (시간은'O (numItems * targetWeight)', 메모리는'O (targetWeight)'). 시간을 가질 여유가 있습니까? – IVlad

[이 게시물을 보셨습니까 (http://stackoverflow.com/questions/9809436/fast-solution-to-subset-sum)? – wflynny

, 제안이 실제로 어떤 부분 집합의 합으로 발생하는 경우에만 값을 저장에 해시 테이블을 사용하는 것입니다. 최악의 경우, 이것은 원소의 수에있어서 기하 급수적입니다. 그래서 그것은 여러분이 이미 언급 한 무차별 대입 접근법과 기본적으로 동일합니다.

일반적으로 문제의 두 매개 변수가 있습니다. 집합의 요소 수와 대상 합계의 크기입니다. 정적 인 프로그래밍 솔루션은 두 번째로 기하 급수적입니다.이것은 매개 변수 중 하나가 작 으면 잘 작동하지만 이미 두 매개 변수가 지수 솔루션에 비해 너무 큽니다. 따라서 문제의 "딱딱한"일반적인 경우에 빠져 있습니다.

대부분의 NP 완전 문제에는 암시 적 또는 명시 적인지 여부에 관계없이 일부 기본 그래프가 있습니다. 그래프 분할과 DP를 사용하면 그래프의 트레 위 (treewidth)에서 지수 적으로 만 해결할 수 있지만 그래프의 크기는 다각형 (treewidth)이 일정하게 유지됩니다. 물론 데이터에 액세스 할 수 없으면 기본 그래프가 어떻게 보이는지 또는 treewidths를 제한하는 그래프 클래스 중 하나에 있는지 여부를 말할 수 없으므로 효율적으로 해결할 수 있습니다.

편집 : 방금 mod 작은 숫자를 줄임으로써 무엇을 의미하는지 보여주기 위해 다음 코드를 작성했습니다. 다음 코드는 첫 번째 문제를 1 초 내에 해결하지만 더 큰 문제에서는 작동하지 않습니다 (으로 줄임).

target = 5213096522073683233230240000 
A = [2316931787588303659213440000, 
    1303274130518420808307560000, 
    834095443531789317316838400, 
    579232946897075914803360000, 
    425558899761116998631040000, 
    325818532629605202076890000, 
    257436865287589295468160000, 
    208523860882947329329209600, 
    172333769324749858949760000, 
    144808236724268978700840000, 
    123386899930738064691840000, 
    106389724940279249657760000, 
    92677271503532146368537600, 
    81454633157401300519222500, 
    72153585080604612224640000, 
    64359216321897323867040000, 
    57762842349846905631360000, 
    52130965220736832332302400, 
    47284322195679666514560000, 
    43083442331187464737440000, 
    39418499221729173786240000, 
    36202059181067244675210000, 
    33363817741271572692673536, 
    30846724982684516172960000, 
    28604096143065477274240000, 
    26597431235069812414440000, 
    24794751591313594450560000, 
    23169317875883036592134400, 
    21698632766175580575360000, 
    20363658289350325129805625, 
    19148196591638873216640000, 
    18038396270151153056160000, 
    17022355990444679945241600] 

import itertools, time 
from fractions import gcd 

def gcd_r(seq): 
    return reduce(gcd, seq) 

def miniSolve(t, vals): 
    vals = [x for x in vals if x and x <= t] 
    for k in range(len(vals)): 
      for sub in itertools.combinations(vals, k): 
       if sum(sub) == t: 
        return sub 
    return None 

def tryMod(n, state, answer): 
    t, vals, mult = state 
    mods = [x%n for x in vals if x%n] 
    if (t%n or mods) and sum(mods) < n: 
      print 'Filtering with', n 
      print t.bit_length(), len(vals) 
    else: 
      return state 

    newvals = list(vals) 
    tmod = t%n 
    if not tmod: 
      for x in vals: 
       if x%n: 
        newvals.remove(x) 
    else: 
      if len(set(mods)) != len(mods): 
       #don't want to deal with the complexity of multisets for now 
       print 'skipping', n 
      else: 
       mini = miniSolve(tmod, mods) 
       if mini is None: 
        return None 
       mini = set(mini) 
       for x in vals: 
        mod = x%n 
        if mod: 
         if mod in mini: 
           t -= x 
           answer.add(x*mult) 
         newvals.remove(x) 
    g = gcd_r(newvals + [t]) 
    t = t//g 
    newvals = [x//g for x in newvals] 
    mult *= g 
    return (t, newvals, mult) 

def solve(t, vals): 
    answer = set() 
    mult = 1 
    for d in itertools.count(2): 
      if not t: 
       return answer 
      elif not vals or t < min(vals): 
       return None #no solution' 
      res = tryMod(d, (t, vals, mult), answer) 
      if res is None: 
       return None 
      t, vals, mult = res 
      if len(vals) < 23: 
       break 

      if (d % 10000) == 0: 
       print 'd', d 

    #don't want to deal with the complexity of multisets for now 
    assert(len(set(vals)) == len(vals)) 
    rest = miniSolve(t, vals) 
    if rest is None: 
      return None 
    answer.update(x*mult for x in rest) 
    return answer 

start_t = time.time() 
answer = solve(target, A) 
assert(answer <= set(A) and sum(answer) == target) 
print answer

출처

2013-08-25 19:34:57 Antimony

'O (2^(n/2)) '알고리즘으로 해결하려고 했습니까? 그것은'n = 57'만큼 빠를 것입니다. – IVlad

@IVlad 그것은 사용 가능한 모든 메모리를 다 써 버렸고 시스템을 완전히 종료하여 하드 종료를 수행해야했습니다. – Antimony

답변

관련 문제