2017-12-01 5 views

답변

0

직접적으로.

markPairs이 소비 할 수있는 형식으로 데이터를 가져와야합니다. 같은

뭔가 :

labeled_examples = {'match' : [], 
        'distinct' : [({'name' : 'Georgie Porgie'}, 
            {'name' : 'Georgette Porgette'})] 
        } 
deduper.markPairs(labeled_examples) 

우리는이 형식 trainingDataDedupe으로 스프레드 시트 데이터를 취득하기위한 편리한 기능을 제공 할 수.

(내가 중복 제거의 저자)

+0

나는 성공적으로 표시된 데이터를 입력하여 결과의 ​​첫 번째 수준을 생성 할 수 있었다. 그러나 Dedupe.io 비디오에 나와 있듯이 결과를 어떻게 미세 조정할 수 있습니까? –

+0

해당 기능은 중복 제거 라이브러리의 일부가 아니며 중복 제거 기능의 일부일뿐입니다. – fgregg

+0

도움 주셔서 감사합니다. –