1
Dedupe은 능동 학습을 사용하여 중복을 제거하고 레코드 연결을 수행한다는 것을 알고 있습니다.기존 레이블 데이터에서 중복 제거를 배우게
그러나 이미 일치하는 쌍 (레이블 데이터)이있는 엑셀 시트를 능동 학습을위한 입력으로 전달할 수 있는지 알고 싶습니다.
Dedupe은 능동 학습을 사용하여 중복을 제거하고 레코드 연결을 수행한다는 것을 알고 있습니다.기존 레이블 데이터에서 중복 제거를 배우게
그러나 이미 일치하는 쌍 (레이블 데이터)이있는 엑셀 시트를 능동 학습을위한 입력으로 전달할 수 있는지 알고 싶습니다.
직접적으로.
markPairs
이 소비 할 수있는 형식으로 데이터를 가져와야합니다. 같은
뭔가 :
labeled_examples = {'match' : [],
'distinct' : [({'name' : 'Georgie Porgie'},
{'name' : 'Georgette Porgette'})]
}
deduper.markPairs(labeled_examples)
우리는이 형식 trainingDataDedupe
으로 스프레드 시트 데이터를 취득하기위한 편리한 기능을 제공 할 수.
(내가 중복 제거의 저자)
는
나는 성공적으로 표시된 데이터를 입력하여 결과의 첫 번째 수준을 생성 할 수 있었다. 그러나 Dedupe.io 비디오에 나와 있듯이 결과를 어떻게 미세 조정할 수 있습니까? –
해당 기능은 중복 제거 라이브러리의 일부가 아니며 중복 제거 기능의 일부일뿐입니다. – fgregg
도움 주셔서 감사합니다. –