2017-02-22 8 views
0

uci에서 다운로드 한 셔틀이라는 데이터 세트에 로컬 아웃 라이어 계수를 실행 중입니다. 때마다 나는 셔틀 데이터를 결정 클래스의 유무에 관계없이 lf 알고리즘을 실행하지만 elki는 다른 출력 그래프를 그리기하고 있습니다. 매번 다른 출력 그래프를 그리는 이유가 무엇인지 혼란 스럽습니다.LOF에서 출력 그래프 변경

답변

0

시각화는 Batik의 렌더링 트리가 메모리에있을뿐만 아니라 복잡한 XML 문서 (SVG, 정확하게 말하면)를 필요로하는 Apache Batik을 사용합니다.

이 시각화는 매우 확장 성이되지 만들고, 매개 변수가

-vis.sampling 

어떤 10000의 샘플 기본 설정됩니다. 따라서 더 큰 데이터 세트에서는 매번 의 시각화 된 샘플이 표시됩니다. 물론 분석을 위해 모든 데이터를 사용합니다. 임의의 씨앗을 해결하기 위해 매개 변수를 추가하기 매우 쉬운 것입니다,하지만 사람들은이 사이트를 참조 이상치 탐지에 더 적합 설정 셔틀 데이터의 변형에 대한

... 너무 많은 매개 변수에 대해 불평하는 경향이 :

를 ID 열에는 분석에 사용되지 않으며, 아웃 라이어 라벨 열에만 평가를위한 클래스로 사용되도록 올바르게 파일을 읽을 수있는

http://www.dbs.ifi.lmu.de/research/outlier-evaluation/DAMI/literature/Shuttle/

주, 당신은 매개 변수를 -arff.externalid id -arff.classlabel outlier가 필요합니다.

+0

답장을 보내 주겠습니까? 50000 데이터 포인트 출력 그래프를 작성하는 데 너무 오래 걸리므로 단지 텍스트 파일에서 LOF 출력을보고 싶기 때문에 Elki와 함께 한 가지 문제가 더 있습니다. 엘키 한테 가능한거야? –

+0

예, 비주얼 라이저 대신 결과 작성기를 선택하십시오. –