2016-11-15 9 views
0

ELKI를 통해 다양한 k의 LOF를 실행할 수 있으므로 어느 k가 가장 적합한 지 쉽게 비교할 수 있습니까?ELKI : 다양한 k의 LOF 실행

일반적으로 k를 선택하면 예를 들어 ROCAUC를 볼 수 있습니다. 데이터 세트에 대해 가장 좋은 k를 꺼내고 싶기 때문에 여러 번의 실행을 비교해야합니다. 수동으로 k 값을 변경하고 실행하는 것보다 쉽게 ​​할 수 있습니까? 예를 들어 모든 k = [1-100]을 비교하고 싶습니다.

감사

Greedy Ensemble 한 번 효율적에서 K의 전체 범위에 대한 특이 검출 방법을 실행하는 방법을 보여줍니다

답변

0

(한 번만 가까운-이웃을 계산하여, 그것은 훨씬 더 빨리 될 것입니다!)가 ComputeKNNOutlierScores 응용 프로그램을 사용하여 포함 ELKI와.

응용 프로그램 EvaluatePrecomputedOutlierScores을 사용하면 이러한 결과를 여러 가지 방법으로 대량 평가할 수 있습니다.

우리가 게시에 사용되는 것입니다

GO 캄포스, A. Zimek, J. 샌더, RJGB 캄 펠로, B. Micenková, E. 슈베르트, I. 재가 및 ME Houle
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study
가 데이터 마이닝과 지식 발견 30 (4) : 891-927, 2016, DOI 다음 supplementary material website에 10.1007/s10618-015-0444-8

, 당신은 많은 표준 데이터 세트에 대한 최상의 결과를 찾아 볼 수 있습니다 뿐만 아니라 r을 다운로드하십시오. 결과.

그러나 이상 값 검색 품질 결과는 결정적이지 않은 경향이 있습니다. 하나의 데이터 세트에서 한 가지 방법이 다른 데이터 세트에서 다른 방법으로 가장 잘 수행됩니다. 데이터 세트가 매우 다양하기 때문에 분명한 승자는 없습니다.