2017-11-04 10 views
0

필자는 RI에 연속적이고 범주 형 변수가 모두있는 데이터 프레임을 사용하고 있습니다. 제 질문은 : 일부 기능에서는 숫자 행렬 또는 데이터 프레임이 허용되는 경우 데이터 프레임 대신 비공유 행렬을 사용할 수 있습니까? 예를 들어 LOF 알고리즘에 대한 함수 인 lofactor()를 사용하고 싶습니다. 그리고 데이터에 몇 가지 범주 형 변수가있는 동안 숫자 데이터에만 적용 할 수 있습니다. 숫자 인 데이터의 비평 행렬을 사용할 수 있습니까?범주 형 변수와 연속 형 변수가 모두있는 경우 데이터 프레임 대신 차이 행렬을 사용할 수 있습니까?

약간의 도움을 주시면 대단히 감사하겠습니다.

+0

사용하는 비 차이 인덱스가 연속적이고 범주 형 데이터를 허용하는 경우 예. –

+0

나는 metric = "gower"를 선택하는 나를 위해 비평 행렬을 계산하기 위해 daisy()를 사용합니다. 정확합니까? – far

답변

0

DMwR lofactor구현은 느리고 제한되어 있습니다.

그러나 Local Outlier Factor LOF를 사용하면 차이점을 사용할 수 있습니다.

아마도 코드을 쓰거나 DMwR 대신 ELKI와 같은 더 나은 구현을 사용해야 할 것입니다.