온도를 측정하는 Sparkfun의 Arduino 온도계가 있습니다. 그것은 매우 정확하지만 평균 이상이 필요합니다. 내가 사용하고있는 코드는 스파크 펀에서 직선 (https://learn.sparkfun.com/tutorials/sik-experiment-guide-for-arduino---v32/experiment-7-reading-a-temperatur
ELKI를 통해 다양한 k의 LOF를 실행할 수 있으므로 어느 k가 가장 적합한 지 쉽게 비교할 수 있습니까? 일반적으로 k를 선택하면 예를 들어 ROCAUC를 볼 수 있습니다. 데이터 세트에 대해 가장 좋은 k를 꺼내고 싶기 때문에 여러 번의 실행을 비교해야합니다. 수동으로 k 값을 변경하고 실행하는 것보다 쉽게 할 수 있습니까? 예를 들어 모든 k
나는 R을 사용하여 다변량 특이점을 식별하는 가장 좋은 방법을 사방에서 검색해 왔지만 아직 어떤 믿을만한 접근법도 찾지 못했다고 생각합니다. 내 데이터는, 내가 모두 가져 라이브러리 MVN library(MVN)
result <- mvOutlier(df, qqplot = TRUE, method = "quan") #non-adjusted
result <-
견고한 피팅 문제에 대해서는 '모자'행렬의 대각선 요소 인 레버리지 값으로 이상 치를 찾고 싶습니다. 데이터 매트릭스 X (* N 개의 피)하자 햇 행렬이다 X'가 X의 전치이며 Hat = X(X'X)^{-1}X'
. n이 큰 경우 햇 행렬이 매우 큽니다 (n * n). 그래서 컴퓨팅은 시간이 많이 걸립니다. 레버리지 값을 계산하는 더 빠른 방법이 있는
회귀 모델을 사용하지 않는 극단적 인 예외가 있습니다. If-Then-Else 문을 사용하여 제거했습니다. 그러나 SAS는 이러한 데이터 포인트를 완전히 제거하고 남은 데이터에 새로운 이상 치를 발견했습니다. 믹스에 더 많은 것을 던지지 않고 이상 치를 분석에서 제거 할 수있는 방법이 있습니까? 내가 Q3 + 1.5 * IQR을 계산 않도록 그 값을 사용
내 변수의 특이점을 제거해야합니다. 변수의 상위 10 %를 줄이려고합니다. 그러나 어떤 상위 10 %인지 알아내는 데는 단서가 없습니다. 30에서 랜덤 커팅을하면 상위 3.45 %가됩니다. dat$T102_01[dat$T102_01 < 30]
값을하려면 r을 말할 수있는 방법이 있습니까 < 30 만 값의 첫 번째 90 %? 콘텐츠 기반 결정을 내리고 싶
RPCA를 사용하여 시계열 데이터에 이상 치를 찾는 방법에 대해 읽었습니다. 나는 RPCA가 무엇에 관한 것인지, 그리고 그 이론에 대한 기본 아이디어에 대해 알고 있습니다. 나는 RPCA를하는 Python 라이브러리를 가지고 있고, 입력 데이터와 스파 스 매트릭스의 낮은 순위 근사치 인 출력 (L과 S)으로 꽤 많은 두 개의 행렬을 얻었다. 입력 데이터
을 사용하여 외란 분산에 대한 Cochran의 C 검정 의 C.test 함수에서 외란 분산에 대한 Cochran 's C 검정을 수행합니다. 도시 주변의 다른 역에서이 SO2 측정 데이터 프레임을 가지며, 역, 일 및 값의 3 개의 열이 있습니다. 이 기능을 문제는이 lm 객체를 필요로하고 당신이 하나를 구축하는 방법을 나는 아주 이해가 안하지만 난 그냥