outliers

    0

    1답변

    온도를 측정하는 Sparkfun의 Arduino 온도계가 있습니다. 그것은 매우 정확하지만 평균 이상이 필요합니다. 내가 사용하고있는 코드는 스파크 펀에서 직선 (https://learn.sparkfun.com/tutorials/sik-experiment-guide-for-arduino---v32/experiment-7-reading-a-temperatur

    0

    1답변

    ELKI를 통해 다양한 k의 LOF를 실행할 수 있으므로 어느 k가 가장 적합한 지 쉽게 비교할 수 있습니까? 일반적으로 k를 선택하면 예를 들어 ROCAUC를 볼 수 있습니다. 데이터 세트에 대해 가장 좋은 k를 꺼내고 싶기 때문에 여러 번의 실행을 비교해야합니다. 수동으로 k 값을 변경하고 실행하는 것보다 쉽게 ​​할 수 있습니까? 예를 들어 모든 k

    7

    1답변

    나는 R을 사용하여 다변량 특이점을 식별하는 가장 좋은 방법을 사방에서 검색해 왔지만 아직 어떤 믿을만한 접근법도 찾지 못했다고 생각합니다. 내 데이터는, 내가 모두 가져 라이브러리 MVN library(MVN) result <- mvOutlier(df, qqplot = TRUE, method = "quan") #non-adjusted result <-

    0

    1답변

    점 대신에 수염 끝 부분에 상자 플롯의 이상 치를 만들고 싶습니다. 이것이 Q1과 Q3 계산을 변경한다는 것을 알았지 만 수염의 일부로 플롯에 모든 아웃 라이어를 포함시키는 쉬운 방법이 있습니까? 범위 옵션이하는 일이다

    1

    1답변

    견고한 피팅 문제에 대해서는 '모자'행렬의 대각선 요소 인 레버리지 값으로 이상 치를 찾고 싶습니다. 데이터 매트릭스 X (* N 개의 피)하자 햇 행렬이다 X'가 X의 전치이며 Hat = X(X'X)^{-1}X' . n이 큰 경우 햇 행렬이 매우 큽니다 (n * n). 그래서 컴퓨팅은 시간이 많이 걸립니다. 레버리지 값을 계산하는 더 빠른 방법이 있는

    0

    1답변

    회귀 모델을 사용하지 않는 극단적 인 예외가 있습니다. If-Then-Else 문을 사용하여 제거했습니다. 그러나 SAS는 이러한 데이터 포인트를 완전히 제거하고 남은 데이터에 새로운 이상 치를 발견했습니다. 믹스에 더 많은 것을 던지지 않고 이상 치를 분석에서 제거 할 수있는 방법이 있습니까? 내가 Q3 + 1.5 * IQR을 계산 않도록 그 값을 사용

    -4

    1답변

    측정에서 이상 값을 찾아 제거하고 더 좋은 경향을 파악하기 위해 평활화 된 값으로 바꾸고 싶습니다. 아래 그림을 참조하십시오. Data with outliers

    1

    2답변

    내 변수의 특이점을 제거해야합니다. 변수의 상위 10 %를 줄이려고합니다. 그러나 어떤 상위 10 %인지 알아내는 데는 단서가 없습니다. 30에서 랜덤 커팅을하면 상위 3.45 %가됩니다. dat$T102_01[dat$T102_01 < 30] 값을하려면 r을 말할 수있는 방법이 있습니까 < 30 만 값의 첫 번째 90 %? 콘텐츠 기반 결정을 내리고 싶

    2

    1답변

    RPCA를 사용하여 시계열 데이터에 이상 치를 찾는 방법에 대해 읽었습니다. 나는 RPCA가 무엇에 관한 것인지, 그리고 그 이론에 대한 기본 아이디어에 대해 알고 있습니다. 나는 RPCA를하는 Python 라이브러리를 가지고 있고, 입력 데이터와 스파 스 매트릭스의 낮은 순위 근사치 인 출력 (L과 S)으로 꽤 많은 두 개의 행렬을 얻었다. 입력 데이터

    1

    1답변

    을 사용하여 외란 분산에 대한 Cochran의 C 검정 의 C.test 함수에서 외란 분산에 대한 Cochran 's C 검정을 수행합니다. 도시 주변의 다른 역에서이 SO2 측정 데이터 프레임을 가지며, 역, 일 및 값의 3 개의 열이 있습니다. 이 기능을 문제는이 lm 객체를 필요로하고 당신이 하나를 구축하는 방법을 나는 아주 이해가 안하지만 난 그냥