outliers

    1

    1답변

    저는 R을 처음 접했고 임무를 수행하면서 선형 회귀 (1360 개의 관측 값과 52 개의 변수가있는 시계열 데이터 (회귀 모델의 11 개 변수)). 최초 연구에서 연구자들은 Hadi 방법으로 이상치를 확인했다. 이것이 mvBacon 함수를 사용하여 R에서 가장 잘 수행 된 것 같습니다. 맞습니까? 나는 이것을 사용하는 방법에 대한 좋은 대답을 찾을 수없는

    2

    1답변

    모든 열의 특이점 대체 I는 예 c1,c2,c3 10000,1,2 1,3,4 2,5,6 3,1,122 4,3,4 5,5,6 6,155,6 I 밖에 2 시그마 모든 컬럼에서 특이점을 바꾸려 3 열이 데이터 프레임을 가지고있다. 아래 코드를 사용하면 이상 치가없는 데이터 프레임을 만들 수 있습니다. df[df.apply(lambda x: np.

    0

    1답변

    DBSCAN을 사용하여 데이터 집합에서 클러스터링을 수행하고 있습니다. 나는 그것이 단일 값이 아닌 plt.plot()의 markerfacecolor에 전달 된 색상 인수 때문에 발생한다고 생각합니다. 여기에 잘못된 것이 있으면 알려주세요. 내 기능은 위도, 경도, speed_mph, speedlimit_mph, vehicle_id, driver_id입니다

    0

    1답변

    모든 피험자 (총 20 개)와 조건 별 반응 시간 (총 3 개)이있는 data.frame이 있습니다. 예를 들어 아래를보십시오. 나는 각 과목 이 코드 사용에 대한 각 조건의 평균에서 이상 치를 제거 할 것 : dat<- do.call(rbind,by(dat,dat$condition,function(x) x[!abs(scale(x$rt_raw)) > 2,]

    0

    1답변

    저는 고속 푸리에 변환 신호를위한 DataFrame을 가지고 있습니다. 주파수가 Hz 인 열과 해당 진폭이 다른 열이 있습니다. 몇 가지 표준 편차보다 높거나 낮은 최종 데이터 프레임의 예외 값을 제외하거나 제외하기 위해 간단한 부울 함수를 사용할 수있는 몇 년 전에 작성된 게시물을 읽었습니다. df = pd.DataFrame({'Data':np.rando

    0

    1답변

    내가 OBIEE의 12C에 다음과 같이 테이블을 생성 찾을 : 은 지금은 평균 위의 2 표준 편차가있는 값을 빨간색으로 색상을합니다. 각 행당 값 (예 : A, a1, a1.1)에 대해이 작업을 수행하고 싶습니다. 조건부 서식을 - - 당신의 도움에 미리 감사합니다, 안드레아

    -2

    2답변

    Breunig & Sander의 발행에 따라 지역 이상 계수 (LOF)에 대한 올바른 계산식을 갖고 싶습니다. I이 화학식 발견 : 의심 이상치 LRD 통해 분할 LOF =합니다 (MinPts 영역에 위치하는 객체의 LRD의 평균), 즉 MinPts의 중심이다. 이것이 맞는 경우 나는 의심 스럽다. 상기 의심 이상치의 LRD 통해 분할 LOF = (의심 즉

    0

    1답변

    클러스터링을 통해 데이터의 이상 치를 찾고 싶습니다. 클러스터링 한 후 가장 먼 샘플은 이상치로 간주됩니다. 내 데이터에는 단 하나의 클래스 만있는 것으로 파악되므로 클러스터링을 통해 이상 값을 찾을 수 있습니다. 또는 데이터에 단 하나의 클래스가있을 때 특이점을 찾을 수있는 다른 방법이 있습니까?

    0

    2답변

    안녕하세요. 내 데이터의 이상 값을 예측하기 위해 sklearn.ensemble.IsolationForest을 사용하고 있습니다. 모델을 내 깨끗한 데이터에 한 번 훈련 (조정) 한 다음 나중에 사용하도록 저장 할 수 있습니까? 예를 들어 모델의 일부 속성을 저장하려면 다음 번에 다시 모델 함수를 호출하기 위해 fit 함수를 호출 할 필요가 없을 때. 나중

    -1

    1답변

    주로 데이터를 캡처하는 데 사용 된 기술로 인해 몇 가지 주요 이상치가있는 일부 데이터로 작업하고 있습니다. 나는 이것을 제거하여 데이터를 표준화했다. 그러나 작품의 성격 상, 공연을 비교하기 위해 모든 참가자의 결과를 일련의 그래프로 시각화하도록 요청 받았습니다. 저는 R에 조금 익숙합니다. 정규화가 어렵지는 않지만 표준화 된 데이터의 스케일에 이러한 이