outliers

    0

    2답변

    2 차원 가우시안 분포를 가지고 있고 특이점을 식별하려고합니다. 이것은 이상치 제거의 의미가 아니라 대량으로 가장 닮지 않은 샘플을 식별하는 것입니다. http://imgur.com/hlOqjig 당신이 가장 잘이 데이터에 대해 수행하는 방법을 제안해야합니까? 나는 두 차원 모두에 정규 분포를 맞추고 모든 데이터 점에 대해 p- 값을 계산 한 다음 가장 낮

    0

    3답변

    저는 TCG (Trading Card Game) 가격 책정 프로그램을 만들고 있습니다. 그 업무는 여러 공급 업체의 데이터를 수집하고 해당 데이터를 사용하여 해당 카드의 시장 가격을 결정하는 것입니다. 예를 들어, 이론적 인 카드 X를 생각해 봅시다. X에는 판매하는 공급 업체에 따라 다양한 값이 있습니다. 이 값이 달러 참조 [1.00, 1.10, 1.0

    0

    1답변

    표준 편차에서 벗어난 값을 무시하면서 평균과 수를 계산할 수있는 쿼리를 작성해야합니다. P = 지불 : Value_gbp Paymentid Account rfx_ref A = 계정 : 지금까지 내가 가지고 Accountid Entity_type Settlment_model rfx_ref 나는이 개 이러한 특성을 가진 MySQL의에서 테이블

    -1

    1답변

    나는 나의 데이터 세트에서 특이 치를 없애는 데 도움이되는 간단한 특이 치 검출 기술을 찾고있다. 3000 개의 정현파 사이클에서 얻은 부분 방전 측정치 인 2 백만 개의 샘플이 있습니다. 이는 측정 장비가주기 내 작은 변화에서도 필요한 데이터를 측정 할 수 있다는 것을 의미합니다. 내 데이터는 정현파를 시간이 지남에 따라 절연체에 적용하고이를 기록하여 2

    -1

    1답변

    데이터 프레임의 각 열/변수에 많은 이상치가있었습니다. Boxplot/IQR cut-off를 사용하여 75 %/25 %를 제거했습니다. 나는 각 열을 꺼내서 그 열편을 제거했다. 따라서 각 열의 값은 서로 다릅니다. 이제 모든 이상 값이없는 모든 NEW 변수를 단일 데이터 프레임에 결합하려고합니다. 데이터 프레임에이 오류가 표시됩니다. 이 문제를 어떻게 해

    0

    2답변

    의 아웃 라이어를 자동으로 삭제합니다. 단일 링크 방법으로 데이터 세트의 특이점을 쉽게 식별 할 수 있습니다. 이제 이상 치를 자동으로 제거하고 싶습니다. 내 생각은 지정된 거리 값을 초과하는 데이터를 제거하는 것입니다. Plot 당신이 결과 dendrogram은 볼 수에서 library(cluster) library(dendextend) cluster

    0

    1답변

    나는 boxplot 및 beeswarm를 포함하는 내 그래프의 특이 치를 제거하려고합니다. 내 이상 값이 사라 outline=FALSE로 boxplot(Lead_s ~ Group, data = g, outline = FALSE, main = 'Gaze shift duration with co-occuring movement units',

    -1

    1답변

    팬더 데이터 프레임에서 이상치를 제거하는 효율적인 방법은 무엇입니까? 데이터 프레임에서 아웃 라이어 포인트를 제거해야하는 팬더 데이터 프레임이 있습니다. X1 X2 X3 X4 228.0 4474.91836735 3507.15151515 6625.0 77.0 468.0 582.0 549.0 160.0 9.0 3507.151515

    0

    1답변

    K-means 클러스터링을 사용하는 동안 독립 변수의 상위 5 개 하위 값을 제거했습니다. 그 이유는 소수 데이터 포인트를 잃어 버리기 때문입니다. 이제 K-means 클러스터링을 사용한 후 각 데이터 포인트에 대한 클러스터를 얻습니다. Outlier로 인해 이전에 제거 된 데이터 포인트에 대한 클러스터를 얻는 방법

    0

    1답변

    저는 나이 증명, 교육 수준, 관계 관리자 코드와 같은 범주 형 변수를 사용하여 보험 사기 데이터 세트를 작성하고 있습니다. 데이터 세트의 이상을 탐지하기 위해 빈도 수를 기준으로 수치의 범주로 변환하고 수준의 비율을 계산했습니다. 올바른 방법입니까? 그렇지 않다면 특이점을 발견하는 동안 범주 형 변수를 다루는 방법을 제안하십시오.