열의 중간 값 이상의 모든 값을 열 자체의 중간 값으로 대체하고 싶습니다. 나는 '더에서이 작업을 수행 할 수있는 경우 궁금 그래서 데이터 프레임에 익숙하지 않은 오전 for col in m.columns:
quart = m[col].median()
m[col] = [val if val < quart else quart for val in
나는 옥타브 반환 quantiles 만들 수 없습니다. 예 : a = 1:15;
quantile(a)
ans= 1 2 3 4 5 6 ... 15
내가 좋아하는 뭔가를 기대하는 동안 : 내가 prctile하려고하면 ans= 1.0 4.5 8.0 11.5 15.0
같은 일이 (가). 문제는 무엇입니까? 안부, 헬보
그래픽을 사용하여 주어진 샘플의 정규성을 평가하는 것이 일반적입니다. 그러나 QQ 플롯은 샘플링되는 모집단을 안정적으로 나타 내기 위해 큰 샘플 크기가 필요합니다. 일부 텍스트의 경우 최소 1,000 개의 샘플 크기가 바람직하다고합니다. Question1 :이 par(mfrow=c(2,3))
for(i in c(10, 100, 1e+3, 1e+4, 1e+
각 파일에는 대략 1000 개의 시간 시리즈 구현 (각 파일 ~ 76MB)이 들어있는 약 300 개의 파일이 있습니다. 전체 300000 실현의 각 시간 단계에서 quantiles (0.05, 0.50, 0.95)를 계산하려고합니다. 현실화가 너무 커질 수 있기 때문에 현실화를 1 파일에 병합 할 수 없습니다. 가장 효율적인 방법은 무엇입니까? 각 행렬 모
돼지와 함께 그룹화 문제에 대한 해결책을 찾기 위해 노력하고 있습니다. 현재 나는 다음과 같은 데이터 집합을 가지고 있습니다. Group | Height | Weight
A | 96.5 | 110.2
B | 88.2 | 122.5
A | 94.1 | 100.8
B | 84.1 | 115.6
I는 높이 가변의 분위수를
"R을 사용하여 통계 발견"이라는 책에서 통계 및 R을 배우고 있습니다 ... 매우 유익한 정보이지만 사전 지식이 없더라도 영역을 건너 뛰는 것 같습니다. 통계 또는 R이 필요합니다. 그래서 문제 : Dichotomy (또는 반올림) 방법을 사용하여 표준 정규 분포의 p 분위수를 어떻게 계산할 수 있습니까? (그리고 사용을 가정하지 않고 qnorm()).
점점 많은 수의 변수에 대해 ntiles를 생성해야하는 sql 서버 쿼리가 있으므로 변수가 다양한 순열로 서로 결합됩니다. 여기에서 발췌 무슨 뜻인지 예시 것 : 문 1 : ntile(10) over (partition by MAUorALL, User_Type, fsi.Month_ID
order by Objects_Created) AS Nt
quantile 위 또는 아래에있는 데이터 프레임 내에서 "truncate"하고 싶습니다. 행렬 인 "TRUNC"와 같은 뭔가 : Fehler in if (na.rm) x <- x[!is.na(x)] else if (any(is.na(x)))
stop("missing values and NaN's not allowed if 'na.rm' is FALSE"
"완전"정규 분포를 사용하여 R을 계산하려고합니다. 다른 말로하면, 나는 어떤 샘플 포인트에서 지정하고 싶지 않다. 나는 아무 것도 가지고 있지 않다. 단지 평균과 표준 편차를주고, quantile을 계산하기를 원한다. 내가 qnorm을 사용해야하는 것 같아서 qnorm(mean=1000, sd=50과 비슷하다고 가정하지만 argument "p" is mi
biglist에 0 개의 하위 목록이 있으며 각각은 List of 1입니다. 내가 >biglist을 수행 할 때 난이 얻을 : [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
LIST1 Numeric,6 Numeric,6 Numeric,6 Numeric,6 Numeric,6 Numeric,6 Numeric,6 Nu