많은 설명자 변수 (trt, individual, session)가있는 데이터 프레임이 있습니다. 가능한 trt x individual 조합의 일부를 무작위로 선택할 수 있지만 임의의 끌어 오기가 동일한 세션 번호를 갖지 않도록 세션 변수를 제어 할 수 있기를 원합니다. 나는 고유 한 세션 수와 각 trt x individual 조합의 2를 꺼내 어떻게 t
'보충'이 올바른 단어인지 확실하지 않지만 예제를 통해 문제를 설명합니다. 의 우리의 목록입니다 가정 해 봅시다 : 내가 찾으려고 노력하고 무엇 [1,2,3,4]
은 다음과 같습니다 [1], [2], [3], [4]
[1,2], [3], [4]
[1,3], [2], [4]
...
[1,2], [3,4]
[1,3], [2,4]
...
[1,2
특정 코드의 발생이 최소 하나 이상 포함 된 그룹을 기반으로 데이터 프레임의 하위 집합을 만들려고합니다. 는 import pandas as pd
df = pd.DataFrame({'cId' : [1, 1, 1, 2, 2, 4, 4, 4, 4, 4],
'eId' : [1, 1, 1, 1, 1, 1, 1, 2, 2, 3],
특정 범위의 값을 포함해야하는 변수를 선택하는 데 문제가 있습니다. 내 변수를 3 가지 범주로 나누고 싶습니다. 즉; small, medium 및 big. 문맥. 나는 obj_hid_woonopp이라는 이름의 변수를 가지고 있는데 (크기는 m2) 16-375가된다. 그리고 내 데이터 세트는 datalogitvar입니다. 재현 가능한 코드가 없습니다. 죄송합
약 30 개의 요소로 각각 약 1 백만 세트가 있습니다. 각 집합에 대해 k가 3 또는 4 또는 5와 같은 크기가 될 때까지 "k"크기까지 모든 하위 집합을 생성하려고합니다. 구아바에 익숙하지 않으며이를 시도하기로 결정했습니다. 내 세트의 모든 하위 집합을 생성하는 powerSet 메서드 (https://google.github.io/guava/releas
특정 연령별 사망자 수로 구성된 행렬 D가 있다고 가정합니다. 나는이 행렬에 벡터 나이에 저장된 적절한 사망 수를 입력하고 싶지만 다음 코드는 나에게 잘못된 대답을 제공합니다. 어떻게 루프를 만들지 않고 코드를 작성해야합니까? # Year and age grid for tables
Years=c(2007:2017)
Ages=c(60:70)
#Data
데이터 세트가 146 개 이하이고 다른 세트가 146 개 이상인 데이터를 두 세트로 분할해야합니다. 데이터가 (가 위에서처럼 보이는) 벡터 단지의 경우 원래의 데이터 세트는 dat <- c(208.3, 357.63, 238.06, 227.91, 231.79, 275.43, 241.27, 163.39,
160.31, 255.23, 214.74, 2
먼저 t- 테스트를 위해이 데이터 집합을 깔끔한 형식으로 만드시겠습니까? https://i.stack.imgur.com/tMK6R.png 둘째, 나는 '결과 1'치료 A와 B의 시간 3의 방법을 비교하기 위해 두 개의 샘플 t 테스트를 할 노력하고있어. 이 일을 어떻게 하죠? 샘플 데이터 : df <- structure(list(code = c(100, 1
다음은 수행 한 마케팅 캠페인이 포함 된 데이터 프레임 (DF)입니다. 성공률은 응답자 수를 나타내며 통신 유형은 채널 페이스 북, 트위터 등을 나타냅니다 (Ai- FB, L1-Linkedin). 랩탑, 뉴 및 마우스는 문장을 구성하는 단어를 나타냅니다. 원본 데이터 프레임에는 새 랩톱 구입 및 마우스 사용과 같은 문장이있었습니다. 위의 qdap 구문 분석