일련의 국가에 대한 실업 수 패널 데이터 세트가 있습니다. 나는 실업률이 20 % 이상인 경우 1과 같은 변수를 생성했으며 실업률이 그 비율을 초과하는 연속 연도를 계산하려고합니다. 그 해에 어떤 사건도 발생하지 않았으므로 일부 국가는 몇 년 동안 데이터를 버렸지 만 가능한 경우 누락 된 연도를 포함시키고 싶습니다. 나는 각 국가마다 highunemp
변수 목록 a_23 a_24_1 a_24_2 a_24_3 a_24_4 a_24_5 a_24_6 a_24_7 a_24_8이 있습니다. 변수 a_24*의 값은 a_23의 응답을 기반으로합니다. a_23==1 경우 a_24* 적어도 하나 개의 변수는 1 I 그러므로 I 아래 루프 시도 1 a_23==1 경우의 값을 포함하지 않는 a_24* 변수 중 어느 경우에
현재 오픈 데이터 키트 인 ODK를 통해 생성 된 Stata에서 데이터 세트를 처리 중입니다. 여러 답으로 질문에 답하는 옵션이 있습니다. 예 : 내 설문 조사에서 "당신은이 자산들 중 어느 자산을 소유하고 있습니까?" 면접관은 20 가지 옵션 중에서 모든 답을 태그로 표시했습니다. 이 같은 "1 2 3 5 11 17 20"
"3 4 8 9 11 14 1
kmeans (분할 방법)와 완전한 연결 (계층 적)을 사용하는 두 가지 클러스터를 만들었습니다. 계층 적 방법을 사용 클러스터 : cluster completelinkage area age, name(hcm_5) measure(L2)
cluster generate c1 = group(5), name(hcm_1)
분할 방법을 사용하여 클러스터 :가 c
여러 Excel 파일을 폴더에서 Stata로 가져 와서 별도의 dta 파일로 저장하고 싶습니다. 매년 4/4의 가치가 있습니다. 각 분기마다 60 장이 있습니다. 각 시트를 개별적으로 가져 오려고합니다. 예. 2,004 분기 1에 대한 루프를 작성하는 방법이 있나요 Sheet60-이 2004Q60 에 저장 한 분기 1 2004 2004Q11.dta에 저장
세 개의 기둥이 있습니다. 하나는 F에 의한 관측을 식별합니다. 다른 열은 T라고하는 동일한 F 내의 각 관측을 순서 지정합니다. 세 번째 열은 Q라는 숫자 값입니다. Q에 대한 모든 값을 T의 특정 값보다 크게하고 싶습니다. 같은 F 안에있는 고정 된 T의 값으로 대체됩니다. 예를 들어, 같은 F 내의 모든 Q 값은 T가 6보다 큰 값이 Q가 T = 6
관찰 범주를 지정하는 Category이라는 변수가 있습니다. 문제는 몇몇 관측치가 여러 카테고리를 가지고 있다는 것입니다. 예 : id Category
1 Economics
2 Biology
3 Psychology; Economics
4 Economics; Psychology
범주의 순서에는 의미가 없습니다.
저는 R에 익숙하며 398 개 변수의 데이터 세트로 작업하고 있습니다. 다른 날짜에는 많은 변수가 있습니다. 400 명이 넘는 피실험자의 연령대가 없어졌지만 출생과 사망 날짜가 모두 있으므로 나이를 계산할 수 있기를 바랍니다. 그러나 첫 번째 단계는 모든 날짜를 동일한 형식으로 가져 오는 것입니다. 나는 그들 중 몇 명과 함께 성공적 이었지만, 죽음의 날은
개인의 ID, 현재 연도, 졸업 연도, 학위, 소득 및 치료를 나타내는 0/1 변수와 같은 데이터 세트가 있습니다. 소득은 변하기 쉬운 해와 같은 해에있다. 내가 원하는 것은 모든 가능한 조합에 대해 현재 소득을 회귀시키는 것입니다. 년, 졸업 연도 및 학위. 즉, 여러 계수를 제공하는 여러 다른 회귀 분석을 실행하는 것을 의미합니다. 나는 그것을 수행하는