나는 summarize과 같은 Stata의 collapse을 사용하고 싶습니다. 나는 새로운 데이터 집합을 만드는 것 어떻게 Obs Mean Std. Dev. Min Max
Score1 54 17 3 11 22
Score2 32 13 2 5 28
Score3 43 22 4 17 33
Value1 54 9 3 2 12
거래 번호와 카드 번호가있는 원시 거래 데이터가 있습니다. 불행히도 카드 번호는 거래의 모든 행에서 반복되지 않으므로 공백이 있습니다. 카드 번호별로 데이터를 요약하고 싶으므로 공백을 채울 필요가 있습니다 (제 생각에는). 이 문제를 해결하는 방법은 트랜잭션 번호와 카드 번호의 고유 한 조회를 작성하고 카드 번호를 원시 데이터에 다시 일치시킨 다음 카드 번
오일러의 소수 테스트의 정확성을 테스트하려고합니다. 필자는 숫자를 취하고 입력에 대한 소수성에 대한 모든 수를 테스트하고 비 프라임을 포함하여 콘솔에 출력하는 함수 euler()를 작성했습니다. 다음은 어떻게 보이는지 보여줍니다. euler(10)
[1] 1
[1] 2
[1] 3
[1] "Not prime:" "4"
[1] 5
[1] "Not
'Column1'열 아래에 'input'을 하위 행으로 포함하고 있지만 연속 된 형식이 아닌 많은 행이 있습니다. 이 유형이 발생할 때마다 동일한 행의 다른 열에 'some data'값을 넣고 싶습니다. 이렇게해야합니다. Column1 Column2
This function takes input.
Other value don't car
통계 분석에서 데이터 흐름을 제어하기 위해 make를 사용하고 있습니다. 내 raw 데이터를 ./data/raw_data_files 디렉토리에 가지고 있고 청소 된 데이터 캐시를 생성하는 데이터 조작 스크립트가 ./cache/clean_data에 있습니다. 내 데이터의 cache/clean_data:
scripts/clean_data
나도 화장
나는 year | country | growth_rate 열이있는 데이터 프레임을 가지고 있습니다. 각 나라의 성장률을 내가 선택한 다른 나라와 비교하고 주어진 해에 더 높은 성장률을 보인 국가를 필터링하고 싶습니다. 은 그래서 첫 번째 단계는 성장 모든 국가의 요금과 나의 선택 국가 사이의 차이를 가지고하는 것입니다 생각, 나는 여기까지 얻을 수 있었다
250 개가 넘는 변수가있는 데이터 세트가 있습니다. 특정 위치 (예 : 37 번째 변수 또는 113 번째 변수 등)에 배치해야하는 몇 가지 새로운 변수를 만들었지 만 목록의 맨 끝에 추가됩니다. 나는 retain 문을 연구했지만 필자가 원하는 순서대로 모든 변수를 나열해야합니다. 누구나 이것에 대한 지름길을 제안 할 수 있습니까? - VARM 내가 반복
특정 컬럼의 존재를 확인하는 R 함수를 찾고 있습니다. 모든 열이 존재하지 않는 경우의 NA있는 열을 삽입 할 매트릭스 또는 dataframe에 cols=c("a","b","c","d")
(위치에있는 열 벡터 cols에 주어져있다). 명명 된 열 "a", "d"와 매트릭스 또는 dataframe이 있다면 그것은 "b" 및 "c" 열 "d" 전에 NA들로
의 측정 값 데이터를 스케일링/보간 우선 질문을 받았다면 사과드립니다. 그러나 모든 단일 링크에 대한 집중적 인 연구가 약 10 시간 동안 진행되었습니다. 내 문제로 나를 도울 수있는 모든 것을 찾을 수 있습니다. 나는이 두 가지, 과학적 측정 데이터로 시트를 엑셀 검색 : 내가 원하는 무엇 는 다음과 같습니다. 각 시트에는 다른 시트와 쉽게 비교할 수있는