변수 이름에 "idx"가 포함되어 있으면 새 변수 create_idx_var을 1로 만듭니다. , "Idx", "indx", "Indx", "index", "Index", "etf", "ETF"또는 변수 색인이 "예"인 경우. 방금 R을 배우기 시작했습니다. 첫 번째 단계는 데이터 세트를 제거하고 주식형 펀드 만 유지하는 것입니다. 그렇다면 펀드가 인덱
여러 가지 요인이있는 데이터베이스가 있습니다. 각 변수에 대해 각 요소에 대한 회귀를 반복하려고하지만 전체 데이터베이스에 대해 반복합니다. 이 같은 것은 : for (i in unique(db$Product)) {
for (j in unique(db$Super)) {
for (c in unique(db$Category)) {
db$pru
많은 수의 범주 형 변수가있는 일부 데이터에서 Python을 사용하여 다변량 선형 회귀 또는 로지스틱 회귀를 수행하려고합니다. 하나의 범주 형 변수를 사용하면이를 더미로 변환 한 다음 한 유형의 더미를 제거하여 동일성을 피할 수 있음을 이해합니다.하지만 둘 이상의 유형 변수를 처리 할 때 접근법이 무엇인지 잘 알고있는 사람은 누구입니까? 각각 동일한 작업을
데이터 프레임에 더미 변수로 변환하려는 범주 형 변수가 있습니다. 이 열은 쉼표로 구분 그러나 여러 값 가지고 결국 0 'a'
1 'a,b,c'
2 'a,b,d'
3 'd'
4 'c,d'
는 I 가능한 각 이산 값의 바이너리 열을 가지고 싶어하는 단계; 즉, 최종 열 수는 원래 열의 고유 값 수와 같습니다. 각 분리 된 값을 얻기 위해 split
이벤트 데이터가있는 데이터 프레임이 있습니다. 저는 두 개의 컬럼을 가지고 있습니다 : 1 차 및 2 차 컬럼. 기본 및 보조 열은 모두 태그 목록 (예 : [재미있는 이벤트], [댄스 파티])을 포함합니다. 1 개 코드 비 관측 열이 0이 차 컬럼, 그리고 보조 열에서 값이 0.5의 값을 갖도록 primary secondary combin
수동으로하지 않고 출시 날짜와 다음 버전 릴리스 날짜 사이의 날짜 범위를 기준으로 어떤 제품 버전이 유효했는지 나타내는 더미 변수를 만들고 싶습니다. 해당 출시 날짜와 다음 버전이 출시 된 몇 백 가지 버전이 있으며이 데이터를 Purchases 데이터 프레임과 병합/결합합니다. 현재 I는 다음과 같이 두 개의 데이터 프레임 (버전 및 구입)가 : View(
16 개의 값 (0-15)을 가질 수있는 더미 변수를 만들어야하는데 더미 변수를 만들 때 반드시 16 개의 값을 모두 가져야합니다. my_column
0 3
1 4
2 7
3 1
4 9
내가 내 더미 변수는 16 열 이상이 기대 - 사전 날에 고정 된 어떤 다른 값을, 컬럼의 이름에 숫자가 my_column의 값에 해당하지만, my_column
뉴욕과 시카고에 거주하는 사람들의 행복 수준의 차이를 결정하는 요소를 추정하려고합니다. 데이터는 다음과 같습니다. Happiness City Gender Employment Worktype Holiday
1 60 New York 0 0 Unemployed Unemployed
2 80 Chicago 1 1 Whitecolor 1 day
예를 들어 테이블의 국가 열과 같은 범주 형 변수가 있다고 가정 해보십시오. 어떻게 각 카테고리에 더미 변수를 추가 할 수 있습니까? 관련 이름이 있습니까? 그래서 열이 국가에 해당하는 경우 해당 사람이 미국에 거주하는지 여부에 대한 변수는 미국이 아니며 country16 또는 무언가라고합니다.