2012-12-23 3 views
2

나는 R의 수식을 만들려고 해요에서 수식의 생성을 일반화. 그것이 작동하는 것처럼 보이는 것은 예측할 변수 이름을 예측하고 물결 치려는 변수 이름을 제공하고 예측 인자로 사용하려는 변수 이름을 제공하고 이후 인수에서 해당 변수의 관측치를 포함하는 데이터 프레임을 제공한다는 것입니다. 그러나 내가 사용하고있는 데이터 프레임에는 꽤 많은 변수가 들어 있습니다. 그리고 그것들을 모두 타이핑하고 싶지는 않습니다. 이러한 변수는 이름을 비교적 자주 변경하기 때문에 코드를 변경하지 않아도됩니다. 본질적으로, 쓰는 법을 알고 싶습니다.형태의 모델에서 사용하기 위해</p> <p><code>Output~Var1+Var2+Var3</code></p> <p>의, R

Output~(All the variables that aren't the output) 

또한 다른 변수도 제외해야합니다. 무슨 일이 일어나고 있는지 몰라서 미안하네요. 수식이 너무 많이 도움이되지 못했고, 다른 프로그래밍이나 R 구조와는 다른 것 같아요. 어떤 도움

감사합니다,

+6

'Output ~ .'은 다른 모든 것을 RHS에 넣습니다. – James

+0

고마워요. 다른 변수를 제외하려면 어떻게해야합니까? 윌! 변하기 쉽니? –

+2

'data' 매개 변수에 주어진 데이터 프레임을 포함하려는 변수로 서브 세트하십시오. – Roland

답변

5

아, 나는 훨씬 더 나은 솔루션을 발견했다. 모델에서 사용되는 변수를 동적으로 선택하려면 원하는대로 colnames를 조작하십시오.

1

N은 사실,? 공식 문서는 하나의 가능한 답을 제공합니다. 그것은, 그러나 매우 '해키'이고, 나는이

## Create a formula for a model with a large number of variables: 
xnam <- paste0("x", 1:25) 
(fmla <- as.formula(paste("y ~ ", paste(xnam, collapse= "+")))) 

즉, 당신은 단지 당신의 수식으로 문자열 toghether 붙여 사용 달성 상상할 수있는 가장 적절한 방법 중 하나. 사용자가 제공 한 문자열에서 수식을 만들 것인가하는 기능

reformulate(termlabels = colnames(InputTable), response = 'Prediction') 

: