2017-05-19 6 views
0

한 줄에 하나의 진단 코드가있는 환자 진단 데이터 세트가있어 환자가 여러 줄로 진단됩니다. 각 환자마다 고유 한 patientID가 있습니다. 또한 나이, 인종, 성별 등의 환자 데이터가 있습니다.SAS : 여러 줄의 여러 환자 진단

PROC FREQ, Logistic, Univariate 등을 사용하면 환자가 동일한 환자임을 SAS에 어떻게 표시합니까?

이 데이터가 어떻게 생겼는지의 예입니다 : 특정 실험실이 있었다 모든 환자에

patientID diagnosis age gender lab 
1   15.02  65 M  positive 
1   250.2  65 M  positive 
2   348.2  23 M  negative 
2   282.1  23 M  negative 
3     50 F  positive 

내가 주어진 데이터 (에 관계없이 긍정적 인 결과의)뿐만 아니라, 그들의 진단의 모든으로, 각각 다른 라인에 나타납니다 (SAS에 대한 다른 관찰과 같이). 첫째, IF 진술을 사용할 계획 인 실험실에서 부정적인 결과가있는 모든 환자를 제외해야합니다. 연구실에서는 환자에게 질병 X가 있는지 확인합니다. 일부 환자에게는 환자 # 3과 같은 질병 X 이외의 추가 질병이 없습니다.

내가 수행하고자하는 분석 :

  1. 는 PROC 주파수를 사용하여 각 질환의 빈도를 계산합니다.
  2. PROC FREQ chi square를 사용하여 각 진단의 연령 및 인종 관계를 특징 짓습니다.
  3. PROC 물류 질병 X의 상단에

감사를 추가 발병의 위험 인자 (나이, 인종, 성별 등)을 결정하기!

+0

에 따라 다릅니다. 경우에 따라 반복 측정으로 간주 될 수 있으며 때로는 그렇지 않을 수도 있습니다. 대부분 당신이 자신을 그것에 대해 고려해야 만합니다. 귀하의 질문은 여러 procs를 참조하므로 지금은 광범위하고 우리는 하나의 대답을 제공 할 수 없습니다. 질문 범위를 좁히면 이와 같은 데이터를 처리하는 방법에 대한 몇 가지 예를 제공 할 수 있습니다. – Reeza

+0

@Reeza, 데이터 단계에서 각 환자의 진단 정보를 같은 줄에 조합 할 수 있습니까? 나는 순전히 횡단면 분석을하고 있기 때문에 여러 측정 값으로 취급하지 않습니다. – ybao

+0

데이터 집합이 환자 당 하나의 레코드를 가지도록 조 변경하고 변수 Diagnosis1 Diagnosis2 ... DiagnosisN 변수를 사용할 수 있습니다. 그러나 일반적으로 현재 구조는 더 쉽게 작업 할 수 있습니다. Reeza가 말했듯이, 수행하고자하는 특정 분석을 설명 할 수 있다면 사람들이 귀하를 도울 수 있습니다. – Quentin

답변

2

귀하의 질문에 대한 대답은 기본적으로 할 수 없다는 것입니다. 그러나 데이터를 처리 할 때 쉽게 설명 할 수 있습니다. IMO를 오래 유지하는 것이 더 쉽습니다.

위의 질문에 너무 많은 질문을 했으므로 하나만 답변 드리겠습니다. 질병 x 명이있는 사람의 수를 계산하는 방법. 당신이 탐구 분석을 제외하고 실제로는이 작업을 수행하지 않을이기 때문에 이것이 내가이 있으리라 믿고있어

Proc sql; 
Create table want as 
Select diag, count(distinct patientID) 
From have 
Group by diag; 
Quit; 

SQL

훨씬 쉽다는 것을

Proc sort data = have out = unique_disease_patient nodupkey; 
By patientID Diag; 
Run; 


Proc freq data = unique_disease_patient noprint; 
Table disease/out = disease_patient_count; 
Run; 

주 숙제입니다.