2016-08-03 3 views
1

최근에 의료 긴급 서비스로 제공되는 거대한 데이터 세트로 작업하기 시작했습니다. 나는 사고의 cca 25.000 공간 점이있다.포인트 패턴 유사도 및 비교

나는 꽤 오랫동안 책과 인터넷을 검색하고 있으며 무엇을해야하고 어떻게해야하는지 혼란스러워지고 있습니다.

포인트는 물론 매우 밀집되어 있습니다. 나는 그것에 대해 K, L, G 함수 을 계산했고 그들은 심각한 클러스터링을 확인했다.

인구수 데이터 집합 - 모든 시민에 대해 하나의 지점으로, 인시던트 데이터 집합과 유사하게 클러스터링됩니다 (인시던트는 이러한 두 데이터 집합 사이에 강력한 링크가 있습니다).

비슷한 두 가지 데이터 세트를 비교하려면 인 경우이를 비교하고 싶습니다. 내가 알고 싶은 것은 장소가있는 경우 더 많은 인구가있는 인시던트가있는 곳입니다. 즉, 인구 데이터 집합을 사용하여 강도를 설명하고 인시던트 데이터 집합이 해당 강도에 해당하는지 파악하려고합니다. 가정은 인과 관계가 무작위로 나타나야한다는 것입니다.

인과 관계가 무작위로 발생하는 경우 예상보다 많은 인시던트가있는 정보가있는 지역의 플롯을 얻고 싶습니다.

R로 어떻게 할 수 있습니까?

K 기능을 계산하려면 Kest 또는 Kinhom을 사용해야합니까? 설명을 읽었지만 여전히 기본 차이점 인 이 무엇인지 이해하지 못합니다.

나는 Kcross를 사용해 보았지만, 알아 낸 바대로 으로 사용 된 두 개의 데이터 세트 중 하나는 완전히 공간적으로 랜덤해야합니다. Kcross.inhom도 찾았습니다. 데이터를 사용해야합니까?

채우기와 관련된 사건의 편차 (플롯)를 어떻게 얻을 수 있습니까?

나는 분명히 물었 으면 좋겠다.

내 질문을 읽어 주셔서 감사합니다. 내 질문에 답할 수 있다면 감사드립니다.

감사합니다.

르네이는

답변

2

나는 전체에서 모든 질문에 대답 할 시간이 없지만, 여기에 몇 가지 포인터입니다.

면책 조항 : 나는 spatstat 패키지와 서적 Spatial Point Patterns: Methodology and Applications with R을 공동 저자로 사용하고 있으므로이 패키지를 사용하기를 선호합니다 (그리고 저는 이것이 귀하의 문제에 가장 적합한 도구라고 믿습니다).

개념적 문제 : 학습 지역의 크기가 어느 정도이며 지역을 도처에 분산 시키거나 도로 네트워크에 있도록 제한되어있는 지점을 다루는 것이 이치에 맞습니까?

지금은 어디서나 배포되었다고 가정 할 수 있다고 가정합니다.

간단한 접근법은 density.ppp을 사용하여 인구 밀도를 추정 한 후 인구 밀도가 ppm 인 인시던트에 Poisson 모델을 적용하는 것입니다. 이것은 아마도 합리적인 널 모델이 될 것이고 데이터가 잘 맞으면 불균일 한 인구 밀도를 통제 할 때 인시던트가 공간에서 완전히 무작위로 발생한다고 말할 수 있습니다. 추가 정보 density.pppppm은 각각 1의 6 및 9에 있으며 물론 spatstat 도움말 파일에 있습니다.

K/L/G/F/J 기능과 같은 요약 통계를 사용하는 경우 인구 밀도를 고려하여 항상 inhom 버전을 사용해야합니다. 이에 대해서는 1의 7 장에서 다룹니다.

두 가지 유형 (배경 및 인시던트)으로 표시된 점 패턴에 모든 포인트를 결합하면 상대 위험도 (relrisk)를 보는 것도 재미있을 수 있습니다. 1의 14 장을보십시오.

불행히도 1 장 3, 7 및 9 만 샘플 장을 무료로 다운로드 할 수 있지만 라이브러리에 액세스하거나 구입할 수있는 기회가 있기를 바랍니다.

+0

답장을 보내 주셔서 감사합니다. 많은 도움이되었습니다. ppm 대신 kppm을 사용해야합니까? – JerT

+1

만약'ppm'을 가진 불균일 포아송 모델에 적합하고 그 모델에 의해 설명 된 것보다 더 많은 데이터 포인트가 있다고 결정한다면 실제로'kppm'을 사용할 수 있습니다 (또는'R =''R =''Interaction = AreaInter (R)') 상호 작용 범위의 종류 -이 책의 13 장 참조). –

+0

불편을 드려 죄송합니다. ppm에 대한 추가 질문이 있습니다. 나는 인구 밀도를 계산했지만, spatstat 도움말을 반복해서 읽은 후에는 계산 된 밀도를 어떻게 사용하는지 전혀 모른다. 공변량으로 사용하고 사건 ppp에 맞춘다면 플롯 함수는 플롯 할 아무 것도없는 평평한 표면을 반환합니다. 이 ok입니다. fit = ppm (inc_ppp, ~ dens_pop) – JerT