2016-10-09 5 views
2

내가하는 나는 R의 poweRlaw 패키지를 사용하고, 45 백만 행 벡터에 전원 법을 피팅하고 있습니다 : https://arxiv.org/pdf/1407.3492.pdf 과정의 가장 연산 집약적 인 부분이 함께 수행되는, 하한을 추정한다매우 큰 데이터 집합에 대해 R에서 poweRlaw 패키지를 사용하는 방법은 무엇입니까?

estimate_xmin() 기능. 그것은 많은 시간을 필요로합니다.

코드 (w는 벡터이며 c_pl는 "연속 지수 법칙"에서 유래)과 같이 간다 :

c_pl <- conpl$new(w) 
est <- estimate_xmin(c_pl) 
c_pl$setXmin(est) 

내가 (처리 시간을 최소화하는 방법으로 estimate_xmin() 함수를 사용하는 방법 궁금 아마 병렬 계산입니까?) 16 코어와 64GB RAM을 갖춘 AWS 인스턴스에서 작업하고 있습니다. 감사.

답변

1

estimate_xmin이 너무 오래 걸리는 이유는 가능한 모든 값인 xmin을 시도하기 때문입니다. 함수에는이 검색을 자르는데 사용할 수있는 xmins이라는 인수가 있습니다 (예 :

estimate_xmin(m, xmins=c(10, 100, 1000, 10000)) 

10, 100, 1000, 10000

+0

감사에서 최적이 xMin을 찾을 것이다! 이 작동합니다. 사실 콜린, 네 패키지가 나에게 아주 유용 했어. poweRlaw를 작성해 주셔서 감사합니다. – numberfive