2015-01-14 5 views
1

seqecmpgroup() 함수는 특정 그룹에 대한 빈도를 포함하는 테이블을 반환합니다. 그러나 이것을 실행하면 1 이하의 빈도가 생성됩니다 (예 : 0.00035). 각 하위 시퀀스가 ​​발생하는 그룹의 수를 나타내는 백분율로이 빈도를 해석해야합니까?seqecmpgroup() 함수의 출력 형식은 무엇입니까?

내가 예를 들어 출력 (각 그룹의 주파수가 "Freq.1", "Freq.2"으로 표시됩니다, 등 :

 Subsequence  Support  p.value statistic index  Freq.1 
1  (FA)-(IN)-(FA) 0.004807692 0.002293660 12.155213 538 0.000000000 
2 (NR)-(TR)-(EX)-(IN) 0.004807692 0.002293660 12.155213 685 0.000000000 
3 (NR)-(TR)-(IN)-(IN) 0.004807692 0.002293660 12.155213 687 0.000000000 
4  (IS)-(IS)-(NR) 0.019230769 0.006788125 9.985161 98 0.040322581 
5  (FA)-(NR)-(QU) 0.012820513 0.009031434 9.414088 172 0.008064516 
     Freq.2  Freq.3 Resid.1 Resid.2 Resid.3 
1 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347 
2 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347 
3 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347 
4 0.007936508 0.00000000 2.3951978 -1.292885 -1.544220 
5 0.003968254 0.04032258 -0.6614769 -1.241085 2.704727 

Computed on 624 event sequences 
    Constraint Value 
    countMethod COBJ 

답변

2

빈도가 실제로 상대 주파수입니다 붙여 넣은 아래. 각 그룹 내에서 상대적인 지원에 해당합니다. 즉, 그룹에서 서브 시퀀스가 ​​포함 된 그룹의 시퀀스 비율을 나타냅니다.

예를 들어, 첫 번째 서브 시퀀스 (FA)-(IN)-(FA)이 발생하지 않는다는 것을 알 수 있습니다 처음 두 그룹에서는 2.4 %의 하위 시퀀스이며, 세 번째 그룹의 시퀀스에서는 2.4 %의 하위 시퀀스입니다.

비율은 제공 될 때 서열 가중치를 설명합니다.

이제 예제 출력에 음수가 표시되지 않습니다. 그리고 0.00035의 값은 0 이하가 아닙니다!