2016-08-25 4 views
2

나는 300 개 이상의 이벤트가 긴 시간이 표시된 이벤트 시퀀스를 다루고있다. 이 데이터는 사용자가 웹 사이트의 다른 페이지를 여러 번 방문하는 웹 로그와 유사합니다. 하나의 시퀀스는 하나의 웹 세션이 될 수 있으며 각 이벤트는 사용자 작업 (방문 페이지, 클릭 버튼 등)입니다.길이가 300+ 이상인 시퀀스에 대해 TraMineR에서 제안 된 형식이나 접근법이 있습니까?

먼저 TSE 형식을 사용했습니다. seqefsub() TraMineR hang을 사용하여 서브 시퀀스를 찾으려고 할 때. 나는 maxk = 5를 설정했고 그것은 작동했다 (이것은 5 개의 이벤트로 검색 될 서브 시퀀스의 길이를 제한한다). 그러나 maxK 6 이상도 중단됩니다. 이 갑작스러운 이유가 확실하지 않습니다. 또한 길이가 15 이벤트 만되도록 이벤트 시퀀스를 정리하면 모든 것이 잘 완료되었습니다. 따라서 이벤트 시퀀스 길이가 명확해야합니다.

시퀀스 길이에 더 견고한 다른 형식이 있습니까? 예 : STS? TraMineR에서이 길이의 서열을 다루는 다른 권장 사항이 있습니까?

답변

1

문제는 시퀀스를 입력하는 데 사용 된 형식과 관련이 없습니다.

TraMineR에는 하위 시퀀스를 검색하기위한 기본 알고리즘 만 있습니다.

귀하의 문제에 대해 더 적절한 도구를 살펴 보시기 바랍니다. 예를 들어 R 패키지 arulesSequences을 고려하십시오.

+0

더 긴 시퀀스를 더 잘 처리한다는 의미입니까? 고마워, 나는 그것을 시험해 볼 것이다. – jojo