2011-01-19 2 views
4
나는 위키 백과 문서 반면 일반화 된 순차 패턴 알고리즘의 구현 예 (GSP) http://en.wikipedia.org/wiki/GSP_Algorithm

는 일반화 된 순차 패턴 알고리즘 맵리 듀스

을 찾고

는 약간 혼란, 사이비 코드를 제공하며 좀 적절한 코드를보고 싶다 (이상적으로 파이썬이나 자바). 누구든지 좋은 참고를 알고 있습니까?

먼저 알고리즘을 이해하고 잠재적으로 MapReduce 세계에서 작동하게 만들고 싶습니다. 위키 백과 문서에서 카운터 사용이 복잡한 것으로 나타났습니다.

나는 에지가 시간에 의해 제약을받는 이벤트의 그래프를 가지고 있기 때문에 이것을하고 있는데, 시퀀스는 노드가 A와 B가 시작과 종료 시간 사이에 발생하는 다른 노드에 연결되어있는 곳과 B -> C는 첫 x 째 연결에서 B가 완료된 후 x 시간 후에 _ 생합니다. A -> B -> C가 시퀀스 일 때, 시퀀스는 한 번 이상 노드를 다시 방문 할 수 없습니다.

답변

1

당신이 GSP, PrefixSpan, 스페이드, 스팸 및 많은 다른 사람에 대한 몇 가지 자바 코드를하려면이 웹 사이트를 확인 : 당신이지도-감소 알고리즘으로이를 적용 할 수있는 경우

http://www.philippe-fournier-viger.com/spmf/ 그런 다음 확인할 수 있습니다.

1

SPMF는 많은 알고리즘을 구현하는 훌륭한 도구입니다. 많은 시간을 절약 할 수 있습니다. 그러나 순차 패턴 마이닝의 중요한 알고리즘 인 GSP (Generalized Sequential Patterns)와 같은 다른 알고리즘의 성능을 비교해야합니다.