저는 Markov Chains을 연구 중이며, 텍스트 파일을 입력으로하여 확률 적 천이 행렬 (순서 n)을 구성하는 효율적인 알고리즘을 알고 싶습니다.확률 천이 행렬
하나의 알고리즘이 끝난 것이 아닙니다. 그런 알고리즘 목록을 만들고 싶습니다. 이러한 알고리즘에 관한 논문은 용어에 관한 모든 정보 등을 환영합니다.이 주제는 n-gram 식별 알고리즘과 매우 유사합니다.
도움을 주시면 감사하겠습니다.
저는 Markov Chains을 연구 중이며, 텍스트 파일을 입력으로하여 확률 적 천이 행렬 (순서 n)을 구성하는 효율적인 알고리즘을 알고 싶습니다.확률 천이 행렬
하나의 알고리즘이 끝난 것이 아닙니다. 그런 알고리즘 목록을 만들고 싶습니다. 이러한 알고리즘에 관한 논문은 용어에 관한 모든 정보 등을 환영합니다.이 주제는 n-gram 식별 알고리즘과 매우 유사합니다.
도움을 주시면 감사하겠습니다.
이 두 가지 질문이있는 것처럼, 당신은 명확하게해야한다 들린다 : 하나 '텍스트 파일'확률 값과 "n"을 포함하고 직접 행렬을 구축,하지만 그것을 코딩하는 방법을
'텍스트 파일'은 신호 데이터와 비슷한 것을 포함하고 있으며이를 Markov Chain으로 모델링하려고합니다.
'마르코프 체인'은 일반적으로 1 차 확률 과정을 의미한다, 그래서 당신이 "순서", 행렬의 아마 크기에 의해 무슨 뜻인지 다음 모르겠어요,하지만 그건 일반적인 용어가 아닙니다. 어쨌든, 1 차, n x n 행렬, 이산 시간 무작위 과정에서 비터 비 알고리즘을 살펴보아야합니다. http://en.wikipedia.org/wiki/Viterbi_algorithm
비터 비 (Viterbi)를 세컨딩하고보다 일반적으로는 숨겨진 마코프 모델 (HMM)을 사용합니다. – Tobu
언제든지 마침내 crm114 Discriminator을 보게됩니다. 첫째, 그는 실제로 다른 모델이 무엇인지에 대해 자세히 설명합니다 (애플리케이션이 무엇인지에 따라 마르코프가 항상 최고는 아님). 확률 론적 모델이 작동하는 방식에 대한 일반적인 링크와 많은 배경 정보를 제공합니다. crm114는 일반적으로 일종의 스팸 식별 도구로 사용되지만 실제로는 다른 응용 프로그램에서 사용한 일반적인 확률 엔진입니다.
지금도 필요합니다. – dfa
dfa : http://nltk.googlecode.com/svn/trunk/doc/api/nltk.model.ngram.NgramModel-class.html, http : //를 확인하십시오. www.d.umn.edu/~tpederse/nsp.html, 내가 가지고있는 몇 가지 포인터들. –
"주어진 텍스트 파일을 입력으로": 그리고 그 텍스트 파일에는 무엇이 있습니까? 귀하가 구성하고자하는 마크로프 체인과 귀하의 의견 사이의 관계는 무엇입니까? – meriton