0

Heyall,CS 실험에서 비 결정론의 정량화

저는 컴퓨터 과학에서 석사 학위 논문을 연구하고 있습니다. 더 구체적으로, 나는 통계적 의존성 파서의 특징으로 사용될 때 분산 의미 론적 모델의 하이퍼 파라미터를 튜닝하는 효과에 대한 연구를하고있다. 나는 비 결정 론적 신경망 기반 단어 임베딩 소프트웨어 인 word2vec를 사용하고 있습니다. 결과를 검증 할 수 있으려면 모델에서 비 결정론의 정도를 계량화해야합니다.

그러나이 질문은보다 추상적 인 수준에서 질문 할 수 있다고 생각합니다. 통계 모델에서 비 결정 성의 정도를 정량화하기 위해 어떤 테스트를 사용할 수 있습니까? 어떻게 내 시스템이 "어떻게 비 결정적"확인하고 수락하거나의 결과를 폐기하기위한 기초로 사용할 수 있습니다

89.5, 89.7, 89.4, 89.5, 89.9 

: 같은 실험을 다섯 번 수행 할 때 나는 다음과 같은 결과를 얻을 예를 들어 말 미래 실험?

답변

2

테스트를 통해 유의도 또는 가설 테스트를 의미하는 경우 해당 테스트는 쓸모가 없으므로 무시할 수 있습니다.

언어 구문 분석 또는 다른 어떤 것에 대한 불확실성을 정량화하는 적절한 방법은 불확실성을 확률로 표현하는 것입니다. 언어 파싱의 문맥에서, 그것은 주어진 문장을 파싱 할 수있는 가능한 방법에 대한 확률 분포를 구성하는 것을 의미합니다.

의사 결정이 필요한 경우 결과 (예 : 유틸리티 기능)에 대한 선호도를 나타내는 추가 데이터를 제공해야합니다. 확률과 효용은 소위 기대 효용 가설을 통해 결합된다. 최선의 작용은 기대 효용을 최대화하는 것이다.

많은 분야의 예를 사용하여 이러한 개념을 소개하는 것은 Robert Clemen의 "Hard Hard Decisions"입니다. 귀하의 문제에 더 구체적으로, 확률 론적 언어 파싱을위한 웹 검색은 많은 히트를 불러옵니다.

이 질문에 대한 자세한 내용은 stats.stackexchange.com을 참조하십시오. 이미 관련 질문에 대한 답변이있을 수 있습니다.