-2

사이의 의미 상 유사성을 자동으로 계산하는이 링크 link1link2의 코드를 기반으로 프로그램을 작성하는 데 도움이 필요합니다. 연속적인 문장 및 b. 문장은 1 개의 중재 문구, 전체 및 전체 문장 (1000 문장)으로 구분됩니다.텍스트에서 문장 사이의 시맨틱 일관성 찾기

제공된 코드가 이미 토큰 화되어 의미 상 유사성을 찾을 수 있지만 전체 텍스트 (a, b)에 걸쳐 연속 및 "중간"문장 사이의 의미 상 유사성을 계산하고 표시하는 새 코드를 작성하는 방법을 알지 못합니다.) 나는 같은 일을 반복해서 반복하고 싶지 않다.

+0

당신은 [((http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf) word2vec] 봤어 또는 this] (https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-vectors/))? 나는 파이썬 구현을 과거와 비슷한 것으로 사용했다. – Fruitspunchsamurai

+0

안녕하세요,이 기사는 대부분 내가 이해하는 이론입니다. 아이디어를 코드에 적용하고 프로세스를 자동화하는 데 문제가 있습니다. –

+1

지금까지 어떤 시도를 했습니까? 필자는 파일을 줄 단위로 읽고 다음 줄/인접한 구와 비교하는 프로그램이 있다고 상상해보십시오. – Fruitspunchsamurai

답변

0

다음 코드는 원하는대로 수행해야하며 출력 형식을 원하는대로 조정하십시오.

with open("sentence_file_name", "r") as sentence_file: 
    while x and y: 
    x = sentence_file.readline() 
    y = sentence_file.readline() 
    similarity(x, y, boolean) #boolean set to false or true depending on what you want 
    x = y 
    y = sentence_file.readline() 
+0

정말 유감 스럽지만 링크에 제공된 코드에서 어디에서 구현할 것인가? –

+0

1-245 줄에서 모든 것을 복사/포크 한 다음 위의 코드를 아래에 추가하십시오. sentence_file_name을 문장 파일의 상대 경로와 바꾸십시오. 이것은 기술적으로 깨끗한 방법은 아니지만 아마도 가장 간단한 방법 일 것입니다. – Fruitspunchsamurai