2017-10-05 13 views
0

word2vec와 함께 사용되는 "음수 샘플링"및 "서브 샘플링"이라는 용어를 듣고 있습니다.음수 샘플링 및 서브 샘플링

word2vec을 엉망으로 만들려고하기 전에 단어 삽입을 참조하는 문서를 다시 살펴보고 처음부터 시작하려고합니다. 용지 흔적이 나를 여기에 착륙했습니다 :

https://gul.gu.se/public/pp/public_courses/course77642/published/1497871737091/resourceId/37659332/content/UploadedResources/lecture10-slides-word2vec_sungmin_VT17.pdf (. Google은하지 신뢰 링크를 할 경우 "벡터 공간의 말씀 표현의 효율적인 평가"에 대한)

및 상태 :

enter image description here

(모든 글 머리 기호에서 첫 글자를 뺀 부분에 익숙합니다.)

부정 샘플링 및 서브 샘플링에서 발견 한 유일한 내용은 word2vec에 대한 기사 내에 포함되어 있으며 나는 피하려고 노력하고있어.

누구나이 용어를 설명하거나 올바른 방향으로 나를 가리킬 수 있다면 크게 환영 할 것입니다. :)

편집 :

"서브 샘플링은 모든 관측치보다 적은이에 사용 된 원래의 샘플 크기 대 (교체 그려되고있는 부트 스트랩와 유사한 리샘플링 절차는 : 그것은 자기의 서브 샘플링 태그는이 정의에 이르게 교과서 부트 스트랩 방법). 기존 데이터에서 샘플을 생성하려면 대신 "샘플링"태그를 고려하십시오. " --- 이것의 구체적인 예가 훌륭합니다.

답변

1

네가티브 샘플링을 마침내 발견했습니다. 컴퓨터 과학을 공부하고 "점을 연결하십시오"라는 그래프를 모두 알면 구체적인 예를 원하는 사람들에게 매우 유용한 링크가 될 것입니다.

https://www.safaribooksonline.com/library/view/mastering-java-for/9781782174271/056ce305-83f2-4efe-993a-b549b7ea3133.xhtml

(또는 구글 : "데이터 과학 부정적인 샘플링 자바 마스터")

서브 샘플링를 들어, 나는 NLP을 위해 그것을 사용할 것, 그래서 이것은 가장 관련성이 있었다 :

enter image description here

(취한 https://www.safaribooksonline.com/library/view/python-natural-language/9781787121423/f7035ac3-7624-4b80-b464-64ed8a7f252a.xhtml)