word2vec와 함께 사용되는 "음수 샘플링"및 "서브 샘플링"이라는 용어를 듣고 있습니다.음수 샘플링 및 서브 샘플링
word2vec을 엉망으로 만들려고하기 전에 단어 삽입을 참조하는 문서를 다시 살펴보고 처음부터 시작하려고합니다. 용지 흔적이 나를 여기에 착륙했습니다 :
는https://gul.gu.se/public/pp/public_courses/course77642/published/1497871737091/resourceId/37659332/content/UploadedResources/lecture10-slides-word2vec_sungmin_VT17.pdf (. Google은하지 신뢰 링크를 할 경우 "벡터 공간의 말씀 표현의 효율적인 평가"에 대한)
및 상태 :
(모든 글 머리 기호에서 첫 글자를 뺀 부분에 익숙합니다.)
부정 샘플링 및 서브 샘플링에서 발견 한 유일한 내용은 word2vec에 대한 기사 내에 포함되어 있으며 나는 피하려고 노력하고있어.
누구나이 용어를 설명하거나 올바른 방향으로 나를 가리킬 수 있다면 크게 환영 할 것입니다. :)
편집 :
"서브 샘플링은 모든 관측치보다 적은이에 사용 된 원래의 샘플 크기 대 (교체 그려되고있는 부트 스트랩와 유사한 리샘플링 절차는 : 그것은 자기의 서브 샘플링 태그는이 정의에 이르게 교과서 부트 스트랩 방법). 기존 데이터에서 샘플을 생성하려면 대신 "샘플링"태그를 고려하십시오. " --- 이것의 구체적인 예가 훌륭합니다.