맞춰보세요. num_classes
인수는 로그 균일 (Zipfian) 분포에서 음수 레이블을 샘플링하는 데 사용됩니다.
여기에 link to the source code 같습니다
는
# Sample the negative labels.
# sampled shape: [num_sampled] tensor
# true_expected_count shape = [batch_size, 1] tensor
# sampled_expected_count shape = [num_sampled] tensor
if sampled_values is None:
sampled_values = candidate_sampling_ops.log_uniform_candidate_sampler(
true_classes=labels,
num_true=num_true,
num_sampled=num_sampled,
unique=True,
range_max=num_classes)
range_max=num_classes
인수는 기본적으로 또한이 분포의 형상 및 상기 샘플링 값의 범위를 정의 - [0, range_max)
한다. 이 범위 은 레이블에서 정확히을 추론 할 수 없습니다. 특정 미니 배치는 작은 단어 ID 만 가질 수 있기 때문에 배포를 크게 왜곡 할 수 있습니다.