사람들의 목록이 있으며 사람 X
과 같은 사람을 찾고 싶다고합시다.부분적으로 알려지지 않은 벡터의 가장 가까운 이웃
특징 벡터에는 [weight, height, age]
의 3 개 항목이 있으며 우리 목록에는 3 명이 있습니다. 우리는 사람 C의 높이를 모른다. C.
A: [70kg, 170cm, 60y]
B: [60kg, 169cm, 50y]
C: [60kg, ?, 50y]
은 무엇
사람을 찾을 수있는 가장 좋은 방법이 될 것이다 사람에 가장 가까운?
내 생각 엔
는의 높이에 대한 평균 값을 계산하자, 대신 알 수없는 값을 사용합니다.
따라서 170cm
은 높이의 평균값이며, 사람 C
은 [60kg, ~170cm, 50y]
으로 다시 정의한다고 가정 해 봅시다.
이제 A에 가장 가까운 사람들을 찾을 수 있습니다. A, C, B
이됩니다.
문제는 이제, 문제는 우리가 알려진 169cm
보다 B
전에 짐작 ~170cm
로 C
을 넣어 것입니다.
다소 잘못되었습니다. 우리 인간은 기계보다 더 똑똑하며, C
이 정확히 170cm
이 될 가능성이 거의 없음을 알고 있습니다. 따라서 B를 169cm
과 함께 넣는 것이 C
보다 먼저 입력하는 것이 좋습니다.
하지만 어떻게 벌칙을 계산할 수 있습니까? (간단히 경험적 알고리즘이 바람직 함) 알 수없는 값으로 벡터를 처벌해야합니까? 그리고 얼마나 많이 (어쩌면 세트의 두 사람의 높이 사이의 평균 차이를 계산할 것인가?)?
그리고 특징 벡터의 차원이N
이며이 K
알려진 항목과 알 수없는 U
(K + U = N
)을 가질 때 어떻게 penalisation은 일반적인 경우처럼 보일 것?
비율이 좋은 아이디어! 감사! –