나는 Singular Value Decomposition을 배우는 중입니다. 어떤 목적으로이 개념을 사용할 수 있는지, 그리고 내가 읽고있는 책에서 SVD가 잠정적 의미 색인 작성에 사용되었다고 언급했습니다. 나는 LSI에 관한 기사를 거의 읽지 않았고, 검색 엔진이나 비슷한 응용 분야에서 LSI가 주로 사용 된 것처럼 보인다. 저는 LSI에서 소량의 데이터 분석 프로젝트를 진행하고 싶었습니다. 여기 내가 함께 일하는 것이있다.잠복 성 시맨틱 인덱싱 (LSI)
나는 약 20000 개의 게임 목록을 가지고 있으며이 목록의 속성 중 2 개는 게임 장르와 게임이 출시 된 플랫폼입니다. 플랫폼과 장르 속성에 대한 정보를 얻기 위해 LSI를 사용하고 싶었습니다.
처음에는 행이 24 개의 장르를 나타내고, 열이 22 개의 다른 플랫폼을 나타내는 동시 발생 행렬을 만들었습니다. 그런 다음 공존 행렬의 SVD 분해를 수행하여 U와 V의 처음 두 열을 추출하고 U와 V에 대한 2 차원 플롯을 작성했습니다. 플롯은 다음과 같이 보입니다.
그래서 내 질문이이 잠재 의미 색인의 의미있는 사용으로 간주 될 수 있으며, 나는이 그래프에서 해석 할 수있는 방법도있다? 예를 들어, 장르 액션과 플랫폼 PC는 다른 모든 변수와 거리가 멀다는 것을 알 수 있습니다. 특히이 장르와 플랫폼에 대해 알려주습니까?감사합니다.