-2
나는 다음과 같은 정보를 얻을 짧은 문장 분류 문제 일하고

을위한 기능결합 워드 벡터와 스칼라 분류

입력 사람의 사람 (1-100) 성별 (남성의 나이 또는 여자) 문장을 모델링하기 위해 문장

출력 라벨 (콘텐츠의 종류)

의 내용 나는 tfidf와 결합 된 word2vec를 사용하고 있습니다. 또한 분류 기준에 문장을 삽입 할 때 연령과 성별을 특징으로 추가하고 싶습니다. 이 작업을 수행하는 올바른 방법은 무엇입니까? 임베딩은 n 차원 배열 및 나이이므로 성별은 스칼라입니다. 나는 그들을 추가하고 데이터를 시각화하는 방법에 대해 혼란스러워합니다.

답변

0

단어 삽입은 n 차원 벡터로만 n 스칼라입니다.

예를 들어 단어 벡터에서 파생 된 300 차원 벡터가 있고 연령 스칼라 (1-100), 성별 스칼라 (아마도 0 또는 1)가 있으면 분류 기준에 302 개의 데이터 차원이 있습니다.

이러한 다양한 기능을 함께 연결하는 예는 sklearn FeatureUnion transformer을 참조하십시오. 이러한 다양한 기능을 더 비슷한 범위/분포로 조정하면 일부 분류 기준이 더 잘 수행 될 수 있습니다.