나는 질문에 의아해하고 귀하의 의견을 원합니다. 나는 convolution을 연구 중이다. tensorflow의 신경망. 이제 태그가있는 이미지가 있습니다. 약 10000 개의 고유 태그가 있으며 이미지에 자동으로 태그를 지정하고 싶습니다. 이제 라벨에 하나의 핫 인코딩을 사용합니다. 10000 개의 고유 태그의 경우 기능 손상과 유사합니다. 그런 상황에
데이터 세트를 사용하여 vcd 패키지에서 하나의 핫 인코딩을 수행합니다. 이렇게하려면 purrr::dmap_if과 Matrix::model.matrix을 함께 사용하고 싶습니다. 내가 달릴 때 do.call(model.matrix, list(Improved~.,Arthritis))
잘 작동한다. 내가 코드 아래 사용는 dmap_if는 데이터 세트 한 번
Python 2.7 (miniconda interpreter)에서 사용. 약 OneHotEncoder에 대한 예를 아래에 혼동하면 enc.n_values_ 출력이 [2, 3, 4] 인 이유가 무엇입니까? 누구든지 명확히하는 데 도움이 될 수 있다면 좋을 것입니다. http://scikit-learn.org/stable/modules/generated/skl
LabelEncoder 및 OneHotEncoder은 문자열을 0,1 기반 벡터로 변환하는 수적으로 매우 효과적인 배열입니다. 제 질문은 팬더 데이터 프레임의 열을 0, 1 벡터로 변환하는 깔끔한 API가 있습니까? 나는 팬더 데이터 프레임 123.csv의 코드와 원시 내용을 보여 주었고, c_a, c_b, c_c의 2 진수 0, 1을 원한다고 가정합니다.
저는 2 개의 범주 형 변수와 ID 변수 및 대상 변수 (분류 용)가있는 판다 데이터 프레임을 가지고 있습니다. 나는 OneHotEncoder와 함께 범주 형 값을 변환 할 수 있었다. 이렇게하면 드문 드문 한 행렬이 생성됩니다. ohe = OneHotEncoder()
# First I remapped the string values in the cate