categorical-data

    0

    1답변

    큰 데이터 집합을 R로 가져오고 신속하게 열을 통과하고 열에 범주 값, 숫자, 날짜 등이 있는지 여부를 확인하는 방법이 있는지 궁금합니다. str(df) 또는 class(df) 인 경우 열이 대부분 잘못 표시됩니다. 예를 들어, 일부 열은 숫자로 표시되지만 열에는 10 개의 고유 한 값 (1에서 10까지) 만 표시되므로 실제로 요소 여야합니다. 등급을 나타

    1

    1답변

    나는 변환 범주 변수 import numpy as np import pandas as pd import sklearn from sklearn.base import BaseEstimator, TransformerMixin from sklearn import linear_model from sklearn.pipeline import Pipeline

    0

    1답변

    가 여기 내 예입니다 범주 값을 플롯 할 수 없습니다 import matplotlib.pyplot as plt test_list = ['a', 'b', 'b', 'c'] plt.hist(test_list) plt.show() 그것은 다음과 같은 오류 메시지가 생성 TypeError Traceback (most recent call

    0

    2답변

    데이터 마이닝을 처음 사용했습니다. 저는 이사 이름을 포함하는 데이터 세트를 가지고 있습니다. Scikit이 견적서가 문제없이 사용할 수있는 것을 배울 수있는 올바른 방법은 무엇입니까? 인터넷에서 발견 한 것부터 sklearn.preprocessing.LabelEncoder가 올바른 선택이라고 생각했습니다.

    2

    1답변

    Fathom이라는 소프트웨어의 그래픽을 만들고 싶습니다. 은 내가 변동 플롯과 같은 무언가를 창조하고자하는 범주 주파수 데이터의 양방향 표를 가지고 있지만, 주요 차이점은 각각의 데이터 포인트를 볼 수 있다는 것입니다. ggfluctuation(...), levelplots(...) 및 모든 종류의 패키지 (예 : ggplot2)를 시도했지만 성공하지 못했

    4

    1답변

    저는 파이썬에서 일부 모델을 카테고리별로 데이터 하위 집합으로 실행하고 있습니다. 메모리 사용 및 전처리의 경우 모든 범주 형 변수가 범주 데이터 형식으로 저장됩니다. 내 '그룹화'열에 범주 형 변수의 각 수준에 대해 회귀 분석을 실행합니다. 여기서 모든 범주 형 변수를 해당 하위 집합에있는 변수로 재설정해야합니다. 현재 총 실행 시간의 약 50 %를 차지

    1

    1답변

    교육 데이터 세트가 20 개이며 모델 교육에 사용해야하는 요소가 모두 있습니다. 테스트 데이터 세트를 적용해야합니다. 내 예측 및 제출 모델. 나는 초기 데이터 탐색을하고 있었고 호기심을 벗어나서 모든 범주 형 변수를 다루기 때문에 훈련 데이터 및 테스트 데이터 수준을 확인했다. 나의 당황 스러움에 따라 대부분의 범주 (변수)는 교육 수준이 다르며 테스트

    -1

    1답변

    9 개의 연속 데이터 열과 4 개의 범주 데이터가 포함 된 데이터 집합이 있다고 가정 해 보겠습니다. Matlab에서는 열을 두 그룹으로 나누어 개별적으로 교육/테스트 (순진한 베이)를 수행하고 연속 열의 오류율이 0.45이고 범주 형 열의 오류가 0.33임을 확인합니다. 내 질문은 - 어떻게 결합 오류를 결정합니까? 편집 - 간단한 의사 개요 추가 : f

    2

    4답변

    41 개 [0에서 40 개까지]의 피쳐가있는 데이터 세트가 있으며 그 중 7 개가 카테고리입니다. 문자열 유형의 서브 세트 (열 - 기능 1, 2, 3) 바이너리 형식으로 0 또는 1 INT 형의 서브셋합니다 (칼럼 -이 무조건 세트는 두 개의 서브 세트 나누어 져 특징 6, 11, 20, 21) 또한 열 기능 1, 2 및 3 (문자열 유형)은 각각 카디널

    1

    1답변

    올해의 달을 나타내는 반짝이는 슬라이더를 만들려고합니다. 이상적으로, 나는 개월이 정수가 아닌 문자열/문자로 표시되도록하고 싶습니다 (1 = 1 월, 2 = 2 월 등). 내가 this answer이라는 샤이니 슬라이더에 문자를 표시 할 수있게 해주는 this question을 찾았습니다. 012. JS 코드를 R에 삽입합니다. 예를 들어 위의 대답을 변경