UUID 형식을 포함하는 파일도 구문 분석 중입니다. 파일을 구문 분석 할 수 없어이 오류가 발생합니다. /127.0.0.1:54321에서는 DistributedException 'NewChunk가 숫자를 입력 갖지만, VEC는 타입 UUID이다'에 java.lang.AssertionError 의한 : NewChunk가 숫자를 입력 갖지만, VEC는 타입
저는 현재 희소 가치가 10k-100k 샘플 (cell s) x 20k 특징 (gene s) 인 단일 세포 RNA 시퀀싱 데이터를 사용하고 있으며 많은 메타 데이터도 포함하고 있습니다. 기원의 조직 ("두뇌"대 "간"). 메타 데이터는 ~ 10-100 열이며 pandas.DataFrame으로 저장됩니다. 지금, 나는 xarray.DataSets을 dict-
현재 R for Data Science을 읽고 일부 그래프를 작성하려고합니다. 막 대형 차트에서 비율을 얻으려면 group = 1을 사용해야 함을 이해합니다. 예를 들어, 아래의 코드는 작동합니다. library(ggplot2)
ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, fill = color
$ 100에서 $ 1000까지의 지불을 포함하는 총 지불 이름의 데이터 세트가 있습니다. $ 100.05, $ 102 또는 104.05 인 지불이 있기 때문에 더 어려워집니다. 행에 인스턴스 $ 97이 표시되면 $ 100 이하 또는 100 - 200 미만의 카테고리가있는 열을 만들고 싶습니다. 이렇게 코딩했습니다. 하지만 출력은 다음, 모든 행이 800과
50 개의 예측 변수와 1 개의 대상 변수가 있습니다. 모든 예측 변수와 대상 변수는 이진수 0과 1 만 있습니다. R을 사용하여 분석을 수행합니다. 4 가지 알고리즘을 구현할 것입니다. 1. RF 2. 로그인 등록 3. SVM 4. LDA 나는 다음과 같은 질문이 : 을 나는 요인을 모두 변환합니다. 내 변수를 다른 알고리즘에 넣기 전에 어떻게해야합니까?
나는 Kaggle에서 얻은 데이터 세트에 대한 의사 결정 트리를 만들려고합니다. 실제 데이터 세트를 다루는 데 대한 경험이 없기 때문에 데이터 정리, 통합 및 스케일링 (주로 스케일링)을 처리하는 방법을 알지 못합니다. 예를 들어, 실제 숫자가있는 기능이 있다고 가정 해 보겠습니다. 그래서 특정 그룹 수 (소수의 의사 결정 트리 만들기)로 확장하여 범주 형
나는 다음이 코드를 실행하면이 같은 오류가 발생합니다 이름 DF하고 코드은 - df = pd.DataFrame({'string': list('abcdef'),
'int64': list(range(1,7)),
'uint8': np.arrange(3,9).astype(u1),
'bool1': [True,False
나는 하나 개의 유럽 은행에 대한 단기 데이터 과학 위치에 대한 인터뷰를했고 나는이 경우 가지고 : 우리는 미래 비용을 고객을 예측 할 수있을 것입니다 모델을 개발하고자합니다. 고객이 수년간(시간, 금액, 수령자 등)으로 만든 모든 거래에 대한 데이터가 있다고 가정합니다. 나는 먼저 보험, 물 또는 인터넷과 같은 월별 지불금을 예측해야한다고 가정하지만, 어
먼저, 저는 AI의 대학 그룹에서 임무를 맏고 있습니다. PGM P2 (ASCII) 형식의 많은면이있는 데이터 세트가 있습니다. Neural Network 프로세스를 시작하기 전에 이미지에서 픽셀 배열을 추출해야하지만 파이썬에서 이러한 이미지를 읽을 수있는 방법을 찾지 못했습니다. 이미 PIL을 사용해 보았지만 PGM P2에서는 작동하지 않습니다. 파이썬에