missing-data

0열

1답변

줄리아에 누락 된 값 ("NA")이있는 파일을 가지고 있어야합니다. 내가 파일을 읽을 수 사용하고 명령은 다음과 같습니다 file = readdlm("FILE_NAs.txt", header=false) 문제는 내가 "NA"의 때문에 (행렬 곱셈 같은) 수학 방정식에서이 파일을 사용할 수 없다는 것입니다. "DataArray"패키지와 "dropna (file

0열

1답변

날짜 열에 NA를 바꾸는 방법

날짜가 포함 된 데이터 프레임에 날짜 열인 열이 있습니다. 그러나이 칼럼에서 NA를 제거하려고하면 문자 클래스가 아니기 때문에 할 수 없습니다. 그래서 나는이 솔루션을 사용하여 문자 클래스로 변환 : Setting to Blank 그럼 난 아직도 내가 as.Date를 사용하여 다시 변환하지만 다시 NA의 생성 내 날짜 열이 날짜 클래스가되고 싶어요. 그래서

2열

2답변

짝을 이룬 데이터로 데이터 세트 만들기 및 행렬로 변환

그래서 저는 R을 사용하여 phytools 패키지의 phyl.pca 함수를 사용하는 데이터 세트에서 계통 발생 PCA를 시도합니다. 그러나 함수에서 허용하는 방식으로 데이터를 구성하는 데 문제가 있습니다! 그리고 그게 전부가 아닙니다. 약간의 실험을했는데 더 많은 문제가 있다는 것을 알고 있습니다. 나는이 문제에 대해 자세히 알고 있습니다 ... 바로 데이

2열

1답변

Python : 누락 된 데이터를 입력하지 않고 기계를 학습

저는 현재 매우 특정한 데이터 세트로 작업하고 있습니다 : 약 1000 개의 열과 1M 개의 행이 있지만 값 중 90 %는 Nan입니다. 이것은 레코드가 좋지 않기 때문에가 아니라 데이터가 개인에 대한 측정을 나타내며 약 100 개의 기능 만 각 개인과 관련되기 때문입니다. 따라서 누락 된 값을 입력하면 데이터의 정보가 완전히 파괴됩니다. 동일한 기능을 가

7열

3답변

dplyr을 사용하여 NA를 이전 값 또는 다음 값과 그룹으로 바꾸십시오.

날짜의 내림차순으로 정렬 된 데이터 프레임이 있습니다. ps1 = data.frame(userID = c(21,21,21,22,22,22,23,23,23), color = c(NA,'blue','red','blue',NA,NA,'red',NA,'gold'), age = c('3yrs','2yrs',NA,NA,'3yrs',NA,NA,

1열

1답변

삽입 행

내가 파이썬에 새로운 오전이 내 첫 번째 게시물입니다 값, 그래서 나는 어떤 모호한 어법을 끼쳐 드려 죄송합니다. I는 몇 번 반복 5 1에서 증가 열 A의 테이블을 갖는다. 나는 열 A를 스캔하고이 패턴 A에 대한 정확한 숫자를 삽입 일치하지 않는 경우, 열 C를 복사하고 열 B에 대한 누락 된 값을두고 싶습니다 그냥 올바른 장소에서 누락 된 값이있는 행

1열

1답변

팬더를 사용하여 범주 값을 채우지 않습니까?

누락 된 범주 셀에 열당 새 값을 채우고 싶습니다. 예를 들어 : c1 c2 c3 a nan a b q nan c d nan a p z 뭔가 같은 c1 c2 c3 a n1 a b q n2 c d n2 a p z 내 현재의 문제는 내가 categorials 열에 DictVectorizer를 사용하고 있다는 점이다이되어야하지만 그대로는 N

5열

1답변

팬더 : null 값을 groupby의 평균으로 채우는 방법은 무엇입니까?

나는 데이터 집합 일부 다음과 같습니다 누락 된 데이터 것 같습니다 내가 모델의 데이터를 사용하여 널 (null)에 입력해야 id category value 1 A NaN 2 B NaN 3 A 10.5 4 C NaN 5 A 2.0 6 B 1.0 . 범주가 처음 발생할 때마다 NULL입니다. 두 번째 값이있는

4열

2답변

Null을 NA로 변경하는 함수

Null 값을 NA로 바꾸는 함수를 작성하려고합니다. 내 열의 요약은 다음과 같습니다. a b 12 210 468 12 개의 빈 값을 NA로 변경하고 싶습니다. 이 가지고 올이 나는 또한 NA에 널 값을 변경하려면하는 몇 가지 다른 요소의 열이, 그래서 나는 여기에서 몇 가지 물건을 빌려 : # change nulls to NAs nullToNA

1열

1답변

판다에서 fillna()를 선택적으로 사용하기

DataFrame에 N/A 값을 선택적으로 채우고 싶습니다. 특히 컬럼 내에 연속적인 시퀀스가있는 경우, 나노 시퀀스의 길이가 지정된 임계 값 미만인 경우에만 이전의 non-nan 값으로 채워지 길 원합니다. 예를 들어, 임계 값이 3이면 3 이하의 컬럼 내 시퀀스는 이전의 non-nan 값으로 채워지는 반면 4 개 이상의 시퀀스는 그대로 남습니다. 2 5