줄리아에 누락 된 값 ("NA")이있는 파일을 가지고 있어야합니다. 내가 파일을 읽을 수 사용하고 명령은 다음과 같습니다 file = readdlm("FILE_NAs.txt", header=false) 문제는 내가 "NA"의 때문에 (행렬 곱셈 같은) 수학 방정식에서이 파일을 사용할 수 없다는 것입니다. "DataArray"패키지와 "dropna (file
날짜가 포함 된 데이터 프레임에 날짜 열인 열이 있습니다. 그러나이 칼럼에서 NA를 제거하려고하면 문자 클래스가 아니기 때문에 할 수 없습니다. 그래서 나는이 솔루션을 사용하여 문자 클래스로 변환 : Setting to Blank 그럼 난 아직도 내가 as.Date를 사용하여 다시 변환하지만 다시 NA의 생성 내 날짜 열이 날짜 클래스가되고 싶어요. 그래서
그래서 저는 R을 사용하여 phytools 패키지의 phyl.pca 함수를 사용하는 데이터 세트에서 계통 발생 PCA를 시도합니다. 그러나 함수에서 허용하는 방식으로 데이터를 구성하는 데 문제가 있습니다! 그리고 그게 전부가 아닙니다. 약간의 실험을했는데 더 많은 문제가 있다는 것을 알고 있습니다. 나는이 문제에 대해 자세히 알고 있습니다 ... 바로 데이
저는 현재 매우 특정한 데이터 세트로 작업하고 있습니다 : 약 1000 개의 열과 1M 개의 행이 있지만 값 중 90 %는 Nan입니다. 이것은 레코드가 좋지 않기 때문에가 아니라 데이터가 개인에 대한 측정을 나타내며 약 100 개의 기능 만 각 개인과 관련되기 때문입니다. 따라서 누락 된 값을 입력하면 데이터의 정보가 완전히 파괴됩니다. 동일한 기능을 가
날짜의 내림차순으로 정렬 된 데이터 프레임이 있습니다. ps1 = data.frame(userID = c(21,21,21,22,22,22,23,23,23),
color = c(NA,'blue','red','blue',NA,NA,'red',NA,'gold'),
age = c('3yrs','2yrs',NA,NA,'3yrs',NA,NA,
내가 파이썬에 새로운 오전이 내 첫 번째 게시물입니다 값, 그래서 나는 어떤 모호한 어법을 끼쳐 드려 죄송합니다. I는 몇 번 반복 5 1에서 증가 열 A의 테이블을 갖는다. 나는 열 A를 스캔하고이 패턴 A에 대한 정확한 숫자를 삽입 일치하지 않는 경우, 열 C를 복사하고 열 B에 대한 누락 된 값을두고 싶습니다 그냥 올바른 장소에서 누락 된 값이있는 행
누락 된 범주 셀에 열당 새 값을 채우고 싶습니다. 예를 들어 : c1 c2 c3
a nan a
b q nan
c d nan
a p z
뭔가 같은 c1 c2 c3
a n1 a
b q n2
c d n2
a p z
내 현재의 문제는 내가 categorials 열에 DictVectorizer를 사용하고 있다는 점이다이되어야하지만 그대로는 N
나는 데이터 집합 일부 다음과 같습니다 누락 된 데이터 것 같습니다 내가 모델의 데이터를 사용하여 널 (null)에 입력해야 id category value
1 A NaN
2 B NaN
3 A 10.5
4 C NaN
5 A 2.0
6 B 1.0
. 범주가 처음 발생할 때마다 NULL입니다. 두 번째 값이있는
Null 값을 NA로 바꾸는 함수를 작성하려고합니다. 내 열의 요약은 다음과 같습니다. a b
12 210 468
12 개의 빈 값을 NA로 변경하고 싶습니다. 이 가지고 올이 나는 또한 NA에 널 값을 변경하려면하는 몇 가지 다른 요소의 열이, 그래서 나는 여기에서 몇 가지 물건을 빌려 : # change nulls to NAs
nullToNA
DataFrame에 N/A 값을 선택적으로 채우고 싶습니다. 특히 컬럼 내에 연속적인 시퀀스가있는 경우, 나노 시퀀스의 길이가 지정된 임계 값 미만인 경우에만 이전의 non-nan 값으로 채워지 길 원합니다. 예를 들어, 임계 값이 3이면 3 이하의 컬럼 내 시퀀스는 이전의 non-nan 값으로 채워지는 반면 4 개 이상의 시퀀스는 그대로 남습니다. 2 5