R에서는 약 42,900 행의 기본 CSV 파일을 읽으려고합니다 (Unix의 wc -l에 의해 확인 됨). 관련 코드는R의 read.csv()는 행을 생략합니다
vecs <- read.csv("feature_vectors.txt", header=FALSE, nrows=50000)
입니다. 여기서 nrows는 약간 과대 평가됩니다. 그러나,
>> dim(vecs)
[1] 16853 5
을 나타내며, 결과 데이터 프레임은 17,000 행 정도를 나타냅니다. 이것이 메모리 문제입니까? 각 행은 ~ 30 자의 해시 코드, ~ 30 자의 문자열 및 3 개의 정수로 구성되므로 파일의 총 크기는 약 4MB에 불과합니다.
관련성이있는 경우 많은 행에 입력란이 누락되어 있음을 유의해야합니다.
도움 주셔서 감사합니다.
* 가져온 * 행을 올바르게 가져 왔는지 확인 했습니까? – blahdiblah
내 생각 엔 당신이 불일치한'''을 삽입했다는 것입니다. 그래서 여러분의 행 중 일부는 실제로는 훨씬 길어집니다.'apply (vecs, 2, function (x), max (nchar (as .character (x)))'확인하는 것. – Justin
예스! 저스틴이 얻었습니다. 'quote = ""'문제가 수정되었습니다. – Cardano