2016-06-02 1 views
0

나중에 R에 가져 오려는 파일이 .bam입니다. R에서 여러 (150+) 개의 대용량 파일을 가져 와서 처리 할 수 ​​있기를 원합니다. 도서관 자료실에서 가져온 실험 데이터는 작동하지만 내 D:/ drive의 자체 데이터 세트는 작동하지 않습니다.(라이브러리가 아닌) .bam 파일 가져 오기 R

나는 패키지 Rsamtools를 사용하여 시도하고 다음 명령을 사용 :

다음과 같은 출력을 생성
> filename <- "1658_AR_hisat2_sorted.bam" #Change filename as necessary 
> (bf <- BamFile(filename)) 

:

class: BamFile 

path: 1658_AR_hisat2_sorted.bam 

isOpen: FALSE 

yieldSize: NA 

obeyQname: FALSE 

asMates: FALSE 

qnamePrefixEnd: NA 

qnameSuffixStart: NA 

을하지만 난 후 실행하면

> bam <- scanBam(bf, param=param) 

값 [3L]의 오류 : 파일 (들) 존재하지 않는 : 를 '1658_AR_hisat2_sorted.bam'

왜 파일이 ​​존재하지 이 BamFile를 열지 못했습니다? 파일이 너무 클 수 있습니까?

답변

0

bam <- scanBam(BamFile(file.choose()), 
       param=param) 

을 시도하고 파일을 선택

# list of .bam 
dat_bam <- list.files(path = ".", pattern = ".bam", all.files = FALSE, 
      full.names = FALSE, recursive = FALSE, 
      ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE) 
# import all 
list_bam <- lapply (dat_bam , scanBam) 
+0

나는 오류가 '(PARAM "ScanBamParam")는 오류 얻을 : 객체 PARAM은 ' 을 found'하지 'param'을 그냥 제거 할 수 있습니까? 그리고 그것을 어떻게 대규모로 처리 할 수 ​​있습니까? – Dymphy

+0

이 내용을 확인하십시오 https://bioconductor.org/packages/devel/bioc/vignettes/Rsamtools/inst/doc/Rsamtools-Overview.pdf 그들은 청크로 처리 할 수 ​​있다고 말합니다. –

+0

나는 사실 150 개 이상의 파일을 가지고 있으며, 나는 그들을 손으로 선택할 매우 열심이 아니다. – Dymphy