나는 거의 천 개의 html 파일로 된 디렉토리가 있습니다. 각 파일은 되풀이 패턴 (제목)을 기반으로 여러 텍스트 파일로 분할되어야합니다. Windows 머신에서 GnuWin32 도구를 사용하고 있습니다. 나는 하나의 파일에 대해이 작업을 수행 할 수있는 방법을 발견했습니다 csplit 1.html -b "%04d.txt" /"Words in headin
저는 Linux 터미널에서 대형 텍스트 파일을 여러 개의 작은 파일로 분할하려고합니다. csplit으로 시도하지만 csplit은 구분 문자 패턴이 REGEXP로 전달되도록 요구합니다. 정적 구분 기호 패턴은 , lorum ipsum입니다. REGEXP로 어떻게 작성합니까? 조금 읽은 후에는 /'^, lorum ipsum$'/이 작동 할 것으로 예상되지만 그
큰 데이터 세트가 있는데 그 중 작은 샘플은 아래 4x5 tibble처럼 보입니다. 4 행에서 볼 수 있듯이 library(splitstackshape)
dt <- tibble(
a = c("Quartz | White Spirit | Wildfire", "Quiet Riot", "Race Against Time", "Down | Heart Lane |
BASH에서 csplit을 사용하여 1500-1600 년 동안 구분 기호로 파일을 구분하려고합니다. 이 없습니다 (36) (38 개) 파일, 출력, xx37 통해 xx00의 번호 : 내가 명령 거의 적어도 두 가지 문제를 제외하고, 작동 csplit Shakespeare.txt '/1[56]../' '{36}' 을 할. (또한 xx00는 완전히 비어 있습니