나는 a very similar StackOverflow question을 이해하기 위해 최선을 다했지만, 내 인생에서 제안 된 gawk
또는 split
해결책 중 하나를 내 케이스에서 작동시킬 수는 없습니다.텍스트 파일을 여러 텍스트 파일로 나누기
큰 텍스트 파일은 288 개의 제안서로 구성되며, 각 텍스트는 길이가 300에서 500 단어이고 다양한 단락 수입니다 (일관된 줄 수 없음). 그러나 각 제안은 --###--
또는 --####--
의 ID로 구분됩니다. 마킹 마커가 없습니다 - 내가 정규식 검색을 수행하여 하나를 삽입하고 여러 파일로 분할하기 전에 원래 파일을 대체 할 수 있다고 생각하지만. 내가 원한 것은 288 개의 개별 텍스트 파일 모음으로 두 개의 대시 사이의 숫자로 이름이 지정됩니다. 그것이 더 쉬운 일이라면, 나는 세 개의 숫자와 네 개의 숫자로 된 제안 사이에서 파일을 쉽게 분리 할 수 있습니다. 간단히 말해서
#! /bin/env bash or python
Split all_proposals.txt into 121.txt, 122.txt, etc.
Where all_proposals.txt consists of:
--121--
One Line Title of Proposal
Followed by several paragraphs each on a line of variable length.
Another paragraph for effect.
--122--
More lines indeterminate in number.
당신의 질문은 "당신이 나를 위해이 코드를 작성해 주시겠습니까?"는 스택 오버플로가 아닌 것 같습니다. 작동하지 않는 것을 시도 했습니까? –
'/ bin/env'는 표준 위치가 아닙니다. '/ usr/bin/env'를 원한다. –
@NedBatchelder : 이전의 시도는 다음과 같습니다 :'csplit abstracts.txt '/ - [0-9] [0-9] [0-9] - /' '{186}'',' csplit -f abs abstracts.txt '/ - [0-9] [0-9] [0-9] - /' '{186}' ','awk '/ - \ d/{f = 1 ; \ n '-vprefix = "file"';}} {c} {print} "세션" {print> 접두사 "ab-"NR ".tx t"} 'abstracts_no_id.txt' ... 그래, 네, 여러 가지 일을 시도했습니다. –