문자열에서 정규 표현식을 사용하여 일치하는 패턴, 그리고 여기 N.은 몇 가지 예입니다 :I는 0, 1로 구성된 문자열의 큰 숫자의 구성 데이터 프레임이
a = "10000000011111111"
b = "11111111111111111"
c = "11111110000000NNN"
d = "00000000000000000"
e = "00000001111111111"
f = "11111000000000000"
임 찾고 'N'존재가없는 '0'과 '1'만으로 구성된 문자열을 식별하는 방법입니다. 나의 궁극적 인 목표는이 상황이 발생하는 곳에서 나의 원본 데이터 프레임 'REC'로 대체하는 것입니다. 이 question에서 수행 된 것과 유사합니다.
이a = "REC"
b = "11111111111111111"
c = "11111110000000NNN"
d = "00000000000000000"
e = "REC"
f = "REC"
내 목표를 달성하기 위해 (이전 질문에서 응답에 의해 인도) 필자가 사용 된 주요 전략은 gsub
사용하지만 작동 정규식을 얻을 캔트 :
내 위의 데이터에서 결과가 될 것이다 내 원하는 출력. 내가 여기에 여기에 시도하는 너무 많은 반복을 시도했지만 한 나의 가장 최근의 기능은 다음과 같다 :이 기능은 lapply
과 데이터 프레임에 필자에 의존 시도 다른 전략을 실행할 것
markREC <- function(X) {
gsub(X, pattern = "^(0)+.*(1)+$",
replacement = "REC?")}
strsplit
하지만 임씨도이 문제를 해결하는 데 어려움이 있습니다. 사람들이보고 싶으면 예제를 제공 할 수 있습니다. 나는 이것이 몇 가지 정규식 전문가를 위해 간단하게 될 것이라고 상상하지만 몇 시간 동안 노력한 후에, ID는 약간의 도움을 사랑한다!
이 나던 잘 작동 그것은 좋아에만 0 또는 1 개만있는 ID를 가지고 문자열을 집어 들고 있기 때문에 이 그룹에서 제외하십시오. Ive는 원하는 출력으로 질문을 편집했습니다. –
@SamGlobus 실제로 이것은 완벽하게 작동합니다. 네가 무슨 말을하고 있는지 모르겠다. – FailedDev
큰 따옴표 안에있는 문자열과 비슷한 문자열에만 적용됩니다. 문자열은 데이터 프레임에 있지만 길이가 달라집니다. –