숫자, 빼기 부호 또는 소수점이 아닌 모든 문자를 문자열에서 제거하고 싶습니다.선택한 문자를 제외한 문자열에서 모두 제거
이상한 문자가 포함 된 read.xls
을 사용하여 Excel에서 데이터를 가져 왔습니다. 이 숫자를 숫자로 변환해야합니다. 나는 정규 표현식 너무 익숙하지 않다, 그래서 다음을 수행하는 간단한 방법이 필요합니다 : 이러한 문자 내 데이터의 일부에 출연 한 이유는 누군가가 말해 줄 수있는 경우
excel_coords <- c(" 19.53380Ý°", " 20.02591°", "-155.91059°", "-155.8154°")
unwanted <- unique(unlist(strsplit(gsub("[0-9]|\\.|-", "", excel_coords), "")))
clean_coords <- gsub(do.call("paste", args = c(as.list(unwanted), sep="|")),
replacement = "", x = excel_coords)
> clean_coords
[1] "19.53380" "20.02591" "-155.91059" "-155.8154"
보너스 (정도 표지판의 일부 원래 Excel 워크 시트, 다른 것은 아닙니다).
왜 데이터를로드하기 전에 찾기 및 바꾸기를 간단하게 수행 할 수 없습니까? 데이터가 Excel 인 경우 데이터가 소수로 표시되도록하십시오. 또한 이미 효과가있는 솔루션을 얻은 것처럼 보입니다. – blunders
@ blunders : 정규 표현식에 이미 존재했으면하는 바램과 같은 단순한 작업 인 것 같아서 학습 질문의 대상입니다. 또한 Excel 시트에 Excel (숫자가 아닌 텍스트로 표시)이 필요한 사람에게 제공하고 있습니다. –
Y와 A는 인코딩 아티팩트로, UTF8 텍스트가 다른 코드 페이지로 부적절하게 인코딩되어 있습니다. – ocodo