두 번째 결과 문자열에 해당 문자를 유지하면서 특정 문자로 문자열을 분할하고자합니다. 거의 모든 원하는 작업을 수행 할 수 있습니다. 단, 내가 지정하는 문자는 strsplit으로 지정됩니다. 단락이라고도합니다. strsplit에 구분 기호를 유지하도록 요청하는 방법이 있습니까? 또는 정규 표현식을 사용해야합니까? 조언 해 주셔서 감사합니다. 이것은 아주
지구, 군 및 연도가있는 데이터 세트가 있습니다. 주어진 연도/연도 조합이 특정 연도에 발생하면 나는 그 조합이 매년 발생하기를 원합니다. 아래는 내가 이것을 알아 낸 두 가지 방법입니다. 첫 번째 방법은 지구, 카운티 및 연도의 조합을 만드는 함수를 사용하며 6 행의 코드 만 필요합니다. 아래의 접근법은 paste, expand.grid 및 strspli
나는 다음 한 데이터 Data <- data.frame(
X = ("123 234 345 456","222 333 444 555 666")
)
Data
# X
# 123 234 345 456
# 222 333 444 555 666
하나의 셀, 문자열의 길이 문자열 내가 하나에서 다음과 같은 결과를 >Result
# X Y Z A B
내 데이터 프레임은 다음과 같습니다. > data
Manufacturers
1 Audi,RS5
2 BMW,M3
3 Cadillac,CTS-V
4 Lexus,ISF
그래서 > data
Manufacturers Models
1 Audi RS5
2 BMW M3
3 Cadillac CTS-V
4 Lexus
이미 콜론으로 분할 한 데이터가 있습니다. 각 열의 모든 내용을 콜론으로 분할하고 싶습니다. 여기 내 데이터의 예는 다음과 같습니다 V8 V9 V10
1 0/0:0,108,255:36:0:0:99 0/0:0,255,255:103:0:0:99 0/0:0,226,255:107:3:0:99
2 1/1:255,69,0:23:23:0:
나는 웹 사이트에서 데이터를 읽고 있습니다 : https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv (1) 나는 다음과 같은 코드를 직접 R로 데이터를 읽을 시도 처음 : raw_data <- read.table(
데이터라는 5574x1 셀 배열의 변수가 있습니다. 현재 각 요소는 문장을 나타내는 문자 배열입니다. 각 배열을 공백으로 분할하고 싶습니다. new_data이 = 그래서 나는이 일을 시도 {strsplit (데이터 {})} 및 matlab에 나에게이 오류 제공 : for x=1:5574
d(x) = {strsplit(data{x})};
end
내 입력 파일은 다음과 같은 레코드가 예상 : : 나는 다음과 같은 코드를 사용하여이 파일을 R에 STRSPLIT 기능을 적용 "Shelbourne Road, Dublin, Ireland"
"1 Hatch Street Upper, Dublin, Ireland"
"98 Haddington Road, Dublin, Ireland
저는 요소 이름을 구분 기호로 분리하여 세 개의 요소 열로 나누어야하는 요소 열이있는 큰 데이터 프레임을 가지고 있습니다. data <- readRDS("data.rds")
data.df <- reshape2:::melt.array(data)
head(data.df)
## Time Location Class Replicate Population
##
나는 문자열이 포함 된, 같은 키 - 값 쌍을 가지고 있고, 나는 s="{'#JJ': 121, '#NN': 938, '#DT': 184, '#VB': 338, '#RB': 52}"
r1<-sapply(strsplit(s, "[^0-9_]+",as.numeric),as.numeric)
r2<-sapply(strsplit(s, "[^A-Z]+",as.num