나는 내가 함께 추가 한 두 가지 임상 절차 청구 정보 출처 (rbind
)를 가지고 있습니다. 각 행에는 간단한 설명을 제공하는 CPT 필드와 CPT.description 필드가 있습니다. 그러나 설명은 두 소스와 약간 다릅니다. 나는 그들을 결합 할 수 있기를 원한다. 그런 식으로 다른 단어 나 약어를 사용하면 문자열 검색을 통해 내가 원하는 것을 찾을 수 있습니다.두 열 요소를 함께 붙여 넣기 (또는 병합)
그래서 생성 할 수있는 데이터 테이블의 단순화 된 표현을 만들 수 있습니다.
cpt <- c(23456,23456,10000,44555,44555)
description <- c("tonsillectomy","tonsillectomy in >12 year old","brain transplant","castration","orchidectomy")
cpt.desc <- data.frame(cpt,description)
그리고 여기에 내가 가고 싶습니다.
cpt.wanted <- c(23456,10000,44555)
description.wanted <- c("tonsillectomy; tonsillectomy in >12 year old","brain transplant","castration; orchidectomy")
cpt.desc.wanted <- data.frame(cpt.wanted,description.wanted)
I lapply는 다음과 언 스택 (목록은 페이스트) 등의 기능을 사용하려고 갖지만 각리스트의 요소를 붙여 아니다. 나는 또한 재구성을 시도했으나 첫 번째 또는 두 번째 버전의 설명을 차별화 할 수있는 범주 변수가 없거나 경우에 따라서는 세 번째 버전을 구분할 수있는 카테고리 변수가 없었습니다. 정말 짜증나는 부분은 몇 달 또는 몇 년 전에 비슷한 문제가 있었고 누군가 stackoverflow 또는 r-help 중 하나를 도왔고 나를 찾지 못하는 삶을 살아 왔습니다.
근본적인 문제는 내가 내 앞에 스프레드 시트가 있다고 상상해보십시오. 인접한 열에 동일한 CPT 코드가있는 두 개 또는 세 개의 설명 셀을 세로로 병합 (붙여 넣기)해야합니다.
이 문제에 대한 해결책을 찾으려면 어떤 전문적 유행어를 사용해야합니까? 도움을 주셔서 대단히 감사합니다.
을 제공
대신 세미콜론의 쉼표로 OK 경우, 당신은 단지'집계 할 수 있습니다 (설명을 ~ CPT, cpt.desc, toString)'. 'aggregate'를 여러분이 좋아하는 집계 도구로 바꾸고, 아래의 해답에 설명 된대로'toString'을'paste'로 대체하십시오. – A5C1D2H2I1M1N2O1R2T1