openrefine

    0

    2답변

    OpenRefine이있는 셀에서 특정 단어 ("am") 다음에 나오는 모든 것을 제거하고 싶습니다. 내 데이터 : 워크샵 메신저 라멘 데 Weiterbildungsprogramms 2015 년 02 11월입니다 브레인 스토밍 오전 09 11월 2015 브레멘에서 워크샵 2015 (17) 11월이다 "bewerten Auswählen 싶게" 함부르크에서 정규

    0

    1답변

    을 사용하여 OpenRefine에서 여러 결과를 반환합니다. 따라서 dd.mm.yyyy으로 표시된 몇 개의 날짜를 추출하려고합니다. 은 세포의 일부는 (에서 DD.MM.YYYYDD.MM.YYYY에 같은) 더 많은 텍스트와 함께 나는 걱정하지 않는다 그들 중 일부는 여러 날짜를 포함, 단 하나의 날짜가 포함되어 있습니다. "From"과 "To"라는 두 개의

    0

    1답변

    이미 빈 행을 찾았습니다. 이제 모든 공백 값에 "정보가없는 값"을 입력하고 싶지만, 어떻게 알지는 못합니다. 힌트가 있습니다. 미리 감사드립니다. 나는이 분산 된 커뮤니티와 함께 ​​일하는 큰 재미를 가지고있다! Joni

    0

    2답변

    이것은 OpenRefine에서 주어진 GREL 언어 표현입니다. DIFF (날짜 (D1), 날짜 (D2), 선택적 문자열 TIMEUNIT) 날짜 은 주어진 시간 단위의 차이를 반환합니다. 문제는 두 열의 값에 액세스하는 방법입니다. 문제는 설명서에 명시되어 있지 않습니다. 감사

    0

    2답변

    그래서 정리가 필요한 .csv 파일이 여러 개 있습니다. 그들은 모두 같은 단계를 거쳐야하므로 OpenRefine의 작업 내역을 추출하여 다른 작업에 적용합니다. OpenRefine에서 각 파일을 하나씩 열고 추출한 JSON 기록을 적용 할 수 있습니다. 하지만 많은 파일이 있습니다 ... 또한 OpenRefine에서 파일을 열 때 여러 파일을 열 수있는

    1

    1답변

    OpenRefine에서 값의 집계 및 요약을 파이썬 및 R에서와 같은 방식으로 만들 수 있는지 궁금합니다. 예 : 300k 기록의 의료 지정 표 Id 환자 | 나이 | 이드 임명 | 값 환자가 집계하고 요약 한 결과는 다음과 같습니다. Id 환자 | 마지막 시대 | mean-value OpenFine에서 작동하는 것이 큰 도움이된다면 충분히 명확 해지기를

    1

    1답변

    다음 식을 사용하여 행의 모든 ​​값을 연결 한 md5 해시를 반환합니다. md5(forEach(row.columnNames,cn,if(isNull(cells[cn]),"",cells[cn].value)).join("|")) 중복을 식별하기위한 쉬운 색인을 생성합니다 (이 단계에서는 제거하지 않으려합니다). 그러나 컬럼 중 하나에 데이터 세트의 고유 인

    0

    1답변

    열 1 (UN과 같은 문자열이있는 문자열)에 조직 목록이 있으며 두 번째 열에 관련 URL (예 : www.un.org/)을 채우려는 경우 열 1은 검색 문자열로 값을 지정합니다. 지오 코딩 절차는 다소 간단합니다 (http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial#Geocoding_names_and_address

    0

    1답변

    GREL에서 난수를 생성하고 싶습니다. 이 일을 할 수있는 방법이 있습니까? 나는 같은 GREL 구문 사용하려면 :

    0

    2답변

    전화 걸기 코드가 대괄호 안에 있도록 열의 모든 3000 전화 번호를 편집해야합니다. 에서 예를 들어 +49 089/6977 514 - 18 다음과 +49 (089) 514 6977 - 팬더 추측 18 임 수 있어야한다. 오픈 미분을 사용하고 있습니까? df['Column_Name'] = df['Column_Name'].apply(lambda x: x[:4