openrefine

    0

    1답변

    종종 매우 큰 무작위 샘플을 추출해야합니다. dataset? openrefine에서 가장 좋은 방법은 무엇입니까? 이것은 R 및 Python에서 그것을 사용하는 실무자에게 유용 할 수 있습니다. 미리 조언 해 주셔서 감사합니다.

    2

    1답변

    열 쌍에서 값을 조회하여 새 열을 만듭니다 A | B | C | D ---|---|---|--- a | 1 | b | 2 b | 2 | | c | 3 | a | 1 d | 4 | c | 3 나는에 의해 열 D를 만들려면 A를 인덱스로 사용하여 C에서 값에 해당하는 B에서 값을 인출합니다. 희망이 맞는가? 나는 GREL에서 이것을하는 방법을 알아내는 것이별로

    1

    1답변

    나는 여러 해 동안 몇 가지 데이터가 포함 된 csv 파일을 가지고 있습니다. 데이터 제공 업체의 궁극적 인 지혜로 데이터는 실제로 여러 헤더 행 (각 연도에 하나씩)과 함께 구조화됩니다. 파일의 맨 위에 예를를 들어 내가 가진 : 그런 다음 보이는 또 다른 헤더 행이되어 2004에 대한 모든 데이터 후 All | 2004 | Team | Player th

    0

    1답변

    프로젝트를 만들려고 할 때 3,5 수백만 행 (400MB)의의 csv 파일을로드하고 상세 검색을 업로드하지 않습니다. 내가 refine.ini 열고 메모리 제한을 고정,하지만 난 어떻게해야 더 결과 NOTE: This file is not read if you run the Refine executable directly # It is only read

    -1

    1답변

    Google지도 API를 사용하여 장소 세부 정보에서 가져온 웹 사이트를 기반으로 이메일 ID를 추출하려면 어떻게해야합니까? 장소 정보 또는 웹 사이트에서 일반 이메일 아이디를 추출하고 싶습니다. 내가 가지고있는 것을 보여주기 위해 스크린 샷을 첨부했습니다. 나는 Refine.I을 사용하고 있습니다. 전화 번호를 파싱 할 수는 있지만 이메일 주소를 파싱 할

    -1

    1답변

    20 분 전에 openrefine을 배우기 시작했습니다. 데이터의 각 청크 시작 부분에 일관된 헤더 ("JP")로 구분 된 데이터가있는 텍스트 파일이 있습니다. 데이터 덩어리가 모두 동일한 수의 줄이 아닙니다. 원본 데이터의 각 덩어리를 오픈 라인에 1 행 씩 넣기를 원합니다. 어떻게해야합니까? 편집 : 여기 샘플이 있습니다. 그것은 꽤 지저분한 파일이지만

    1

    1답변

    새 열을 만들 때 OpenRefine을 사용하면 다른 행의 데이터에 액세스 할 수 있는지 궁금합니다. 나는 그것이 (그리고 그것은 정신이없는 디자인 원칙이 될 것이다) 의심하지 않지만 그 주위에 해킹이있을 수있다. 다음은 행을 한 행 이동하는 예제입니다. 나는 다음과 같은 테이블이 있습니다 ╔═════╦════════╗ ║ row ║ Model ║ ╠═


    1

    1답변

    공백이 아닌 값을 복사하는 대신 빈 셀을 카운터로 채우는 것이 OpenRefine에서 가능합니까? 또는 여기에 입력 한 텍스트와 같은 예 - 영상이 위에서 아래로 열로 :이 예제 이미지에서 1 1 blank 1 blank blank blank blank blank 1 내가보고 싶습니다 다음과 같이 채워진 열 (다시 상상을 가다.) : 1

    1

    1답변

    OntoRefine (GraphDB 8.3의 일부)에서 OpenRefine 확장을 사용할 수 있습니까? 그리고 그렇다면, 어떻게? OntoRefine은 OpenRefine의 어떤 버전을 기반으로합니까?