data-quality

    4

    2답변

    의 내가 같은 테이블이 있다고 가정하자 : 테이블의 Date Sales 09/01/2017 9000 09/02/2017 12000 09/03/2017 0 09/04/2017 11000 09/05/2017 14400 09/06/2017 0 09/07/2017 0 09/08/2017 21000 09/09/2017 15000 09/10/201

    0

    1답변

    정부 제공 데이터로 작업해야하는 경우가 있습니다.이 데이터는 때로는 이상한 방식으로 손상됩니다. 데이터가 동적이기 때문에 오류 전에, 단지 for row in governmental_data: process_row(row) 내가 적용된 수정과 데이터의 거울을 할 수 없습니다했다 for row in governmental_data: #

    0

    1답변

    R 스크립트를 사용하여 'ffff'en 'fdaljfdlksajf'와 같은 진절머리 나는 오픈 대답 (문자열 변수)을 필터링하려고합니다. R에서 사용할 수있는 일종의 사전 패키지가 있기를 기대했지만 찾을 수없는 것 같습니다. 또 다른 옵션은 네덜란드어 목록을 업로드하여 필요한 단어를 입력하고 입력과 비교하는 것이지만 찾기가 쉽지 않습니다. 여러분 중 누구도

    0

    1답변

    TL : 이동 규칙에 따라 조정 된 불량하고 움직이는 데이터로부터 일관되고 적절한보기를 만드는 방법은 무엇입니까? 안녕하세요 :) 데이터를 변환하고 가능하면 조정해야하는 데이터베이스를 구축하고 있습니다. (이 일반적인 주제에 좋은 책을 알고 있다면 BTW, 게시하시기 바랍니다!) 내 특정 경우에는, 원시 데이터는 두 개의 테이블에서 비롯됩니다. 포맷되지 않

    1

    1답변

    일부 필드가 모두 같은 문자 일 때 행을 거부하는 쿼리를 작성하려고합니다. 예. Smith라는 사람을 선택하고 aaaaaa 또는 bbbb라는 사람은 선택하지 않습니다. Firebird's SIMILAR TO doesn't have backreferences과 같이 정규식을 사용할 수 없습니다. 어떻게 할 수 있습니까?

    0

    2답변

    두 단어의 맞춤법 오류를 찾는 데 도움이되는 라이브러리를 찾고 있습니다. 예를 들어, 보석 데이터 품질 점검을위한 'Start' == 'Strat' 'woodpecker' == 'Wodpekcer' 모든 루비 보석 (표준 확장 문자열을 가지고하는 것이 필요 단지 예 아니다) 사실로 다음 문을 표시해야합니까? amatch blurrily fuzzy-ma

    0

    1답변

    두 개의 질문이입니다. 1) 원본 분석기보기에서 내 개체를 일종의 정렬 된 형식으로 정렬하여 정렬 할 수 있도록 시도하고 있습니다. 그러나 레이아웃 컨트롤 패널로 이동하면 "모두 정렬"하는 소스 분석기 옵션이 회색으로 표시됩니다. 개체를 정렬하거나 구성 할 수있는 방법이 있습니까? 2) 내 원본의 개체가 가져온 DB로 구성되어 있지만 대상의 네비게이터에는

    1

    1답변

    데이터 통합을위한 Talend Open Studio (TOS)와 달리 데이터 품질에 대한 TOS는 프로젝트 및 작업 공간 선택 사항이있는 시작 화면으로 시작하거나 Studio에서 작업 프로젝트를 변경할 수 없습니다. :( , 그것은하지 않는 상용 버전에서 가능 나는 적어도 설치 폴더 아래에있는 기본 하나를 사용!

    1

    1답변

    알 수없는 오류로 인해 Nokia Suite를 통해 Nokia 연락처를 내 Outlook 연락처와 sync'ed 할 때마다 전화상의 각 연락처가 Outlook에 다시 추가됩니다. 이제 Outlook에서 연락처를 최대 4 부까지 사용할 수 있습니다. 일부에는 다른 중복이 채워진 여러 필드가 있습니다. 내가하고 싶은 일은 내 연락처를 CSV에서 데이터베이스 테

    2

    2답변

    저는 ETL 작업을위한 다양한 도구를 사용하는 ETL 개발자입니다. 데이터웨어 하우스가 빌드되기 전과 ETL이 데이터 이동을 위해 빌드되기 전에 데이터 프로파일 링의 중요성에 관한 동일한 질문이 모든 프로젝트에서 제기됩니다. 일반적으로 ETL 도구는 이러한 도구에 대한 좋은 대안을 제공하지 않기 때문에 데이터 프로파일 링 (즉, 잘못된 데이터, 데이터 변형