Microsoft Azure Data Warehouse를 기반으로 실시간보고 서비스를 구축하려고합니다. 현재 약 5TB의 데이터가있는 SQL 서버가 있습니다. 데이터웨어 하우스에 데이터를 스트리밍하고 Azure DW의 계산 기능을 사용하여 데이터를 기반으로 실시간보고를 생성합니다. 이를 수행하기 위해 최선의 방법을 사용할 준비가 되었습니까?SQL 서버에서 Azure Datawarehouse로 실시간 스트리밍 데이터
내가 고려한 한 가지 접근법은 카프카에 데이터를로드 한 다음 스파크 스트리밍을 통해 Azure DW로 스트리밍하는 것입니다. 그러나이 접근법은 실시간보다 더 실시간에 가깝습니다. SQL Server 변경 데이터 캡처를 사용하여 데이터를 데이터웨어 하우스로 스트리밍하는 방법이 있습니까?
"실시간"을 어떻게 정의하고 있습니까? 실제 대기 시간 요구 사항은 무엇입니까? –
엔티티가 master db에 추가되거나 수정되는 즉시보고 데이터 저장소에 저장하려고합니다. – taffarel