2011-02-16 1 views
3

안녕하십니까. SQL 애널리스트 인 Google Analytics API에서이 동작을 보았습니다. 나는 adContent에 대한 모든 값 목록을 얻고 싶습니다. 따라서 ga:adContent을 쿼리하고 (잘 정의 된 이유가 없기 때문에 메트릭을 선택해야하기 때문에) ga:organicSearches. 같은 그룹 (캠페인)에 있기 때문에 서버에서 더 잘 돌아갈 수 있습니다.Google 애널리틱스 API - 측정 기준 선택시 반환되는 측정 기준 값에 영향을 줍니까?

adContent는 "(설정되지 않음)"organicSearches는 516,674입니다. 어, adContent가 사용되지 않는 것 같습니다. 그러나 마케팅 부서는 그것이 그렇다는 것을 맹세하고 설득력있는 스크린 샷을 만듭니다.

나중에 임의로 메트릭을 ga:transactions으로 변경합니다. 내가 깨어 난 우주에서,이 열에 반환 된 실제 값을 제외하고는 아무 것도 영향을 미치지 않아야합니다. 대신, 나는 ga:adContent에 대한 그럴듯한 값과 함께 수많은 행을 얻습니다. ga:transactions의 값이 0 인 경우가 있기 때문에 GA가 '측정 항목> 0'으로 필터링하지 않았습니다.

내 검색어에 필터가 없습니다. 나는이 두 변종 사이의 날짜 범위를 변경하지 않았습니다. 아무도 나에게 무슨 일이 일어나는지 말해 줄 수 있니? 나는 위의 쿼리는 정확히 같은 수의 행 반환해야 이런 일에 번역 기대 :

SELECT adContent, SUM(organicSearches) 
FROM Campaign 
WHERE Date BETWEEN X AND Y 
GROUP BY adContent 

SELECT adContent, SUM(transactions) 
FROM Campaign INNER JOIN ECommerce ON <something> 
WHERE Date BETWEEN X AND Y 
GROUP BY adContent 

을 내가 GA 아마 백 엔드에 일반 RDMS를 사용하여, 그러나 확실하게 일하지 않는 것을 깨닫게 + 1은 여전히 ​​모든 데이터베이스에서 2와 같습니다!

답변

3

ga:adContent (가장자리 경우는 제외)과 거의 일치하지 않습니다. ga:adContent은 광고 내용을 말합니다. ga:organicSearches은 세션 내에서 자연 검색 결과를 방문하는 경우입니다 (예 : 동일한 세션에서 Google을 여러 번 사용하여 사이트에서 특정 항목을 찾으려는 경우). 그 특별한 현상을 측정하려고 시도하는 것 이외에는 사용하지 마십시오.

여기에 SQL 마인드 프레임을 사용하지 마십시오. Google 웹 로그 분석은 백엔드에서 SQL을 사용하지 않으므로 기존 관계에 대한 개념은 적용 할 수 없습니다. IIRC에서는 NoSQL 유형 데이터베이스 인 BigTable variant 중 몇 가지를 사용합니다.

From a Google Paper on BigTable from 2006

:

우리는 간단하게 Google 웹 로그 분석에서 사용하는 테이블 두 가지를 설명합니다. 원시 클릭 테이블 (200TB)은 각 최종 사용자 세션에 대해 행 을 유지 관리합니다. 행의 이름은 웹 사이트의 이름과 그 세션이 작성된 시간 인 을 포함하는 튜플입니다. 이 스키마 은 동일한 웹 사이트를 방문하는 세션이 연속적이며 시간순으로 정렬되어 있는지 확인합니다. 이 테이블은 원래 크기의 14 %까지 압축합니다. 요약 표 (20 TB)에는 각 웹 사이트에 대해 다양한 사전 정의 된 요약이 포함되어 있습니다. 이 테이블 은 주기적으로 예정된 MapReduce 작업에 의해 원시 클릭 테이블 에서 생성됩니다. 각 MapReduce 작업은 테이블에서 최근 세션 데이터 을 추출합니다. 전체 시스템의 처리량 은 GFS의 처리량에 의해 제한됩니다. 이 테이블은 원래 크기의 29 %로 압축합니다.

모든 측정 기준 목록에 대한 측정 항목의 공통 분모를 가장 낮추려면 ga:pageviews을 사용하십시오.

+0

빠른 응답 주셔서 감사합니다. 그건 의미가 있습니다. 나는 하나의 그룹 (Campaign) 내에서 합류가 없으므로 필터링을 요구하지 않는다고 가정했다. LCD 제안에 대해서도 감사드립니다. 이는 치수 전용 쿼리에 꼭 필요한 것 같습니다. –