12

Google 애널리틱스에서 정보를 수집하여 내 사이트의 추천 엔진을 구축하려고합니다. 사이트는 여러 페이지로 구성되어 있으므로 예를 들어 페이지 A에서 페이지 B까지 사용자가 클릭 한 횟수를 추적합니다. 현재 previousPagePath = '/A'nextPagePath = '/B'으로 Google 웹 로그 분석의 A -> B 전환을 측정 할 수 있지만 "A 페이지보기가 포함 된 사이트에 대한 모든 방문 중에서 동일한 방문에서 B, C, ... 페이지가 몇 번 있었습니까?"API의 Google 웹 로그 분석 '방문자 흐름'데이터 가져 오기

예를 들어, 흐름이 A -> homepage -> B 인 경우, 현재의 방법론에 의해 캡처되지 않지만보다 광범위한 측정 값으로 캡처됩니다. Google 애널리틱스 웹 인터페이스의 '방문자 흐름'보고서에 내가 원하는 데이터가있는 것 같지만 API를 통해 프로그래밍 방식으로 액세스하는 방법을 알 수 없습니다.

이 데이터를 가져 오는 가장 좋은 방법은 무엇입니까?

답변

1

페이지 A를 본 사람들에 대해 단순히 세그먼트로 나눌 수없고 pagePath/pageTitle을 측정 기준으로 사용하고 방문수를 측정 항목으로 반환 할 수있는 이유가 있습니까? 당신이 그래, 찾고있는 무슨이 pagePath = ~ A와 같은 방문과 모두 조회 한 방문의 수에서 볼 된 pagePaths 모두를 나열해야 이론에서

dimensions=ga:pagePath&metrics=ga:visits&segment=dynamic::ga:pagePath=~A 

?

+0

이 논리를 사용하면 이전 페이지 경로를 사용해야하지만,이 경우 각 pase에 대해 쿼리해야하고 방문자 플로를 가져 오는 것이 1 쿼리에서 전체를 얻을 수있게합니다. –

6

정말 좋은 생각입니다. 이 작업을 조금 늦출 수는 있지만 Google 애널리틱스보고 API를 사용하여 모든 데이터를 다운로드하고 로컬 데이터베이스/파일/기타에 저장 한 다음 Google 애널리틱스 보고서 API를 집계하여 추천 엔진을 구축하면됩니다. 통계를 손으로 저장하고 로컬에 저장합니다.

는보고 API에서 데이터를 얻을 query explorer와 함께 연주하고 @carlsoja 유사한 방법 사용하여 경로의 모든 쌍 사이의 페이지 방문 횟수를 추출 시도하려면 얻기 위해

dimensions=ga:previousPagePath,ga:pagePath&metrics=ga:visits 

을 모든 데이터는 Core Reporting Client Libraries 중 하나를 사용하여 결과를 페이지 매기기 (query explorer에서 실험 할 수 있음)해야합니다.

당신은 모든 데이터가 있으면, 당신은 아주 쉽게 Markov Chain transition probabilities을 계산할 수 그들이 페이지 /B, 또는 p(/A | /B)를 방문한 후 사람의 방문 페이지 /A. 누군가가 과거의 어떤 시점에서 /B 페이지를 방문했다면 누군가가 페이지 /A을 방문 할 확률을 추정하는 것은 매우 간단합니다. 당신이 정말로 공상을 원한다면, {H}을 사용하여 페이지에 대한 권장 사항을 p(/A | {H})으로 추정 할 수 있지만, 독자의 연습 문제로 남겨 둘 수 있습니다.)

희망이 있습니다.