나의 상사가 구독하는 광고 서버와 수요 측 플랫폼 간의 웹 클릭 데이터를 비교하고 Google 애널리틱스 세션과 비교하는 방법을 확인했습니다. . 광고 서버가 수요 측 플랫폼이 클릭 수를 적게 계산하고있는 동안 광고 서버가 클릭 수를 초과하는 것으로 우려됩니다. Google 광고 서버, 수요 측 플랫폼 및 파트너 이름을 기반으로 한 Google 웹 로그 분석 데이터 세트에 참여할 수있었습니다. 단 13 개의 조인이있었습니다. Google이 목표 변수이고 공급 업체가 예측 변수 인 두 데이터 세트와 Google 간의 정확성을 판단하는 가장 좋은 방법을 찾고있었습니다. 이것은 피어슨 계수를 통한 선형 회귀입니까?벤더 데이터 세트를 대상 데이터 세트와 비교할 때 실행할 통계 유형 테스트
0
A
답변
0
배포본이 크게 다른지 여부를 결정하는 여러 통계 테스트가 있습니다. 관찰의 수는 특히 작은 경우 https://docs.scipy.org/doc/scipy-0.19.1/reference/generated/scipy.stats.mannwhitneyu.html
하거나 분포는 일반적으로 다음 분포되어 있다고 생각하는 경우 : https://docs.scipy.org/doc/scipy-0.19.1/reference/generated/scipy.stats.ttest_ind.html
또는 맨 - 휘트니 U 테스트 : 당신은 t-test를 살펴 수 당신은 t- 테스트를 사용할 수 있습니다. 그렇지 않으면 Mann-Whitney U 테스트를 해보십시오.
이 질문에 대해 더 자세히 설명해 주시겠습니까? 번호가 서로 다른 출처에서 정확히 같지 않아야합니까? – amanbirs
우리는 13 개의 서로 다른 출처를 가지고 있습니다 (이 샘플에서는 더 큰 웹 사이트를 요구했습니다). 일부 광고는 다른 광고보다 많은 트래픽을 발생시킵니다. 광고 서버와 수요 측 플랫폼은 각 인스턴스에서 서로 다른 클릭 수 및 노출 수를보고했습니다. Google은 광고 서버 또는 수요 측 플랫폼이 Google 애널리틱스 세션과보다 긴밀히 연계되어 있는지 확인하려고합니다. – ksoze720