Denemeler hakkında rapor oluşturmanın iki ana yolu vardır:
- Doğrudan deneme raporlama: Metrikler için
experimentkaynağını sorgulayın. Bu seçenek, artış ve p değerleri gibi istatistiksel karşılaştırma verilerinin yanı sıra tek bir yanıtta kontrol ve deneme kollarıyla ilgili metrikler sağlar. Bu, kampanya içi denemelerle ilgili rapor oluşturmanın tek yoludur. - Kampanya raporlama: Temel ve deneme kampanyaları arasında ayrım yapmak için
campaign.experiment_typekullanarak metrikler içincampaignkaynağını sorgulayın. Bu seçenek yalnızca sistem tarafından yönetilen denemeler gibi ayrı kontrol ve deney kampanyalarının kullanıldığı denemelerde kullanılabilir.
Bu kılavuz öncelikli olarak, raporlamayı destekleyen tüm deneme türleriyle uyumlu olan doğrudan deneme raporlamasına odaklanmaktadır.
Doğrudan deneme raporlama
Performans metriklerini ve kontrol ile deney kolları arasındaki istatistiksel karşılaştırmaları almak için doğrudan experiment kaynağını sorgulayabilirsiniz.
Metrikler ve istatistiksel anlamlılık
Tıklama sayısı, gösterim sayısı, maliyet, dönüşüm sayısı ve dönüşüm değeri gibi temel metrikler için experiment kaynağı, aynı satırda hem işlem metriklerini (ör. metrics.clicks) hem de kontrol metriklerini (ör. metrics.control_clicks) sağlar.
Ayrıca, kollar arasındaki herhangi bir farkın istatistiksel önemini değerlendirmenize yardımcı olacak alanlar da sağlar:
metrics.*_p_value: Denemenin metrik üzerinde gerçek bir etkisi olmaması durumunda gözlemlenen sonuçların gerçekleşme olasılığı. Daha düşük bir p değeri, daha yüksek istatistiksel önem gösterir.metrics.*_point_estimate: Deneme kolunun, kontrol koluna kıyasla belirli bir metrikte tahmini artış yüzdesi (pozitif veya negatif).margin_of_errorile birlikte, tahmin edilen fark için belirlenmiş bir güven düzeyine sahip bir güven aralığını tanımlar. Tahmin edilen miktar (deneme / kontrol - 1) şeklindedir. Nokta tahmini, güven aralığının merkezidir.metrics.*_margin_of_error:point_estimatemerkezli güven aralığının yarıçapı. Deneme türüne bağlı olarak belirlenen bir güven düzeyi için hesaplanır.
experiment kaynağında, daha önce listelenen istatistik alanlarının yanı sıra bir deney grubu değeri ve bir kontrol grubu değeri de dahil olmak üzere aşağıdaki temel metrik alanları desteklenir:
clicksimpressionscost_microsconversionscost_per_conversionconversion_valueconversion_value_per_cost
Dönüşümler için özellikle istatistiksel alanlar, göreli değerler olarak değil, aşağıdaki absolute_change alanlar aracılığıyla kullanılabilir:
metrics.conversions_absolute_change_p_value: Denemenin dönüşümlerde mutlak değişiklik üzerinde etkisi olmadığına dair sıfır hipotezinin p değeri. 0 ile 1 arasında değişir.metrics.conversions_absolute_change_point_estimate: Denemenin dönüşümler üzerindeki etkisi tahmin edilirken kullanılan nokta tahmini mutlak değişiklik.metrics.conversions_absolute_change_margin_of_error: Denemenin dönüşümler üzerindeki etkisini tahmin ederken hata payı mutlak değişiklik.
experiment kaynağına geçerli sorgular oluşturma konusunda yardım almak için Google Ads Sorgu Oluşturucu aracını kullanın.
Örnek sorgu
Aşağıdaki GAQL sorgusu, bir denemeyle ilgili temel metrikleri alır:
SELECT
experiment.experiment_id,
experiment.name,
experiment.type,
metrics.clicks,
metrics.control_clicks,
metrics.clicks_point_estimate,
metrics.clicks_margin_of_error,
metrics.clicks_p_value,
metrics.conversions,
metrics.control_conversions,
metrics.conversions_absolute_change_point_estimate,
metrics.conversions_absolute_change_margin_of_error,
metrics.conversions_absolute_change_p_value
FROM experiment
WHERE experiment.experiment_id = EXPERIMENT_ID
Sonuçları yorumlama
Denemenizin istatistiksel olarak anlamlı sonuçlar verip vermediğini belirlemek için p değeri, nokta tahmini ve hata payı alanlarını kullanabilirsiniz. Örneğin, conversions_absolute_change_p_value değeri seçtiğiniz eşiğin altındaysa (örneğin, %95 güven için 0,05) ve conversions_absolute_change_point_estimate - conversions_absolute_change_margin_of_error değeri sıfırdan büyükse bu, dönüşümler açısından deney kolunun kontrol kolundan önemli ölçüde daha iyi performans gösterdiğini belirtir.
Sonuçları p değerine ve artış tahminlerine göre nasıl değerlendireceğinizi gösteren bir Python snippet'ini aşağıda bulabilirsiniz:
Java
private void evaluateExperiment( GoogleAdsClient googleAdsClient, long customerId, GoogleAdsRow row) { Metrics metrics = row.getMetrics(); String experimentResourceName = row.getExperiment().getResourceName(); // 1. Evaluate conversion success as a primary success signal if available. // - Point Estimate: Represents the estimated average lift or difference in conversions. // - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error // provided by the API is calculated for a preset confidence level which is set based on the // experiment type. // - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0, // we have statistical significance that performance has improved. double convPValue = metrics.getConversionsAbsoluteChangePValue(); double convLift = metrics.getConversionsAbsoluteChangePointEstimate(); double convError = metrics.getConversionsAbsoluteChangeMarginOfError(); double convLowerBound = convLift - convError; if (convPValue <= P_VALUE_THRESHOLD) { if (convLowerBound > 0) { System.out.printf( "Significant Success: Conversions increased. Even at the lower bound, the lift is %.2f." + " Promoting changes.%n", convLowerBound); promoteExperiment(googleAdsClient, customerId, experimentResourceName); return; } else if ((convLift + convError) < 0) { System.out.printf( "Significant Decline: Even the upper bound (%.2f) is below zero. Ending experiment.%n", convLift + convError); endExperiment(googleAdsClient, customerId, experimentResourceName); return; } } // 2. Fall back to evaluating click metrics if conversions are inconclusive. double clickPValue = metrics.getClicksPValue(); double clickLift = metrics.getClicksPointEstimate(); double clickError = metrics.getClicksMarginOfError(); double clickLowerBound = clickLift - clickError; if (clickPValue <= P_VALUE_THRESHOLD && clickLowerBound > 0) { System.out.printf("Click volume is significantly up (+%.1f%%).%n", clickLift * 100); // Graduation is only supported for separate campaign experiments, not // intra-campaign experiments where there is no separate treatment campaign. ExperimentType experimentType = row.getExperiment().getType(); if (experimentType != ExperimentType.ADOPT_BROAD_MATCH_KEYWORDS && experimentType != ExperimentType.ADOPT_AI_MAX) { System.out.println("Graduating treatment campaign for further manual analysis."); graduateExperiment(googleAdsClient, customerId, experimentResourceName); } else { System.out.println( "Intra-campaign trial detected: graduation is not supported. Continuing to run the" + " experiment to gather more conversion data."); } } else { // 3. Print status if no action was taken. System.out.printf( "Inconclusive: No significant lift in Conversions (p=%.2f) or Clicks (p=%.2f). Current" + " estimated lift: %.2f +/- %.2f. Allowing the experiment to continue running.%n", convPValue, clickPValue, convLift, convError); } }
C#
private static void EvaluateExperiment(GoogleAdsClient client, long customerId, GoogleAdsRow row) { // This function evaluates performance metrics and immediately takes action // to update the experiment's status (promote, end, or graduate) if // statistical significance thresholds are met. var metrics = row.Metrics; string experimentResourceName = row.Experiment.ResourceName; bool hasConvMetrics = metrics.HasConversionsAbsoluteChangePValue && metrics.HasConversionsAbsoluteChangePointEstimate && metrics.HasConversionsAbsoluteChangeMarginOfError; bool hasClickMetrics = metrics.HasClicksPValue && metrics.HasClicksPointEstimate && metrics.HasClicksMarginOfError; // 1. Evaluate conversion success as a primary success signal if available. // - Point Estimate: Represents the estimated average lift or difference in conversions. // - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error // provided by the API is calculated for a preset confidence level which is set based on // the experiment type. // - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0, // we have statistical significance that performance has improved. if (hasConvMetrics) { double convPValue = metrics.ConversionsAbsoluteChangePValue; double convLift = metrics.ConversionsAbsoluteChangePointEstimate; double convError = metrics.ConversionsAbsoluteChangeMarginOfError; double convLowerBound = convLift - convError; if (convPValue <= P_VALUE_THRESHOLD) { if (convLowerBound > 0) { Console.WriteLine( $"Significant Success: Conversions increased. Even at the lower" + $" bound, the lift is {convLowerBound:F2}. Promoting changes."); PromoteExperiment(client, customerId, experimentResourceName); return; } else if ((convLift + convError) < 0) { Console.WriteLine( $"Significant Decline: Even the upper bound ({convLift + convError:F2}) " + $"is below zero. Ending experiment."); EndExperiment(client, customerId, experimentResourceName); return; } } } // 2. Evaluate click volume as a secondary signal. // This is helpful as an early indicator or for lower-volume accounts. if (hasClickMetrics) { double clickPValue = metrics.ClicksPValue; double clickLift = metrics.ClicksPointEstimate; double clickError = metrics.ClicksMarginOfError; double clickLowerBound = clickLift - clickError; if (clickPValue <= P_VALUE_THRESHOLD && clickLowerBound > 0) { // We have a directional winner: high confidence in more traffic, // but not enough data to confirm conversion impact yet. Console.WriteLine( $"Click volume is significantly up (+{clickLift * 100:F1}%)."); // Graduation is only supported for separate campaign experiments, not // intra-campaign experiments where there is no separate treatment campaign. if (row.Experiment.Type != ExperimentType.AdoptBroadMatchKeywords && row.Experiment.Type != ExperimentType.AdoptAiMax) { Console.WriteLine("Graduating treatment campaign for further manual analysis."); GraduateExperiment(client, customerId, experimentResourceName); } else { Console.WriteLine( "Intra-campaign trial detected: graduation is not supported. " + "Continuing to run the experiment to gather more conversion data."); } return; } } // 3. Print status if no action was taken. if (hasConvMetrics || hasClickMetrics) { string convStatus = hasConvMetrics ? $"Conversions (p={metrics.ConversionsAbsoluteChangePValue:F2}, " + $"lift={metrics.ConversionsAbsoluteChangePointEstimate:F2} +/- " + $"{metrics.ConversionsAbsoluteChangeMarginOfError:F2})" : "Conversions (not populated)"; string clickStatus = hasClickMetrics ? $"Clicks (p={metrics.ClicksPValue:F2}, " + $"lift={metrics.ClicksPointEstimate:F2} +/- " + $"{metrics.ClicksMarginOfError:F2})" : "Clicks (not populated)"; Console.WriteLine( $"Inconclusive: No significant action taken. {convStatus}, {clickStatus}. " + "Allowing the experiment to continue running."); } else { Console.WriteLine( "Conversion and click performance metrics are not yet populated. " + "Allowing the experiment to continue running."); } }
PHP
This example is not yet available in PHP; you can take a look at the other languages.
Python
def evaluate_experiment( client: GoogleAdsClient, customer_id: str, row: GoogleAdsRow ) -> None: """Evaluates the performance of the experiment and updates it accordingly (for example, promotes, ends, or graduates). Checks conversion and click metrics against statistical significance thresholds to determine the appropriate action to take on the experiment. Args: client: an initialized GoogleAdsClient instance. customer_id: a client customer ID. row: a GoogleAdsRow containing the experiment and metrics. """ # This function evaluates performance metrics and immediately takes action # to update the experiment's status (promote, end, or graduate) if # statistical significance thresholds are met. metrics = row.metrics experiment_resource_name = row.experiment.resource_name has_conv_metrics = ( "conversions_absolute_change_p_value" in metrics and "conversions_absolute_change_point_estimate" in metrics and "conversions_absolute_change_margin_of_error" in metrics ) has_click_metrics = ( "clicks_p_value" in metrics and "clicks_point_estimate" in metrics and "clicks_margin_of_error" in metrics ) # 1. Evaluate conversion success as a primary success signal if available. # - Point Estimate: Represents the estimated average lift or difference in conversions. # - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error provided by the API is calculated for a preset confidence level which is set based on the experiment type. # - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0, # we have statistical significance that performance has improved. if has_conv_metrics: conv_p_value = metrics.conversions_absolute_change_p_value conv_lift = metrics.conversions_absolute_change_point_estimate conv_error = metrics.conversions_absolute_change_margin_of_error conv_lower_bound = conv_lift - conv_error if conv_p_value <= P_VALUE_THRESHOLD: if conv_lower_bound > 0: print( "Significant Success: Conversions increased. Even at the lower" f" bound, the lift is {conv_lower_bound:.2f}. Promoting" " changes." ) promote_experiment( client, customer_id, experiment_resource_name ) return elif (conv_lift + conv_error) < 0: print( "Significant Decline: Even the upper bound" f" ({conv_lift + conv_error:.2f}) is below zero. Ending" " experiment." ) end_experiment(client, customer_id, experiment_resource_name) return # 2. Evaluate click volume as a secondary signal. # This is helpful as an early indicator or for lower-volume accounts. click_p_value = metrics.clicks_p_value click_lift = metrics.clicks_point_estimate click_error = metrics.clicks_margin_of_error click_lower_bound = click_lift - click_error if click_p_value <= P_VALUE_THRESHOLD and click_lower_bound > 0: # We have a directional winner: high confidence in more traffic, # but not enough data to confirm conversion impact yet. print(f"Click volume is significantly up (+{click_lift*100:.1f}%).") # Graduation is only supported for separate campaign experiments, not # intra-campaign experiments where there is no separate treatment campaign. experiment_type_name = row.experiment.type_.name if ( experiment_type_name != "ADOPT_BROAD_MATCH_KEYWORDS" and experiment_type_name != "ADOPT_AI_MAX" ): print( "Graduating treatment campaign for further manual analysis." ) graduate_experiment( client, customer_id, experiment_resource_name ) else: print( "Intra-campaign trial detected: graduation is not supported. " "Continuing to run the experiment to gather more conversion data." ) return # 3. Print status if no action was taken. if has_conv_metrics or has_click_metrics: conv_status = ( f"Conversions (p={metrics.conversions_absolute_change_p_value:.2f}, " f"lift={metrics.conversions_absolute_change_point_estimate:.2f} +/- " f"{metrics.conversions_absolute_change_margin_of_error:.2f})" if has_conv_metrics else "Conversions (not populated)" ) click_status = ( f"Clicks (p={metrics.clicks_p_value:.2f}, " f"lift={metrics.clicks_point_estimate:.2f} +/- " f"{metrics.clicks_margin_of_error:.2f})" if has_click_metrics else "Clicks (not populated)" ) print( f"Inconclusive: No significant action taken. {conv_status}, {click_status}." " Allowing the experiment to continue running." ) else: print( "Conversion and click performance metrics are not yet populated. " "Allowing the experiment to continue running." )
Ruby
This example is not yet available in Ruby; you can take a look at the other languages.
Perl
This example is not yet available in Perl; you can take a look at the other languages.
curl
Kampanya raporlamasına kıyasla avantajları
Doğrudan deneme raporlaması, kampanya raporlarını ayrı ayrı sorgulamaya kıyasla çeşitli avantajlar sunar:
- Merkezi metrikler: Kontrol ve deneme metriklerini tek bir satırda alın.
- İstatistiksel güven verileri: Hesaplanan p değerlerini, nokta tahminlerini ve hata paylarını sağlar.
- Verimlilik: Birden fazla rapordaki sonuçları manuel olarak birleştirme veya karşılaştırma ihtiyacını ortadan kaldırır.
- Kampanya içi destek: Trafiğin tek bir kampanya içinde bölündüğü kampanya içi denemelerde kontrolü değerlendirmeyle karşılaştırmanın tek yoludur.
Kampanya raporları
Ayrı deney kampanyaları oluşturan denemeler için (ör. SEARCH_CUSTOM), campaign kaynağını sorgulayabilir ve BASE (kontrol) ile EXPERIMENT (deney) kampanyalarını belirlemek için campaign.experiment_type kullanabilirsiniz. Metrikleri daha ayrıntılı bir düzeyde (ör. reklam grubuna veya anahtar kelimeye göre) segmentlere ayırmanız ya da experiment kaynağında bulunmayan kampanya meta verilerini görüntülemeniz gerekiyorsa bu yaklaşım kullanışlıdır. Ancak bu yöntem, performans karşılaştırmalarını ve istatistiksel hesaplamaları manuel olarak yapmanızı gerektirir.
Trafik yükünün bölünmesi tek bir kampanya içinde gerçekleştiğinden, kampanya içi denemelerde kolları karşılaştırmak için kampanya düzeyinde raporlama kullanamazsınız. Kampanya içi deneme için campaign sorgulandığında yalnızca toplu toplamlar döndürülür.
En iyi uygulamalar
- Uygun bir güven düzeyi seçin: Daha düşük bir p değeri eşiği belirlemek, özellikle daha düşük bütçelerde veya dönüşüm hacimlerinde yönlendirici rehberliği daha hızlı sağlayabilir. %95 güven (p değeri <= 0,05) akademik standart olarak kabul edilir ve daha uzun bir zaman aralığında daha doğru sonuçlar elde etmek için daha iyi olabilir.
- Denemeleri yeterince uzun süre çalıştırma: Haftalık performans döngülerini, dönüşüm sürelerini ve öğrenme dönemlerini hesaba katmak için denemeleri en az 4 hafta boyunca çalıştırın.
- Gelişim için zaman tanıyın: Otomatik teklif veya yeni özellikleri test eden kampanyalarda, teklif modellerinin ve trafik düzeylerinin bölünmeye göre yeniden ayarlanması için zaman tanımak amacıyla ilk 1-2 haftalık verileri dikkate almayın.
- %50/%50 trafik yükü kullanın: %50/%50 trafik yükü genellikle istatistiksel olarak anlamlı sonuçlar elde etmenin en hızlı yoludur.
- Önceden planlayın: Reklam inceleme ve onay süreçlerine zaman tanımak için deneme başlangıç tarihinizi 3-7 gün sonrasına ayarlayın.
- Herhangi bir zamanda kampanya başına yalnızca bir deneme çalıştırabilirsiniz.