Como escolher tipos de distribuições a priori de tratamento

Cada tipo de variável de tratamento (paga, orgânica e não relacionada a mídia) tem várias opções do tipo a priori. As distribuições a priori de ROI e mROI só podem ser usadas com mídia paga. As distribuições a priori de coeficiente e contribuição podem ser usadas com qualquer tipo de tratamento. Considere o seguinte ao escolher os tipos de distribuição a priori.

As distribuições a priori de ROI são o padrão porque geralmente se alinham melhor com o conhecimento prévio, como resultados de experimentos. Essa é geralmente a opção mais intuitiva para definir distribuições a priori razoavelmente bem informadas.

As distribuições a priori de mROI são uma alternativa para usuários que querem impor uma distribuição a priori capaz de reduzir a alocação de orçamento ideal para a alocação de orçamento histórica, regularizando as mudanças de orçamento recomendadas. Para isso, é necessário definir uma distribuição a priori de mROI comum em todos os canais e ajustar o desvio padrão. Quanto mais forte for a distribuição a priori (desvio padrão menor), mais próxima a alocação ideal ficará do histórico. As restrições de gasto de otimização são outra maneira de limitar as mudanças recomendadas no orçamento, eliminando a necessidade de distribuições a priori de mROI para a maioria dos usuários. Para mais detalhes, consulte a subseção "Comparação das distribuições a priori de ROI e mROI para mídia paga".

As distribuições a priori de contribuição são muito parecidas com as distribuições a priori de ROI para mídia paga. A única diferença é que o denominador da distribuição a priori de ROI é o gasto do canal, enquanto o denominador da distribuição a priori de contribuição é o resultado observado total. Isso significa que qualquer contribuição a priori pode ser convertida em uma distribuição a priori de ROI, e qualquer distribuição a priori de ROI pode ser convertida em uma distribuição a priori de contribuição para mídia paga.

As distribuições a priori de coeficiente são a parametrização mais tradicional para um modelo de regressão linear. No contexto da MMM, a interpretação de um coeficiente é um pouco abstrata, o que dificulta a definição de uma distribuição a priori informada. Um valor de coeficiente específico pode implicar valores de ROI significativamente diferentes para diversos canais de mídia paga. Isso acontece porque o ROI depende da distribuição de execução do canal em regiões geográficas e períodos, das estimativas dos parâmetros de adstock e retornos decrescentes, além do custo por unidade de mídia do canal.

Mídia orgânica

As distribuições a priori de contribuição são a opção padrão porque são a quantidade mais intuitiva para definir uma distribuição a priori informada. Alguns canais podem ter contribuições maiores do que outros. Por isso, considere personalizar a distribuição a priori de acordo com suas táticas comerciais e de marketing. Uma distribuição Beta geralmente é adequada porque é restrita ao intervalo de zero a um.

As distribuições a priori de coeficiente são a parametrização mais tradicional para um modelo de regressão linear. No contexto da MMM, a interpretação de um coeficiente é um pouco abstrata, o que dificulta a definição de uma distribuição a priori informada. Um valor de coeficiente específico pode implicar valores de contribuição significativamente diferentes para diversos canais de mídia orgânica. Isso acontece porque a contribuição depende da distribuição de execução do canal em regiões geográficas e períodos e das estimativas dos parâmetros de adstock e retornos decrescentes do canal.

Tratamentos que não são de mídia

As distribuições a priori de contribuição são a opção padrão porque são a quantidade mais intuitiva para definir uma distribuição a priori informada. É sempre bom personalizar a distribuição a priori. Dependendo do valor de referência especificado de cada variável, a contribuição pode ser positiva ou negativa, ou o sinal da contribuição pode ser desconhecido. Por exemplo, pode não ficar claro se definir o preço para um determinado valor de referência teria um impacto positivo ou negativo na receita. Ou talvez você espere que o preço tenha um impacto positivo em um valor de referência, mas um impacto negativo em outro valor de referência.

As distribuições a priori de coeficiente são a parametrização mais tradicional para um modelo de regressão linear. No contexto da MMM, a interpretação de um coeficiente é um pouco abstrata, o que dificulta a definição de uma distribuição a priori informada. Um valor de coeficiente específico pode implicar valores de contribuição significativamente diferentes para diversos canais de tratamento não relacionados a mídia. Isso acontece porque a contribuição depende da distribuição de valores do tratamento em regiões geográficas e períodos e do valor de referência do tratamento.

Outras considerações

Personalizar as distribuições a priori de contribuição para tratamentos que não são de mídia

A distribuição a priori de contribuição padrão é uma distribuição normal truncada, que permite valores positivos e negativos. É possível definir parâmetros específicos de tratamento na distribuição normal truncada para mudar a massa de probabilidade para valores positivos ou negativos. Por exemplo, o snippet de código a seguir atribui uma distribuição Normal(0, 0,1) truncada simetricamente no primeiro tratamento, uma distribuição HalfNormal(0, 0,2) truncada positiva no segundo tratamento e uma distribuição HalfNormal(0, 0,1) truncada negativa no terceiro tratamento.

PriorDistribution(
    contribution_n=tfp.distributions.TruncatedNormal(
        loc=[0, 0, 0],
        scale=[0.1, 0.2, 0.1],
        low=[-1, 0, -1],
        high=[1, 1, 0],
    )
)

Você também pode usar uma distribuição Beta escalonada para especificar uma distribuição positiva para alguns tratamentos e uma distribuição negativa para outros. Por exemplo, o snippet de código a seguir atribui uma distribuição a priori Beta(1, 49) no primeiro tratamento e uma distribuição a priori Beta(1, 99) negativa no segundo tratamento.

PriorDistribution(
    contribution_n=tfp.distributions.TransformedDistribution(
        tfp.distributions.Beta([1, 1], [49, 99]),
        tfp.bijectors.Scale([1, -1]),
    )
)

Comparação das distribuições a priori de ROI e mROI para mídia paga

As distribuições a priori de mROI são uma alternativa às distribuições a priori de ROI para canais de mídia paga. O mROI de um canal é definido como o retorno esperado de uma unidade monetária extra de gasto. Para alocar a unidade monetária extra em regiões geográficas e períodos, aumente o alcance e mantenha a frequência média.

A escolha entre as distribuições a priori de ROI e mROI tem implicações importantes, principalmente se o objetivo é criar paridade a priori em todos os canais. Tanto o ROI quanto o mROI têm uma distribuição a priori. Se a distribuição a priori de ROI for especificada, uma distribuição a priori de mROI será induzida e vice-versa. Uma distribuição a priori induzida não pertence a uma família paramétrica e normalmente não é independente de outros parâmetros de modelo. O valor exato de uma distribuição a priori induzida depende da distribuição de execução de mídia de um canal em regiões geográficas e períodos. Mesmo que uma distribuição a priori de ROI (mROI) comum seja usada em todos os canais, a distribuição a priori de mROI (ROI) induzida vai variar de acordo com o canal.

Quando a função de Hill é côncava, por exemplo, se o parâmetro de inclinação for igual a um (o padrão), os canais sem dados de alcance e frequência sempre terão um ROI geral maior do que o ROI marginal. Se você usar uma distribuição a priori de ROI, a distribuição a priori de ROI marginal induzida será estritamente menor para um canal sem dados de alcance e frequência. Por outro lado, se você usar uma distribuição a priori de ROI marginal, a distribuição a priori de ROI induzida será estritamente maior para um canal sem dados de alcance e frequência.

Para canais de alcance e frequência, o ROI marginal por alcance é igual ao ROI. Isso acontece porque o ROI marginal a priori é aplicado ao ROI marginal por alcance (a próxima unidade monetária gasta aumenta o alcance sem mudar a frequência média). De acordo com a especificação do modelo Meridian, os efeitos da mídia são lineares no alcance. Sendo assim, a escolha entre uma parametrização de distribuição a priori de ROI comum e marginal não tem impacto na distribuição a priori dos canais de alcance e frequência. Porém, essa escolha ainda vai afetar a inferência de distribuição a posteriori para canais de alcance e frequência porque:

  • A escolha da distribuição a priori para outros canais impacta o ajuste do modelo e os resultados da distribuição a posteriori dos canais de alcance e frequência.
  • As distribuições a priori padrão de ROI e mROI são diferentes.

Se você quiser analisar a distribuição a priori induzida de um modelo específico, chame sample_prior e, depois, o método roi ou marginal_roi da classe Analyzer com o argumento use_posterior=False.

Motivos para escolher as distribuições a priori de ROI:

  • Uma distribuição a priori de ROI comum pode ser usada em todos os canais para criar a paridade de ROI. À medida que a intensidade da distribuição a priori aumenta (o desvio padrão diminui), as distribuições a posteriori de ROI diminuem e se aproximam de um valor comum.
  • As distribuições a priori de ROI específicas do canal podem ser usadas para incorporar conhecimentos prévios, como resultados de experimentos.
  • Embora as distribuições a priori de ROI não controlem as mudanças no orçamento de otimização, assim como as distribuições a priori de mROI, as restrições de gasto de otimização podem ser usadas para limitar a mudança proposta de orçamento em qualquer canal.

Motivos para escolher as distribuições a priori de mROI:

  • Uma distribuição a priori comum de mROI pode ser usado em todos os canais para criar a paridade da distribuição a priori de mROI. À medida que a intensidade da distribuição a priori aumenta, os valores da distribuição a posteriori de mROI diminuem e se aproximam de um valor comum.
  • A paridade da distribuição a priori de mROI geralmente resulta em mudanças menos significativas no orçamento de otimização:
    • Se a mesma distribuição a priori de mROI for usada em todos os canais, a alocação de orçamento ideal da distribuição a priori será igual à média histórica.
    • À medida que a intensidade da distribuição a priori aumenta, a alocação de orçamento ideal da distribuição a posteriori diminui e se aproxima do valor histórico.
    • Apesar do uso de distribuições a priori de mROI fortes, um canal com dados de alcance e frequência ainda poderá ter uma mudança significativa no gasto em otimização se também usarmos a frequência ideal do canal, em vez da histórica. A distribuição a priori de mROI é aplicada ao mROI na frequência histórica, que é sempre menor que o mROI na frequência ideal. Por padrão, a otimização do orçamento é feita com a frequência ideal, mas o método de otimização inclui um argumento booleano use_optimal_freq, que pode ser usado para definir se a otimização é realizada com a frequência ideal ou histórica.

É importante lembrar que o mROI varia de acordo com os períodos. Sendo assim, se o período de otimização não estiver alinhado ao da distribuição a priori de mROI, talvez as distribuições a priori de mROI não regularizem corretamente as mudanças no orçamento de otimização. Você pode ajustar o período da otimização usando o argumento selected_time de BudgetOptimizer.optimize(). É possível ajustar o período do mROI com os argumentos roi_calibration_period e rf_roi_calibration_period de ModelSpec. Por padrão, os dois períodos serão definidos como o período completo de modelagem.