Definición de resultado incremental

El resultado es la métrica principal de interés que Meridian usa para medir el efecto causal de las variables de tratamiento. Por lo general, se trata de los ingresos, pero cuando el KPI no refleja los ingresos, y los datos de revenue_per_kpi no están disponibles, Meridian define el resultado como el KPI en sí.

En términos coloquiales, puedes definir el retorno de la inversión (ROI) como los resultados incrementales que genera un canal de medios divididos por el costo asociado. Esto significa que los medios tienen un efecto causal en el resultado que deseas estimar. Para hacerlo de una manera basada en principios, debes definir los resultados incrementales con el lenguaje de la inferencia causal.

A modo de ejemplo, considera una situación en la que ningún canal de medios orgánico o pagado tenga datos de alcance y frecuencia. Con la notación de Datos de entrada, tienes un array observado de unidades transformadas de medios \(\{x^{[M]}_{g,t,i}\}\), de medios orgánicos\(\{x^{[OM]}_{g,t,i}\}\) y de tratamientos no relacionados con los medios \(\{x^{[N]}_{g,t,i}\}\), cuya totalidad se indica con \(\{x_{g,t,i}\}\). Este conjunto incluye valores para todos los canales de medios pagados y orgánicos, y los tratamientos no relacionados con los medios para todos los valores comprendidos en \(g=1,\dots G \) y \(t=-\infty,\dots,T \), aunque, en la práctica, solo debes preocuparte por \(t=1-L,2-L,\dots T\) , donde \(L\) representa el rezago máximo supuesto para efectos de los medios. (Para los fines de este análisis, consulta las unidades en la escala transformada \(x_{g,t,i}\) en lugar de la escala sin procesar \(\overset{\cdot \cdot}{x}_{g,t,m}\). Existe una correspondencia de uno a uno entre las unidades sin procesar y las transformadas, por lo que no hay ninguna diferencia práctica).

Incluso si la ejecución de medios real de un anunciante fue \(\{x_{g,t,i}\}\), puedes imaginar cuál podría haber sido el resultado si el anunciante hubiese ejecutado un array de medios diferente, como \(\{x^{(\ast)}_{g,t,i}\}\). Puedes denotar ese resultado como el conjunto de variables aleatorias \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\). En la literatura de inferencia causal, el conjunto \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) se denomina resultados potenciales y el conjunto de valores \(\{ x^{(\ast)}_{g,t,i} \}\) se denomina situación contrafáctica.

En la literatura de inferencia causal, es común ver notaciones como\(Y^{(1)}\) y \(Y^{(0)}\) que representan resultados potenciales en situaciones contrafácticas de tratamiento y control. El MMM es similar, pero un poco más complejo porque los resultados potenciales constituyen un array de valores de dos dimensiones, y el tratamiento es un array de valores de tres dimensiones. Ten en cuenta que no todos los resultados potenciales del array \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) dependen de todos los valores del array \(\{ x^{(\ast)}_{g,t,i} \}\). Por ejemplo, los medios de un período determinado no pueden afectar las ventas anteriores. Sin embargo, se prefiere esta notación porque es más simple que intentar denotar exactamente de qué valores de medios depende cada resultado potencial para cada período.

No obstante, para cualquier par de situaciones de medios contrafácticas, como \(\{ x^{(1)}_{g,t,i} \}\) y \(\{ x^{(0)}_{g,t,i} \}\), podrías definir el resultado incremental real de la siguiente manera:

$$ \sum\limits _{g,t} \left( \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(1)} \right\} \right) } - \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(0)} \right\} \right) } \right) $$

Aun así, esta cantidad no es estimable porque los datos no pueden proporcionar información sobre la distribución conjunta de \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) y \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\). Solo es posible observar un resultado potencial, es decir, \(\overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i} \right\}\right) }\). (Ten en cuenta que, intuitivamente, a medida que \(\{ x^{(1)}_{g,t,i} \}\) se acerca de manera arbitraria a \(\{ x^{(0)}_{g,t,i} \}\), los resultados potenciales \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) y \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\) deberían acercarse al mismo valor, pero esta intuición no es suficiente para especificar la distribución conjunta de manera más general).

En cambio, para cualquier par de situaciones de medios contrafácticas, \(\{ x^{(1)}_{g,t,i} \}\) y \(\{ x^{(0)}_{g,t,i} \}\), define el resultado incremental de la siguiente manera:

$$ \text{IncrementalOutcome} \left( \left\{ x^{(1)}_{g,t,i} \right\}, \left\{ x^{(0)}_{g,t,i} \right\} \right) = E \left( \sum\limits_{g,t} \left( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(1)} \right\}\right) } - \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(0)} \right\}\right) } \right) \Bigg| \left\{ z_{g,t,i} \right\} \right) $$

Aquí \(\{z_{g,t,i}\}\) denota los valores observados para un conjunto de variables de control. Esta notación abreviada se usa para indicar que la expectativa es condicional a que las variables de control aleatorias tomen esos valores. Con un modelo de regresión de MMM y un conjunto de variables de control seleccionadas cuidadosamente, esta expectativa condicional es estimable. Para obtener más información, consulta ROI, mROI y curvas de respuesta.

Por lo general, la suma se realiza con \(g=1,\dots G\) y \(t=1,\dots T\), pero también puedes definir el resultado incremental para cualquier subconjunto de estos valores.