Datos de entrada

Define las siguientes variables de índice:

  • \(g=1,\ldots,G\) indexa las unidades geográficas.
  • \(t=1,\ldots,T\) indexa las unidades de tiempo.

    Para las variables de medios pagados y orgánicos, los datos de períodos \(t<1\) se pueden incluir en los datos de entrada del modelo para modelar con exactitud los efectos rezagados en los períodos anteriores. Si no se proporcionan datos para \(t<1\) , se supone que no hay ninguna ejecución de medios antes de \(t=1\).

  • \(i=1,\ldots,N_C\) indexa las variables de control.

  • \(i=1,\ldots,N_N\) indexa los tratamientos que no son de medios.

  • \(i=1,\ldots,N_M\) indexa los canales de medios pagados sin datos de alcance y frecuencia.

  • \(i=1,\ldots, N_{OM}\) indexa los canales de medios orgánicos sin datos de alcance y frecuencia.

  • \(i=1,\ldots,N_{RF}\) indexa los canales de medios pagados con datos de alcance y frecuencia.

  • \(i=1,\ldots, N_{ORF}\) indexa los canales de medios orgánicos con datos de alcance y frecuencia.

Meridian exige dos arrays de datos principales como datos de entrada del modelo (KPI y medios pagados). Los tratamientos de medios orgánicos y los que no son de medios también se pueden proporcionar como entradas opcionales si están disponibles. En el caso de los canales de medios pagados y orgánicos con datos de alcance y frecuencia disponibles por ubicación geográfica y período, los datos de alcance y frecuencia se pueden usar de forma opcional en lugar de una sola métrica de medios. También tienes la opción de incluir controles que sean variables de confusión o predictores sólidos del KPI. Es preferible proporcionar datos de ingresos (si el KPI no son los ingresos) y datos de inversión en medios (si la unidad de medios no es la inversión), ya que esto permite que las unidades se conviertan en un valor de moneda para los cálculos del ROI.

Datos Dimensiones Entrada del modelo: unidades sin procesar Entrada del modelo: valor de unidad Unidades transformadas (usadas en la ecuación del modelo) Valor/costo
KPI $$G \times T$$ $$\overset{\cdot \cdot}{y}_{g,t}$$ $$u^{[Y]}_{g,t}$$ $$y_{g,t} = L^{[Y]}_{g,t} (\overset{\cdot \cdot}{y}_{g,t})$$ $$\overset{\sim}y_{g,t} = u^{[Y]}_{g,t} \cdot \overset{\cdot \cdot}{y}_{g,t}$$
Controles $$G \times T \times N_C$$ $$\overset{\cdot \cdot}{z}_{g,t,i}$$ $$\text{N/A}$$ $$z_{g,t,i} = L^{[C]}_{g,i}(\overset{\cdot \cdot}{z}_{g,t,i})$$ $$\text{N/A}$$
Medios $$G \times T \times N_M$$ $$\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ $$u^{[M]}_{g,t,i}$$ $$x^{[M]}_{g,t,i} = L^{[M]}_{g,i}(\overset{\cdot \cdot}{x}^{[M]}_{g,t,i})$$ $$\overset{\sim}x_{g,t,i}^{[M]} = u^{[M]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$
Alcance $$G \times T \times N_{RF}$$ $$\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i}$$ $$u^{[RF]}_{g,t,i}$$ $$r_{g,t,i} = L^{[RF]}_{g,i}(\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i})$$ $$\overset{\sim}r^{[RF]}_{g,t,i} = u^{[RF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[RF]}_{g,t,i} \cdot f^{[RF]}_{g,t,i}$$
Frecuencia $$G \times T \times N_{RF}$$ $$f^{[RF]}_{g,t,i}$$ $$\text{N/A}$$
Medios orgánicos $$G \times T \times N_{OM}$$ $$\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ $$u^{[OM]}_{g,t,i}$$ $$x^{[OM]}_{g,t,i} = L^{[OM]}_{g,i}(\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i})$$ $$\overset{\sim}x^{[OM]}_{g,t,i} = u^{[OM]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$
Alcance orgánico $$G \times T \times N_{ORF}$$ $$\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i}$$ $$u^{[ORF]}_{g,t,i}$$ $$r^{[ORF]}_{g,t,i} = L^{[ORF]}_{g,i}(\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i})$$ $$\overset{\sim}r^{[ORF]}_{g,t,i} = u^{[ORF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i} \cdot f^{[ORF]}_{g,t,i}$$
Frecuencia orgánica $$G \times T \times N_{ORF}$$ $$f^{[ORF]}_{g,t,i}$$ $$\text{N/A}$$
Tratamientos que no son de medios $$G \times T \times N_N$$ $$\overset{\cdot \cdot}{x}^{[N]}_{g,t,i}$$ $$\text{N/A}$$ $$x^{N}_{g,t,i} = L^{N}_{g,i}(\overset{\cdot \cdot}{x}^{N}_{g,t,i})$$ $$\text{N/A}$$

Meridian procesa de forma interna las transformaciones de unidades. El ajuste poblacional a nivel geográfico es necesario para que el modelado jerárquico coloque todas las ubicaciones geográficas en una escala comparable. Se ejecutan otras medidas de estandarización para que se puedan utilizar las distribuciones a priori estandarizadas, sin necesidad de considerar la escala de cada variable.

Define \(p_g\) de forma tal que sea el tamaño de la población de cada ubicación geográfica, lo que constituye otro dato de entrada del modelo que debe especificar el usuario. Las transformaciones lineales se resumen de la siguiente manera:

Transformación: unidades de KPI

Las unidades de KPI se ajustan según la población para que todas las ubicaciones geográficas tengan aproximadamente la misma escala. De esta manera, no es necesario ajustar la escala de los parámetros del modelo según el tamaño de la población.

Después del ajuste poblacional, el KPI se normaliza para tener una media de cero y una desviación estándar de uno. Al centrar la media en cero, es razonable elegir una distribución a priori centrada en cero para los términos de intersección (knot_values y tau_g). El ajuste de la escala a la desviación estándar de uno coloca los parámetros en una escala que permite la asignación de distribuciones a priori predeterminadas razonables.

Notación: \(L^{[Y]}_{g,t} (\cdot)\)

Descripción:

  1. Divide por población de ubicación geográfica.
  2. Centra y escala los valores ajustados geográficamente para que tengan una media de cero y una desviación estándar de uno.

Definición:

\(L^{[Y]}_{g,t} (q) = \dfrac{\dfrac{q}{p_g} - m^{[Y]}}{s^{[Y]}}\)

Donde:

  • \(y^\dagger_{g,t} = \dfrac{\overset {\cdot \cdot} y_{g,t}}{p_g}\)
  • \(m^{[Y]} = \frac{1}{GT}\sum\limits_{g,t} y^\dagger_{g,t}\)
  • \(s^{[Y]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( y^\dagger_{g,t}-m^{[Y]} \right)^2}\)

Transformación: variables de control

Solo es necesario aplicar el ajuste poblacional a las variables de control si los valores aumentan aproximadamente según el tamaño de la población. Meridian tiene coeficientes de efectos aleatorios específicos de la ubicación geográfica (gamma_gc), pero es mejor ajustar la escala de la variable que depender del ajuste del modelo para obtener coeficientes que se ajusten al tamaño de la población.

Las variables de control se normalizan para que tengan una media de cero y una desviación estándar de uno. Al centrar la media en cero, es razonable elegir una distribución a priori centrada en cero para los términos de intersección (knot_values y tau_g). El ajuste de la escala a la desviación estándar de uno coloca la media del coeficiente (gamma_c) en una escala que permite la asignación de una distribución a priori predeterminada no informativa razonable.

Notación: \(L^{[C]}_{g,i} (\cdot)\)

Descripción:

  1. Es posible que tenga sentido realizar el ajuste poblacional para determinados controles. Esto se puede ejecutar con el argumento control_population_scaling_id. De forma predeterminada, ningún control se ajusta según la población.

  2. Centra y escala cada variable de control para que tenga una media de cero y una desviación estándar de uno.

Definición:

\(L^{[C]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[C]}_i}_g} - m^{[C]}}{s^{[C]}}\)

Donde:

  • \(I_i^{[C]} = 1\) si se usa control_population_scaling_id=True para la variable \(i;0\) de lo contrario.

    • \(z^{\dagger}_{g,t,i} = \dfrac{\overset {\cdot \cdot} z_{g,t,i}}{p_g^{I_i^{[C]}}}\)
    • \(m^{[C]} = \frac{1}{GT}\sum\limits_{g,t} z^{\dagger}_{g,t,i}\)
    • \(s^{[C]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( z^{\dagger}_{g,t,i}-m^{[C]} \right)^2}\)

Transformación: unidades de medios

Las unidades de medios se ajustan según la población para que todas las ubicaciones geográficas tengan aproximadamente la misma escala. De esta manera, no es necesario ajustar la escala de los parámetros de saturación media (ec_m) según el tamaño de la población.

Luego, se ajusta la escala de las unidades de medios según la mediana de valor distinto de cero para cada canal. Esto se hace para darle al parámetro ec_m una interpretación más intuitiva, de modo que un valor de ec_m de uno indique que el punto de saturación media ocurre en la mediana de las unidades de medios per cápita distintas de cero.

Notación: \(L^{[M]}_{g,i} (\cdot)\)

Descripción:

  1. Divide por población de ubicación geográfica.
  2. Para cada canal de medios, escala los valores ajustados geográficamente según la mediana de valor distinto de cero.

Definición:

\(L^{[M]}_{g,i} (q) = \dfrac{q}{p_g d^{[M]}}\)

Donde:

  • \(x^{\dagger [M]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[M]}}{p_g}\)
  • \(d^{[M]} = \text{Median}\left( \left\{ x^{\dagger [M]}_{g,t,i}:x^{\dagger [M]}_{g,t,i} > 0 \right\}_{g,t} \right)\)

Transformación: alcance

El alcance se ajusta según la población para que todas las ubicaciones geográficas tengan aproximadamente la misma escala. Meridian tiene coeficientes de efectos aleatorios específicos de la ubicación geográfica (beta_grf), pero es mejor ajustar la escala de la variable que depender del ajuste del modelo para obtener coeficientes que se ajusten al tamaño de la población.

El alcance se ajusta según el valor de la mediana distinto de cero para cada canal, lo que hace que la distribución a priori de la media del coeficiente predeterminado (beta_rf) sea una opción razonable para la mayoría de los conjuntos de datos. Ten en cuenta que ajustar la escala en función de la mediana no afecta la selección de la distribución a priori, salvo que se usen las distribuciones a priori de los coeficientes.

Notación: \(L^{[RF]}_{g,i} (\cdot)\)

Descripción:

La función de transformación es la misma que la utilizada para las unidades de medios.

Transformación: unidades de medios orgánicos

La transformación y la justificación son las mismas que para las unidades de medios pagados.

Notación: \(L^{[OM]}_{g,i} (\cdot)\)

Descripción:

  1. Divide por población de ubicación geográfica.
  2. Para cada canal de medios orgánico, escala los valores ajustados geográficamente según la mediana de valor distinto de cero.

Definición:

\(L^{[OM]}_{g,i} (q) = \dfrac{q}{p_g d^{[OM]}}\)

Donde:

  • \(x^{\dagger [OM]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[OM]}}{p_g}\)
  • \(d^{[OM]} = \text{Median}\left( \left\{ x^{\dagger [OM]}_{g,t,i}:x^{\dagger [OM]}_{g,t,i} > 0 \right\}_{g,t} \right)\)

Transformación: alcance orgánico

La transformación y la justificación son las mismas que para el alcance de medios pagados.

Notación: \(L^{[ORF]}_{g,i} (\cdot)\)

Descripción:

La función de transformación es la misma que la utilizada para las unidades de medios orgánicos.

Transformación: tratamientos que no son de medios

Solo es necesario aplicar el ajuste poblacional a las variables de tratamiento que no son de medios si los valores se ajustan de forma aproximada según el tamaño de la población. Meridian tiene coeficientes de efectos aleatorios específicos de la ubicación geográfica (gamma_gn), pero es mejor ajustar la escala de la variable que depender del ajuste del modelo para obtener coeficientes que se ajusten al tamaño de la población.

Las variables de tratamiento que no son de medios se normalizan para que tengan una media de cero y una desviación estándar de uno. Al centrar la media en cero, es razonable elegir una distribución a priori centrada en cero para los términos de intersección (knot_values y tau_g). El ajuste de la escala a la desviación estándar de uno coloca el parámetro de la media del coeficiente (gamma_n) en una escala que permite la asignación de una distribución a priori predeterminada razonable. Ten en cuenta que ajustar la escala en función de la mediana no afecta la selección de la distribución a priori, salvo que se usen las distribuciones a priori de los coeficientes.

Notación: \(L^{[N]}_{g,i} (\cdot)\)

Descripción:

  1. Es posible que sea razonable realizar el ajuste poblacional para ciertos tratamientos que no son de medios. Esto se puede ejecutar con el argumento non_media_population_scaling_id. De forma predeterminada, los tratamientos que no son de medios no se ajustan según la población.

  2. Centra y ajusta la escala de cada variable de tratamiento que no sea de medios para que tenga una media de cero y una desviación estándar de uno.

Definición:

\(L^{[N]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[N]}_i}_g} - m^{[N]}}{s^{[N]}}\)

Donde:

  • \(I_i^{[N]} = 1\) si se usa non_media_population_scaling_id=True para la variable \(i;0\) de lo contrario.

    • \(X^{\dagger [N]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}}{p_g^{I_i^{[N]}}}\)
    • \(m^{[N]} = \frac{1}{GT}\sum\limits_{g,t} x^{\dagger [N]}_{g,t,i}\)
    • \(s^{[N]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( x^{\dagger [N]}_{g,t,i}-m^{[N]} \right)^2}\)