Cómo recopilar y organizar tus datos

Recopila datos históricos sobre varias variables de marketing y que no son de marketing, como la inversión publicitaria, los precios y las métricas de ingresos o rendimiento.

Estos son los datos necesarios:

Tipo de datos Descripción
Datos de medios Contiene la métrica de exposición por canal, ubicación geográfica y período. Entre las métricas posibles, se incluyen, sin limitaciones, la inversión, las impresiones y los clics, que pueden diferir según el canal. La clave es que estas son unidades intervenibles, lo que significa que representan iniciativas de medios que se pueden controlar de manera razonable. Todos los valores de medios deben ser no negativos.
Inversión en medios Contiene la inversión en medios por canal y por período. Los datos de medios y la inversión en medios deben tener las mismas dimensiones.
Variables de control Contiene los factores de confusión que tienen un efecto causal tanto en el KPI objetivo como en la métrica de medios (como el volumen de búsquedas de Google o GQV). La selección de variables de control es importante para estimar el efecto causal de un MMM. Consulta Gráfico causal.
KPI Es el KPI objetivo que el modelo debe predecir. Por ejemplo, el importe de los ingresos o la cantidad de instalaciones de la aplicación. También es la variable de respuesta del MMM.
Ingresos por KPI Contiene los ingresos promedio de una unidad de KPI. Si no se poseen datos precisos sobre los ingresos por KPI, se recomienda utilizar un valor racional aproximado. Si esa información no está disponible, consulta Cuando el KPI no corresponde a los ingresos. Ten en cuenta que la métrica "Ingresos por KPI" no es necesaria si efectivamente los ingresos son tu KPI.
Población geográfica Contiene la población de cada ubicación geográfica. La población geográfica (como los grupos familiares que tienen TV en una DMA de Nielsen) se usa para ajustar la métrica de medios de modo que todas las ubicaciones geográficas sean comparables. Consulta Datos de entrada para obtener más información sobre el ajuste de la métrica de medios.

Meridian ofrece la opción de modelar el efecto de cualquier canal de medios en función de los datos de alcance y frecuencia. Consulta Alcance y frecuencia.

Tipo de datos Descripción
Alcance Los datos de alcance indican la cantidad de personas expuestas al anuncio de los canales en cada período.
Frecuencia La frecuencia indica la cantidad promedio de veces que una persona está expuesta a un anuncio. Equivale a la cantidad total de impresiones dividida por el alcance de cada período.

Meridian también ofrece la opción de incluir tratamientos de medios orgánicos y no relacionados con medios. Para obtener más información, consulta Variables de medios orgánicos y que no son de medios.

Tipo de datos Descripción
Medios orgánicos Las variables de medios orgánicos son actividades de medios que no tienen un costo directo. Pueden incluir, entre otras, las impresiones de boletines informativos, las entradas de blog, la actividad en redes sociales o las campañas por correo electrónico.
Tratamientos que no son de medios Las variables que no son de medios son actividades de marketing que no están relacionadas directamente con el contenido de medios, por ejemplo, publicar una promoción, el precio de un producto y un cambio en el empaque o el diseño de un producto.

KPI

El KPI es la variable \(y\) que se encuentra en el lado izquierdo de la especificación del modelo. El KPI pueden ser los ingresos o algún otro KPI diferente, como las conversiones.

Algunos modeladores prefieren usar un KPI que no sean los ingresos como la variable de respuesta, incluso aunque los ingresos sean, en última instancia, el KPI. Meridian permite convertir las unidades de KPI en ingresos, ya que proporciona datos de los ingresos por KPI para cada unidad geográfica y período. Para obtener más información, consulta El valor del KPI es desconocido.

Variables de control y de tratamiento de medios, de medios orgánicos y no relacionadas con medios

Las variables de control y de tratamiento de medios, de medios orgánicos y no relacionadas con medios deben tener datos de series temporales disponibles.

  • Variables de medios: Para cada medio pagado, el conjunto de datos debe incluir la inversión de cada canal de medios (esa inversión se usa como denominador para los cálculos del ROI). Además, cada medio pagado debe incluir uno de los siguientes elementos para realizar el modelado:

    • Una sola métrica de exposición de medios, como impresiones, clics o inversión
    • Alcance y frecuencia
  • Variables de medios orgánicos: Los medios orgánicos no tienen una inversión asociada y se pueden excluir de la entrada de inversión en medios. Además, cada elemento de contenido orgánico debe incluir uno de los siguientes elementos para realizar el modelado:

    • Una sola métrica de exposición de medios, como impresiones o clics.
    • Alcance y frecuencia Para obtener más información sobre el modelado con medios orgánicos, consulta Medios orgánicos.
  • Variables de tratamiento no relacionadas con medios Este tipo de variables son actividades de marketing que no están directamente relacionadas con los medios y no tienen un costo de marketing directo asociado. Se diferencian de las variables de control porque se consideran intervenibles y, por lo tanto, se consideran como variables de tratamiento del modelo causal. Para obtener más información sobre el modelado con variables de tratamiento no relacionadas con medios, consulta Variables de tratamiento no relacionadas con medios.

  • Variables de control: El propósito de las variables de control es controlar los factores de confusión. Enfócate en recopilar variables que tengan un efecto causal tanto en el KPI objetivo como en la métrica o la ejecución de medios. Dado que es difícil elaborar una lista completa de las variables que afectan los KPIs, puede ser más práctico enfocarse en las variables que afectan el presupuesto de medios y las decisiones de planificación. Puedes comenzar por preguntarle a tu planificador de marketing qué información podría haber influido, ya sea consciente o inconscientemente, en su toma de decisiones. Para obtener más información sobre el modelado con variables de control, consulta Variables de control.

    Algunos ejemplos de variables de control son la competencia en el mercado y el volumen de búsquedas de Google (GQV). Para obtener más información sobre el GQV, consulta Conceptos básicos sobre el volumen de búsquedas como un factor de confusión para los anuncios de búsqueda.

  • Variables relacionadas con la estacionalidad: Las variables relacionadas con la estacionalidad, como las variables ficticias de días feriados, suelen incorporarse como variables de control en la especificación del modelo. Sin embargo, Meridian cuenta con una funcionalidad de ajuste automático en función de las tendencias y la estacionalidad, que se implementa a través de la especificación del modelo de intercepto que varía con el tiempo. Por lo tanto, no es necesario incluir variables de estacionalidad separadas.

    No obstante, puedes inhabilitar el ajuste automático de estacionalidad para incluir tus propias variables de estacionalidad.

Recopilación de datos

Para cada una de las variables, debes determinar el tipo de datos que se recopilarán. Los planes de medios o de marketing se pueden utilizar para determinar las variables adecuadas que se deben recopilar. Luego, puedes recopilar la exposición de medios para los canales de Google, incluidas las métricas como los clics y las impresiones, con la Plataforma de datos de MMM. Además, la Plataforma de datos de MMM también ofrece datos de frecuencia y alcance específicamente para YouTube. Para obtener más información, consulta Cómo usar la Plataforma de datos de MMM.

La recopilación de datos del volumen de búsquedas de Google (GQV) es opcional, aunque omitir el GQV podría crear sesgos en las estimaciones de tu modelo. Sin embargo, puedes ejecutar Meridian sin datos de GQV.

Asegúrate de que tus datos tengan el formato adecuado para ejecutar el modelo. Para obtener más información sobre el formato, consulta los ejemplos de datos en Tipos y formatos de datos compatibles.

Nivel de detalle

En términos generales, los datos con un mayor nivel de detalle proporcionan estadísticas más precisas y pueden ayudar a identificar resultados prácticos. Ten en cuenta el nivel de detalle de los datos en los siguientes aspectos.

Nivel de detalle de los datos por ubicación geográfica

Práctica recomendada: Recopila datos a nivel geográfico. Este nivel de detalle te permite captar los matices de cada ubicación geográfica y usar el marco de trabajo bayesiano jerárquico de Meridian para obtener intervalos creíbles más precisos para estimaciones como el ROI. Ten en cuenta que ciertas ubicaciones geográficas pueden tener una cantidad baja de observaciones. Por lo tanto, se recomienda excluir esas ubicaciones geográficas del conjunto de datos antes de ajustar el modelo para garantizar que las estimaciones del modelo sean más sólidas. Para obtener más información, consulta Selección de ubicaciones geográficas y datos a nivel nacional.

Alternativa aceptable: Si no hay datos a nivel geográfico disponibles, puedes usar datos nacionales. Sin embargo, verifica que tus datos nacionales tengan una cantidad suficiente de datos para cada efecto que deseas medir. Para obtener más información, consulta Cantidad de datos necesarios.

Nivel de detalle de los datos temporales

Práctica recomendada: Recopila datos semanales. Los datos semanales presentan un equilibrio ventajoso entre el grado de variación y el nivel de ruido, en particular, en comparación con los datos diarios o mensuales.

Alternativa aceptable: Si no hay datos semanales disponibles, puedes intentar usar datos diarios o mensuales. Sin embargo, cuando se usan datos diarios, es posible que se prolongue el tiempo de ejecución del modelo. Además, cuando se usan datos mensuales, pueden surgir problemas de no convergencia o intervalos creíbles amplios en las estimaciones del modelo.

Nivel de detalle de los datos de medios

Recomendamos mantener la cantidad de canales de medios por debajo de 20. Esto ayuda a garantizar una variación y un volumen suficientes para cada canal de medios y ayuda a obtener estimaciones sólidas. En el caso de los canales de medios con una inversión baja, se recomienda combinarlos con otros canales para que la estimación del ROI no sea susceptible a errores. Para obtener más información, consulta Canales con una inversión baja.

Plazo

Como regla general, los datos históricos deberían incluir, como mínimo, dos años de datos semanales para los modelos a nivel geográfico y tres años de datos para los modelos a nivel nacional. Si solo hay datos mensuales disponibles, recomendamos incluir un mínimo de tres años de datos. Es importante que el modelo tenga suficientes datos para proporcionar cálculos precisos. Sin embargo, determinar la cantidad de datos puede ser un proceso más complejo y, en última instancia, depende del tipo de datos que tengas. Consulta Cantidad de datos necesarios para obtener orientación más específica al respecto.

Después de recopilar tus datos, realiza un análisis de datos exploratorio para asegurarte de que sean precisos y estén completos.

Empresas que generan clientes potenciales con ciclos de ventas largos

En el caso de las empresas que generan clientes potenciales con ciclos de ventas largos, las prácticas recomendadas dependen de tu variable objetivo, como el resultado que deseas medir. Si generar un cliente potencial demora varios meses, puedes tener en cuenta KPIs de acción más inmediatos, como la cantidad de conversiones, la cantidad de visitas al sitio o los formularios completados.