Effectuer une analyse exploratoire des données

Une fois que vous avez collecté vos données, effectuez une analyse exploratoire des données pour identifier et résoudre les problèmes de qualité des données. Il s'agit d'une étape essentielle du processus de Marketing Mix Modeling (MMM), car elle vous permet d'évaluer les données pour confirmer qu'elles représentent de manière précise les efforts marketing, les réponses des clients et d'autres métriques pertinentes. En corrigeant les problèmes détectés lors de l'analyse exploratoire des données, vous pouvez améliorer la fiabilité de la sortie du modèle.

Le processus de base pour effectuer une analyse exploratoire des données est le suivant :

  1. Examinez les données afin d'identifier les données manquantes ou incomplètes.
  2. Corrigez les valeurs manquantes dans vos fichiers d'entrée bruts.
  3. Évaluez l'exactitude des données.
  4. Corrigez les anomalies, les données aberrantes ou les imprécisions dans les données.
  5. Vérifiez la corrélation entre vos KPI et vos variables média et de contrôle.

Il existe de nombreuses façons d'aborder l'analyse exploratoire des données. C'est pourquoi Meridian ne fournit pas de visualisations pour ce processus. Nous vous recommandons de trouver le juste équilibre, en fonction de vos besoins, entre une analyse détaillée et précise pour plus de confiance et une vérification rapide des données de haut niveau qui fournit des insights moins détaillés.

Lorsque vous créez vos propres visualisations, suivez ces consignes qui vous aideront à effectuer l'analyse exploratoire des données :

  • Vérifiez la complétude des données : recherchez les valeurs manquantes dans les données. Vous pouvez créer des graphiques indiquant le pourcentage de données complètes pour chaque variable (canal), puis examiner les variables qui apparaissent comme incomplètes.

    Pour affiner davantage votre analyse exploratoire des données, vous pouvez créer des visualisations qui montrent le nombre d'observations par année, mois, semaine et jour de la semaine. Recherchez des niveaux d'observations anormalement plus faibles pour une période donnée.

  • Vérifiez l'exactitude des données : assurez-vous que les données sont exactes et qu'elles ne présentent pas d'anomalies ou de valeurs aberrantes qui pourraient fausser les résultats. La création de visualisations pour vérifier l'exactitude des données peut inclure la comparaison de la part des dépenses média pour chaque canal et la vérification de la tendance d'un canal afin d'identifier tout élément inhabituel. Vous pouvez comparer ces visualisations au plan média ou collaborer avec l'équipe marketing pour déterminer si les données sont suffisamment précises et détaillées.

  • Vérifiez la corrélation entre les variables : bien que la corrélation entre les KPI et les variables média et de contrôle ne soit pas obligatoire, il peut être utile de créer des visualisations pour vérifier la corrélation dans les cas d'utilisation suivants :

    • Mesurer la corrélation entre les variables média et de contrôle pour voir s'il existe une relation inattendue. Cela peut vous aider à décider de conserver ou de supprimer une variable média ou de contrôle spécifique.

    • Identifier la multicolinéarité Lorsqu'au moins deux variables média et de contrôle sont fortement corrélées entre elles, elles créent une multicolinéarité, ce qui peut entraîner des difficultés pour les modèles de régression lorsqu'ils calculent l'impact des variables colinéaires. En identifiant la multicolinéarité lors de votre analyse des données, vous pouvez décider des variables à inclure dans votre modèle ou à en exclure.

Une fois que vous êtes certain que vos données sont exactes et complètes, vous pouvez charger les données dans un format compatible, puis créer votre modèle.