Des données simulées sont fournies à titre d'exemple pour chaque type et format de données dans les sections suivantes.
CSV
Pour charger les données CSV simulées à l'aide de CsvDataLoader
:
Mappez les noms de colonnes avec les types de variables. Les types de variables requis sont
time
,geo
,controls
,population
,kpi
,revenue_per_kpi
,media
etmedia_spend
. Pour les canaux média sans coût direct, vous devez attribuer leur exposition média àorganic_media
. Pour les traitements non média, vous devez attribuer les noms de colonnes correspondants ànon_media_treatments
. Pour connaître la définition de chaque variable, consultez Collecter et organiser vos données.coord_to_columns = load.CoordToColumns( time='time', geo='geo', controls=['GQV', 'Competitor_Sales'], population='population', kpi='conversions', revenue_per_kpi='revenue_per_conversion', media=[ 'Channel0_impression', 'Channel1_impression', 'Channel2_impression', 'Channel3_impression', 'Channel4_impression', ], media_spend=[ 'Channel0_spend', 'Channel1_spend', 'Channel2_spend', 'Channel3_spend', 'Channel4_spend', ], organic_media=['Organic_channel0_impression'], non_media_treatments=['Promo'], )
Mappez les variables et les dépenses média sur les noms de canaux désignés que vous souhaitez afficher dans la sortie sur deux pages. Dans l'exemple suivant,
Channel0_impression
etChannel0_spend
sont connectés au même canal :Channel0
.correct_media_to_channel = { 'Channel0_impression': 'Channel0', 'Channel1_impression': 'Channel1', 'Channel2_impression': 'Channel2', 'Channel3_impression': 'Channel3', 'Channel4_impression': 'Channel4', } correct_media_spend_to_channel = { 'Channel0_spend': 'Channel0', 'Channel1_spend': 'Channel1', 'Channel2_spend': 'Channel2', 'Channel3_spend': 'Channel3', 'Channel4_spend': 'Channel4', }
Chargez les données à l'aide de
CsvDataLoader
:loader = load.CsvDataLoader( csv_path=f'/{PATH}/{FILENAME}.csv', kpi_type='non_revenue', coord_to_columns=coord_to_columns, media_to_channel=correct_media_to_channel, media_spend_to_channel=correct_media_spend_to_channel, ) data = loader.load()
Où :
kpi_type
correspond à'revenue'
ou'non_revenue'
.PATH
est le chemin d'accès au fichier de données.FILENAME
est le nom de votre fichier de données.
Ensemble de données Xarray
Pour charger l'ensemble de données Xarray simulées à l'aide de XrDatasetDataLoader
:
Chargez les données à l'aide de
pickle
:import pickle with open(f'/{PATH}/{FILENAME}.pkl', 'r') as fh: XrDataset=pickle.load(fh)
Où :
PATH
est le chemin d'accès au fichier de données.FILENAME
est le nom de votre fichier de données.
Transmettez l'ensemble de données à
XrDatasetDataLoader
. Utilisez l'argumentname_mapping
pour mapper les coordonnées et les tableaux. Fournissez un mappage si les noms de l'ensemble de données d'entrée sont différents des noms requis. Les noms de coordonnées requis sontgeo
,time
,control_variable
,media_channel
,organic_media_channel
etnon_media_channel
. Les noms des variables de données requises sontkpi
,revenue_per_kpi
,controls
,population
,media
,media_spend
,organic_media
etnon_media_treatments
.loader = load.XrDatasetDataLoader( XrDataset, kpi_type='non_revenue', name_mapping={'channel': 'media_channel', 'control': 'control_variable', 'organic_channel': 'organic_media_channel', 'non_media_treatment': 'non_media_channel', 'conversions': 'kpi', 'revenue_per_conversion': 'revenue_per_kpi', 'control_value': 'controls', 'spend': 'media_spend', 'non_media_treatment_value': 'non_media_treatments'}, ) data = loader.load()
Où :
kpi_type
correspond à'revenue'
ou'non_revenue'
.
Format des autres données
Pour charger le format des autres données simulées (par exemple, excel
) à l'aide de DataFrameDataLoader
:
Mappez les noms de colonnes avec les types de variables. Les types de variables requis sont
time
,geo
,controls
,population
,kpi
,revenue_per_kpi
,media
etmedia_spend
. Pour les canaux média sans coût direct, vous devez attribuer leur exposition média àorganic_media
. Pour les traitements non média, vous devez attribuer les noms de colonnes correspondants ànon_media_treatments
. Pour connaître la définition de chaque variable, consultez Collecter et organiser vos données.coord_to_columns = load.CoordToColumns( time='time', geo='geo', controls=['GQV', 'Competitor_Sales'], population='population', kpi='conversions', revenue_per_kpi='revenue_per_conversion', media=[ 'Channel0_impression', 'Channel1_impression', 'Channel2_impression', 'Channel3_impression', 'Channel4_impression', ], media_spend=[ 'Channel0_spend', 'Channel1_spend', 'Channel2_spend', 'Channel3_spend', 'Channel4_spend', ], )
Mappez les variables et les dépenses média sur les noms de canaux désignés que vous souhaitez afficher dans la sortie sur deux pages. Dans l'exemple suivant,
Channel0_impression
etChannel0_spend
sont connectés au même canal :Channel0
.correct_media_to_channel = { 'Channel0_impression': 'Channel0', 'Channel1_impression': 'Channel1', 'Channel2_impression': 'Channel2', 'Channel3_impression': 'Channel3', 'Channel4_impression': 'Channel4', } correct_media_spend_to_channel = { 'Channel0_spend': 'Channel0', 'Channel1_spend': 'Channel1', 'Channel2_spend': 'Channel2', 'Channel3_spend': 'Channel3', 'Channel4_spend': 'Channel4', }
Lisez les données (telles que
excel
) dansDataFrameDataLoader
, puis chargez-les :df = pd.read_excel(f'/{PATH}/{FILENAME}.xlsx') loader = load.DataFrameDataLoader( df=df, kpi_type='non_revenue', coord_to_columns=coord_to_columns, media_to_channel=correct_media_to_channel, media_spend_to_channel=correct_media_spend_to_channel, ) data = loader.load()
Où :
kpi_type
correspond à'revenue'
ou'non_revenue'
.PATH
est le chemin d'accès au fichier de données.FILENAME
est le nom de votre fichier de données.
Vous pouvez ensuite créer votre modèle.