Charger des données au niveau national

Des données simulées sont fournies à titre d'exemple pour chaque type et format de données dans les sections suivantes.

CSV

Pour charger les données CSV simulées à l'aide de CsvDataLoader :

  1. Mappez les noms de colonnes avec les types de variables. Les types de variables requis sont time, controls, kpi, revenue_per_kpi, media et media_spend. Pour connaître la définition de chaque variable, consultez Collecter et organiser vos données.

    coord_to_columns = load.CoordToColumns(
        time='time',
        controls=['GQV', 'Discount', 'Competitor_Sales'],
        kpi='conversions',
        revenue_per_kpi='revenue_per_conversion',
        media=[
            'Channel0_impression',
            'Channel1_impression',
            'Channel2_impression',
            'Channel3_impression',
            'Channel4_impression',
            'Channel5_impression',
        ],
        media_spend=[
            'Channel0_spend',
            'Channel1_spend',
            'Channel2_spend',
            'Channel3_spend',
            'Channel4_spend',
            'Channel5_spend',
        ],
    )
    
  2. Mappez les variables et les dépenses média sur les noms de canaux désignés que vous souhaitez afficher dans la sortie sur deux pages. Dans l'exemple suivant, Channel0_impression et Channel0_spend sont connectés au même canal : Channel0.

    correct_media_to_channel = {
        'Channel0_impression': 'Channel0',
        'Channel1_impression': 'Channel1',
        'Channel2_impression': 'Channel2',
        'Channel3_impression': 'Channel3',
        'Channel4_impression': 'Channel4',
        'Channel5_impression': 'Channel5',
    }
    correct_media_spend_to_channel = {
        'Channel0_spend': 'Channel0',
        'Channel1_spend': 'Channel1',
        'Channel2_spend': 'Channel2',
        'Channel3_spend': 'Channel3',
        'Channel4_spend': 'Channel4',
        'Channel5_spend': 'Channel5',
    }
    
  3. Chargez les données à l'aide de CsvDataLoader :

    loader = load.CsvDataLoader(
        csv_path=f'/{PATH}/{FILENAME}.csv',
        kpi_type='non_revenue',
        coord_to_columns=coord_to_columns,
        media_to_channel=correct_media_to_channel,
        media_spend_to_channel=correct_media_spend_to_channel,
    )
    data = loader.load()
    

    Où :

    • kpi_type correspond à 'revenue' ou 'non_revenue'.
    • PATH est le chemin d'accès au fichier de données.
    • FILENAME est le nom de votre fichier de données.

Ensemble de données Xarray

Pour charger l'ensemble de données Xarray simulées à l'aide de XrDatasetDataLoader :

  1. Chargez les données à l'aide de pickle :

    import pickle
    with open(f'/{PATH}/{FILENAME}.pkl', 'r') as fh:
      XrDataset=pickle.load(fh)
    

    Où :

    • PATH est le chemin d'accès au fichier de données.
    • FILENAME est le nom de votre fichier de données.
  2. Transmettez l'ensemble de données à XrDatasetDataLoader. Utilisez l'argument name_mapping pour mapper les coordonnées et les tableaux. Fournissez un mappage si les noms de l'ensemble de données d'entrée sont différents des noms requis. Les noms de coordonnées requis sont time, control_variable et media_channel. Les noms de variables de données requis sont kpi, revenue_per_kpi, controls, media et media_spend.

    loader = load.XrDatasetDataLoader(
        XrDataset,
        kpi_type='non_revenue',
        name_mapping={'channel': 'media_channel',
                      'control': 'control_variable',
                      'conversions': 'kpi',
                      'revenue_per_conversion': 'revenue_per_kpi',
                      'control_value': 'controls',
                      'spend': 'media_spend'},
    )
    
    data = loader.load()
    

    Où :

    • kpi_type correspond à 'revenue' ou 'non_revenue'.

Format des autres données

Pour charger le format des autres données simulées (par exemple, excel) à l'aide de DataFrameDataLoader :

  1. Mappez les noms de colonnes avec les types de variables. Les types de variables requis sont time, controls, kpi, revenue_per_kpi, media et media_spend. Pour connaître la définition de chaque variable, consultez Collecter et organiser vos données.

    coord_to_columns = load.CoordToColumns(
        time='time',
        controls=['GQV', 'Discount', 'Competitor_Sales'],
        kpi='conversions',
        revenue_per_kpi='revenue_per_conversion',
        media=[
            'Channel0_impression',
            'Channel1_impression',
            'Channel2_impression',
            'Channel3_impression',
            'Channel4_impression',
            'Channel5_impression',
        ],
        media_spend=[
            'Channel0_spend',
            'Channel1_spend',
            'Channel2_spend',
            'Channel3_spend',
            'Channel4_spend',
            'Channel5_spend',
        ],
    )
    
  2. Mappez les variables et les dépenses média sur les noms de canaux désignés que vous souhaitez afficher dans la sortie sur deux pages. Dans l'exemple suivant, Channel0_impression et Channel0_spend sont connectés au même canal : Channel0.

    correct_media_to_channel = {
        'Channel0_impression': 'Channel0',
        'Channel1_impression': 'Channel1',
        'Channel2_impression': 'Channel2',
        'Channel3_impression': 'Channel3',
        'Channel4_impression': 'Channel4',
        'Channel5_impression': 'Channel5',
    }
    correct_media_spend_to_channel = {
        'Channel0_spend': 'Channel0',
        'Channel1_spend': 'Channel1',
        'Channel2_spend': 'Channel2',
        'Channel3_spend': 'Channel3',
        'Channel4_spend': 'Channel4',
        'Channel5_spend': 'Channel5',
    }
    
  3. Lisez les données (telles que excel) dans DataFrameDataLoader, puis chargez-les :

    df=pd.read_excel(f'/{PATH}/{FILENAME}.xlsx')
    loader = load.DataFrameDataLoader(
        df=df,
        kpi_type='non_revenue',
        coord_to_columns=coord_to_columns,
        media_to_channel=correct_media_to_channel,
        media_spend_to_channel=correct_media_spend_to_channel,
    )
    
    data = loader.load()
    

    Où :

    • kpi_type correspond à 'revenue' ou 'non_revenue'.
    • PATH est le chemin d'accès au fichier de données.
    • FILENAME est le nom de votre fichier de données.

Vous pouvez ensuite créer votre modèle.