Daten auf Länderebene laden

In den folgenden Abschnitten werden für jeden Datentyp und jedes Format simulierte Daten als Beispiel zur Verfügung gestellt.

CSV

So laden Sie die simulierten CSV-Daten mit CsvDataLoader:

  1. Ordnen Sie die Spaltennamen den Variablentypen zu. Die erforderlichen Variablentypen sind time, controls, kpi, revenue_per_kpi, media und media_spend. Die Definition der einzelnen Variablen finden Sie unter Daten erheben und organisieren.

    coord_to_columns = load.CoordToColumns(
        time='time',
        controls=['GQV', 'Discount', 'Competitor_Sales'],
        kpi='conversions',
        revenue_per_kpi='revenue_per_conversion',
        media=[
            'Channel0_impression',
            'Channel1_impression',
            'Channel2_impression',
            'Channel3_impression',
            'Channel4_impression',
            'Channel5_impression',
        ],
        media_spend=[
            'Channel0_spend',
            'Channel1_spend',
            'Channel2_spend',
            'Channel3_spend',
            'Channel4_spend',
            'Channel5_spend',
        ],
    )
    
  2. Ordnen Sie die Media-Variablen und die ‑Ausgaben den angegebenen Channel-Namen zu, die in der zweiseitigen Ausgabe angezeigt werden sollen. Im folgenden Beispiel sind Channel0_impression und Channel0_spend mit demselben Channel (Channel0) verbunden.

    correct_media_to_channel = {
        'Channel0_impression': 'Channel0',
        'Channel1_impression': 'Channel1',
        'Channel2_impression': 'Channel2',
        'Channel3_impression': 'Channel3',
        'Channel4_impression': 'Channel4',
        'Channel5_impression': 'Channel5',
    }
    correct_media_spend_to_channel = {
        'Channel0_spend': 'Channel0',
        'Channel1_spend': 'Channel1',
        'Channel2_spend': 'Channel2',
        'Channel3_spend': 'Channel3',
        'Channel4_spend': 'Channel4',
        'Channel5_spend': 'Channel5',
    }
    
  3. Laden Sie die Daten mit CsvDataLoader:

    loader = load.CsvDataLoader(
        csv_path=f'/{PATH}/{FILENAME}.csv',
        kpi_type='non_revenue',
        coord_to_columns=coord_to_columns,
        media_to_channel=correct_media_to_channel,
        media_spend_to_channel=correct_media_spend_to_channel,
    )
    data = loader.load()
    

    Dabei gilt:

    • kpi_type ist entweder 'revenue' oder 'non_revenue'.
    • PATH ist der Pfad zum Speicherort der Datendatei.
    • FILENAME ist der Name Ihrer Datendatei.

Xarray-Dataset

So laden Sie das simulierte Xarray-Dataset mit XrDatasetDataLoader:

  1. Laden Sie die Daten mit pickle:

    import pickle
    with open(f'/{PATH}/{FILENAME}.pkl', 'r') as fh:
      XrDataset=pickle.load(fh)
    

    Dabei gilt:

    • PATH ist der Pfad zum Speicherort der Datendatei.
    • FILENAME ist der Name Ihrer Datendatei.
  2. Übergeben Sie das Dataset an XrDatasetDataLoader. Verwenden Sie das Argument name_mapping, um die Koordinaten und Arrays zuzuordnen. Geben Sie eine Zuordnung an, wenn sich die Namen im Dataset für die Eingabe von den erforderlichen Namen unterscheiden. Die Namen der erforderlichen Koordinaten sind time, control_variable und media_channel. Die Namen der erforderlichen Datenvariablen sind kpi, revenue_per_kpi, controls, media und media_spend.

    loader = load.XrDatasetDataLoader(
        XrDataset,
        kpi_type='non_revenue',
        name_mapping={'channel': 'media_channel',
                      'control': 'control_variable',
                      'conversions': 'kpi',
                      'revenue_per_conversion': 'revenue_per_kpi',
                      'control_value': 'controls',
                      'spend': 'media_spend'},
    )
    
    data = loader.load()
    

    Dabei gilt:

    • kpi_type ist entweder 'revenue' oder 'non_revenue'.

Anderes Datenformat

So laden Sie ein anderes Format für simulierte Daten (z. B. excel) mit DataFrameDataLoader:

  1. Ordnen Sie die Spaltennamen den Variablentypen zu. Die erforderlichen Variablentypen sind time, controls, kpi, revenue_per_kpi, media und media_spend. Die Definition der einzelnen Variablen finden Sie unter Daten erheben und organisieren.

    coord_to_columns = load.CoordToColumns(
        time='time',
        controls=['GQV', 'Discount', 'Competitor_Sales'],
        kpi='conversions',
        revenue_per_kpi='revenue_per_conversion',
        media=[
            'Channel0_impression',
            'Channel1_impression',
            'Channel2_impression',
            'Channel3_impression',
            'Channel4_impression',
            'Channel5_impression',
        ],
        media_spend=[
            'Channel0_spend',
            'Channel1_spend',
            'Channel2_spend',
            'Channel3_spend',
            'Channel4_spend',
            'Channel5_spend',
        ],
    )
    
  2. Ordnen Sie die Media-Variablen und die ‑Ausgaben den angegebenen Channel-Namen zu, die in der zweiseitigen Ausgabe angezeigt werden sollen. Im folgenden Beispiel sind Channel0_impression und Channel0_spend mit demselben Channel (Channel0) verbunden.

    correct_media_to_channel = {
        'Channel0_impression': 'Channel0',
        'Channel1_impression': 'Channel1',
        'Channel2_impression': 'Channel2',
        'Channel3_impression': 'Channel3',
        'Channel4_impression': 'Channel4',
        'Channel5_impression': 'Channel5',
    }
    correct_media_spend_to_channel = {
        'Channel0_spend': 'Channel0',
        'Channel1_spend': 'Channel1',
        'Channel2_spend': 'Channel2',
        'Channel3_spend': 'Channel3',
        'Channel4_spend': 'Channel4',
        'Channel5_spend': 'Channel5',
    }
    
  3. Lesen Sie die Daten (z. B. excel) in DataFrameDataLoader ein und laden Sie sie dann:

    df=pd.read_excel(f'/{PATH}/{FILENAME}.xlsx')
    loader = load.DataFrameDataLoader(
        df=df,
        kpi_type='non_revenue',
        coord_to_columns=coord_to_columns,
        media_to_channel=correct_media_to_channel,
        media_spend_to_channel=correct_media_spend_to_channel,
    )
    
    data = loader.load()
    

    Dabei gilt:

    • kpi_type ist entweder 'revenue' oder 'non_revenue'.
    • PATH ist der Pfad zum Speicherort der Datendatei.
    • FILENAME ist der Name Ihrer Datendatei.

Als Nächstes können Sie Ihr Modell erstellen.