In den folgenden Abschnitten werden für jeden Datentyp und jedes Format simulierte Daten als Beispiel zur Verfügung gestellt.
CSV
So laden Sie die simulierten CSV-Daten mit CsvDataLoader
:
Ordnen Sie die Spaltennamen den Variablentypen zu. Die erforderlichen Variablentypen sind
time
,controls
,kpi
,revenue_per_kpi
,media
undmedia_spend
. Die Definition der einzelnen Variablen finden Sie unter Daten erheben und organisieren.coord_to_columns = load.CoordToColumns( time='time', controls=['GQV', 'Discount', 'Competitor_Sales'], kpi='conversions', revenue_per_kpi='revenue_per_conversion', media=[ 'Channel0_impression', 'Channel1_impression', 'Channel2_impression', 'Channel3_impression', 'Channel4_impression', 'Channel5_impression', ], media_spend=[ 'Channel0_spend', 'Channel1_spend', 'Channel2_spend', 'Channel3_spend', 'Channel4_spend', 'Channel5_spend', ], )
Ordnen Sie die Media-Variablen und die ‑Ausgaben den angegebenen Channel-Namen zu, die in der zweiseitigen Ausgabe angezeigt werden sollen. Im folgenden Beispiel sind
Channel0_impression
undChannel0_spend
mit demselben Channel (Channel0
) verbunden.correct_media_to_channel = { 'Channel0_impression': 'Channel0', 'Channel1_impression': 'Channel1', 'Channel2_impression': 'Channel2', 'Channel3_impression': 'Channel3', 'Channel4_impression': 'Channel4', 'Channel5_impression': 'Channel5', } correct_media_spend_to_channel = { 'Channel0_spend': 'Channel0', 'Channel1_spend': 'Channel1', 'Channel2_spend': 'Channel2', 'Channel3_spend': 'Channel3', 'Channel4_spend': 'Channel4', 'Channel5_spend': 'Channel5', }
Laden Sie die Daten mit
CsvDataLoader
:loader = load.CsvDataLoader( csv_path=f'/{PATH}/{FILENAME}.csv', kpi_type='non_revenue', coord_to_columns=coord_to_columns, media_to_channel=correct_media_to_channel, media_spend_to_channel=correct_media_spend_to_channel, ) data = loader.load()
Dabei gilt:
kpi_type
ist entweder'revenue'
oder'non_revenue'
.PATH
ist der Pfad zum Speicherort der Datendatei.FILENAME
ist der Name Ihrer Datendatei.
Xarray-Dataset
So laden Sie das simulierte Xarray-Dataset mit XrDatasetDataLoader
:
Laden Sie die Daten mit
pickle
:import pickle with open(f'/{PATH}/{FILENAME}.pkl', 'r') as fh: XrDataset=pickle.load(fh)
Dabei gilt:
PATH
ist der Pfad zum Speicherort der Datendatei.FILENAME
ist der Name Ihrer Datendatei.
Übergeben Sie das Dataset an
XrDatasetDataLoader
. Verwenden Sie das Argumentname_mapping
, um die Koordinaten und Arrays zuzuordnen. Geben Sie eine Zuordnung an, wenn sich die Namen im Dataset für die Eingabe von den erforderlichen Namen unterscheiden. Die Namen der erforderlichen Koordinaten sindtime
,control_variable
undmedia_channel
. Die Namen der erforderlichen Datenvariablen sindkpi
,revenue_per_kpi
,controls
,media
undmedia_spend
.loader = load.XrDatasetDataLoader( XrDataset, kpi_type='non_revenue', name_mapping={'channel': 'media_channel', 'control': 'control_variable', 'conversions': 'kpi', 'revenue_per_conversion': 'revenue_per_kpi', 'control_value': 'controls', 'spend': 'media_spend'}, ) data = loader.load()
Dabei gilt:
kpi_type
ist entweder'revenue'
oder'non_revenue'
.
Anderes Datenformat
So laden Sie ein anderes Format für simulierte Daten (z. B. excel
) mit DataFrameDataLoader
:
Ordnen Sie die Spaltennamen den Variablentypen zu. Die erforderlichen Variablentypen sind
time
,controls
,kpi
,revenue_per_kpi
,media
undmedia_spend
. Die Definition der einzelnen Variablen finden Sie unter Daten erheben und organisieren.coord_to_columns = load.CoordToColumns( time='time', controls=['GQV', 'Discount', 'Competitor_Sales'], kpi='conversions', revenue_per_kpi='revenue_per_conversion', media=[ 'Channel0_impression', 'Channel1_impression', 'Channel2_impression', 'Channel3_impression', 'Channel4_impression', 'Channel5_impression', ], media_spend=[ 'Channel0_spend', 'Channel1_spend', 'Channel2_spend', 'Channel3_spend', 'Channel4_spend', 'Channel5_spend', ], )
Ordnen Sie die Media-Variablen und die ‑Ausgaben den angegebenen Channel-Namen zu, die in der zweiseitigen Ausgabe angezeigt werden sollen. Im folgenden Beispiel sind
Channel0_impression
undChannel0_spend
mit demselben Channel (Channel0
) verbunden.correct_media_to_channel = { 'Channel0_impression': 'Channel0', 'Channel1_impression': 'Channel1', 'Channel2_impression': 'Channel2', 'Channel3_impression': 'Channel3', 'Channel4_impression': 'Channel4', 'Channel5_impression': 'Channel5', } correct_media_spend_to_channel = { 'Channel0_spend': 'Channel0', 'Channel1_spend': 'Channel1', 'Channel2_spend': 'Channel2', 'Channel3_spend': 'Channel3', 'Channel4_spend': 'Channel4', 'Channel5_spend': 'Channel5', }
Lesen Sie die Daten (z. B.
excel
) inDataFrameDataLoader
ein und laden Sie sie dann:df=pd.read_excel(f'/{PATH}/{FILENAME}.xlsx') loader = load.DataFrameDataLoader( df=df, kpi_type='non_revenue', coord_to_columns=coord_to_columns, media_to_channel=correct_media_to_channel, media_spend_to_channel=correct_media_spend_to_channel, ) data = loader.load()
Dabei gilt:
kpi_type
ist entweder'revenue'
oder'non_revenue'
.PATH
ist der Pfad zum Speicherort der Datendatei.FILENAME
ist der Name Ihrer Datendatei.
Als Nächstes können Sie Ihr Modell erstellen.