Bestandsselectie

Selecteer bestanden als virtuele dataset

Met File Select kies je meerdere bestanden en bundel je ze in één Parquet-dataset. Dit is handig om in een workflow of query een vaste selectie te hergebruiken.

Mini-scenario: je hebt per maand een Parquet-bestand (sales_2025_01.parquet t/m sales_2025_12.parquet). Met een pattern kun je deze in één selectie bundelen en hergebruiken in meerdere workflows.

Invoerformulier

Description

Optioneel. Korte omschrijving van de selectie.

Selection Mode

Kies hoe je bestanden selecteert:
- Visual file selection: handmatig aanvinken in een lijst.
- Pattern-based selection: selecteren met wildcards.

Tip: gebruik patterns als je vaak dezelfde bestanden per periode of afdeling nodig hebt.

Select Files (multiselect)

Kies de bestanden die je wilt opnemen. Dit kan alle bestandssoorten bevatten (Parquet, PDF, XLSX, CSV, etc.).

File Patterns (pattern)

Vul een of meerdere patronen in, bijv. *.pdf, *.xlsx, *.parquet, data_*.csv.

Exclude Patterns

Patronen om uit te sluiten, bijv. *_temp.parquet, *_backup.*.

Let op: controleer je pattern goed. Een te brede selectie kan onbedoelde bestanden meenemen en je analyses vertragen.

Output file name

Naam voor het resultaatbestand (zonder .parquet).

Command

Gebruik het File Select command in chat of scripts.

Syntax (multiselect)

FILE_SELECT(input=["file_a.parquet", "file_b.pdf"], output="selected_files")

Syntax (pattern)

FILE_SELECT(pattern="report_*.parquet", exclude=["*_old.parquet"], output="reports")

Resultaat

De selectie wordt opgeslagen als Parquet-bestand in de Resultaten-tab.

Praktische tip: beschrijf je selectie helder in Description zodat reviewers begrijpen waarom deze set bestanden is gekozen.

Zie ook