Bestandsselectie
Selecteer bestanden als virtuele dataset
Met File Select kies je meerdere bestanden en bundel je ze in één Parquet-dataset. Dit is handig om in een workflow of query een vaste selectie te hergebruiken.
Mini-scenario: je hebt per maand een Parquet-bestand (sales_2025_01.parquet t/m sales_2025_12.parquet). Met een pattern kun je deze in één selectie bundelen en hergebruiken in meerdere workflows.
Invoerformulier
Description
Optioneel. Korte omschrijving van de selectie.
Selection Mode
Kies hoe je bestanden selecteert:
- Visual file selection: handmatig aanvinken in een lijst.
- Pattern-based selection: selecteren met wildcards.
Tip: gebruik patterns als je vaak dezelfde bestanden per periode of afdeling nodig hebt.
Select Files (multiselect)
Kies de bestanden die je wilt opnemen. Dit kan alle bestandssoorten bevatten (Parquet, PDF, XLSX, CSV, etc.).
File Patterns (pattern)
Vul een of meerdere patronen in, bijv. *.pdf, *.xlsx, *.parquet, data_*.csv.
Exclude Patterns
Patronen om uit te sluiten, bijv. *_temp.parquet, *_backup.*.
Let op: controleer je pattern goed. Een te brede selectie kan onbedoelde bestanden meenemen en je analyses vertragen.
Output file name
Naam voor het resultaatbestand (zonder .parquet).
Command
Gebruik het File Select command in chat of scripts.
Syntax (multiselect)
FILE_SELECT(input=["file_a.parquet", "file_b.pdf"], output="selected_files")
Syntax (pattern)
FILE_SELECT(pattern="report_*.parquet", exclude=["*_old.parquet"], output="reports")
Resultaat
De selectie wordt opgeslagen als Parquet-bestand in de Resultaten-tab.
Praktische tip: beschrijf je selectie helder in Description zodat reviewers begrijpen waarom deze set bestanden is gekozen.