Bestandsformaten
Ondersteunde upload- en exportformaten
Aviseo ondersteunt een aantal bestandsformaten voor upload en export.
Mini-scenario: je combineert een CSV met transactiedata, een PDF met toelichting en een screenshot van een systeemrapport. Alleen de CSV wordt querybaar (via Parquet), de PDF en afbeelding dienen als bewijs/context.
Upload (tab Data)
Ondersteund in de upload:
- Excel: .xlsx
- CSV: .csv
- Parquet: .parquet
- JSON: .json
- Documenten: .doc, .docx, .pdf, .txt, .html
- Afbeeldingen: .jpg, .jpeg, .png, .gif, .bmp, .tiff, .webp
- Audio: .mp3, .wav, .ogg
- Video: .mp4, .mpeg, .mov
Wat gebeurt er met Excel en CSV?
- Excel en CSV worden automatisch omgezet naar Parquet.
- Een Excelbestand met meerdere sheets wordt per sheet omgezet naar een aparte dataset.
Let op: niet-tabulaire bestanden (zoals PDF, Word, audio of video) zijn niet direct querybaar. Gebruik ze als context of bewijs en combineer analyses via referentie in je workflow.
Export (tabel-preview)
Bij een Parquet-preview kun je exporteren naar:
- Excel (.xlsx)
- CSV (.csv)
- Parquet (.parquet)
Tip: als je in de preview zoekt of filtert, exporteer je alleen de gefilterde rijen.
Praktische tips
- Gebruik Parquet als standaard voor herhaalbare analyses en grote datasets.
- Exporteer alleen de rijen die je nodig hebt om gevoelige data te beperken.
- Controleer bij CSV-export altijd de delimiter-instelling van de ontvanger.
Bestandslimieten
- Max grootte per bestand: 500 MB
- Max totale grootte per upload: 2 GB
- Max aantal bestanden per upload: 250
Verdieping: Parquet Formaat
Apache Parquet is een columnar storage formaat, geoptimaliseerd voor analytics. Aviseo converteert alle uploads automatisch naar Parquet.
Waarom columnar?
Row-based (CSV/Excel): lees alle kolommen om één kolom te analyseren
Column-based (Parquet): lees alleen de kolommen die je nodig hebt
Voorbeeld: Query SELECT SUM(amount) FROM invoices
- CSV: leest alle 10 kolommen (langzaam)
- Parquet: leest alleen de amount kolom (10x sneller)
Vergelijking
| Aspect | CSV | Parquet |
|---|---|---|
| Bestandsgrootte | 500 MB | 200 MB (60% kleiner) |
| Query snelheid | 5s | 0.3s (16x sneller) |
| Type safety | Geen | Strict |
| Human-readable | Ja | Nee (binary) |
DuckDB en Polars
Aviseo gebruikt:
- DuckDB: SQL queries op Parquet (native support, zero-copy reads)
- Polars: Data transformaties (multi-threaded, memory-efficient)
Veelgestelde vragen
Kan ik Parquet openen in Excel?
Nee, niet direct. Gebruik de export functie in Aviseo.
Is Parquet groter dan CSV?
Nee, meestal 40-70% kleiner door compressie.
Kan ik Parquet editen?
Nee, Parquet is read-only. Dit garandeert data integriteit.