Query uitvoeren
Analyseer Parquet data met SQL
Probleem
Je wilt data analyseren met SQL en een resultaatbestand opslaan.
Mini-scenario (controle op doublures)
Je controleert facturen op dubbele factuurnummers:
SELECT invoice_number, COUNT(*) as aantal
FROM "invoices.parquet"
GROUP BY invoice_number
HAVING COUNT(*) > 1;
Voor je begint
-
- Locatie in de app: Project -> tab Acties
Stappen
1) Open Query
Ga naar je project, open Acties en kies Query.
2) Selecteer Data source(s)
Selecteer één of meerdere Parquet-bestanden die je in de query wilt gebruiken.
3) Beschrijf of schrijf je query
- Description: beschrijf wat je zoekt en klik op Ask AI to create the query.
- SQL statement: schrijf of plak je SQL.
Tip: gebruik dubbele aanhalingstekens voor bestandsnamen, bijvoorbeeld "sales.parquet".
4) Geef de Output naam
Vul een naam in voor je resultaatbestand (zonder extensie).
De output wordt opgeslagen als Parquet.
5) Uitvoeren
Klik op Execute om de query uit te voeren.
Resultaat
In de Resultaten-tab verschijnt je output als Parquet-bestand.
Praktische tips
- Start met een LIMIT voor snelle validatie.
- Filter op periode of entiteit om data-scope te beperken.
- Gebruik duidelijke aliassen voor kolomnamen in het resultaat.