Query uitvoeren

Analyseer Parquet data met SQL

Probleem

Je wilt data analyseren met SQL en een resultaatbestand opslaan.

Mini-scenario (controle op doublures)

Je controleert facturen op dubbele factuurnummers:

SELECT invoice_number, COUNT(*) as aantal
FROM "invoices.parquet"
GROUP BY invoice_number
HAVING COUNT(*) > 1;

Voor je begint

    • Locatie in de app: Project -> tab Acties

Stappen

1) Open Query

Ga naar je project, open Acties en kies Query.

2) Selecteer Data source(s)

Selecteer één of meerdere Parquet-bestanden die je in de query wilt gebruiken.

3) Beschrijf of schrijf je query

  • Description: beschrijf wat je zoekt en klik op Ask AI to create the query.
  • SQL statement: schrijf of plak je SQL.

Tip: gebruik dubbele aanhalingstekens voor bestandsnamen, bijvoorbeeld "sales.parquet".

4) Geef de Output naam

Vul een naam in voor je resultaatbestand (zonder extensie).
De output wordt opgeslagen als Parquet.

5) Uitvoeren

Klik op Execute om de query uit te voeren.

Resultaat

In de Resultaten-tab verschijnt je output als Parquet-bestand.

Praktische tips

  • Start met een LIMIT voor snelle validatie.
  • Filter op periode of entiteit om data-scope te beperken.
  • Gebruik duidelijke aliassen voor kolomnamen in het resultaat.

Wat nu?