Het kan aanlokkelijk zijn om "echte" gegevens te gebruiken, maar volgens de GDPR is dat geen goed idee als het gaat om persoonsgegevens. Helaas kan het testen of debuggen van software moeilijker zijn zonder volledige toegang tot alle onderliggende gegevens. Een synthetische dataset kan dan een goede oplossing zijn: het genereren van fictieve vervangende gegevens, die de structuur en verdeling van de oorspronkelijke gegevens nabootsen.
Joachim Ganseman van Smals Research vertelt hoe synthetische gegevens kunnen worden gegenereerd, en vooral over de praktische bezwaren en beperkingen.
- Hoe gaan we om met zelden voorkomende waarden, correlaties of afhankelijkheden?
- Hoe zit het met de balans tussen maximale privacybescherming en voldoende functionele bruikbaarheid?
- Kunnen we betrouwbare analyses uitvoeren op een synthetische dataset?
Bestanden
U kan inloggen om het volledig overzicht van bestanden te raadplegen.
- 🔒 slides.pdf (Enkel voor SAI leden)
Links
U kan inloggen om het volledig overzicht van links te raadplegen.
- 🔒 Link naar webinar (Teams) (Enkel voor SAI leden)
- 🔒 Opname (Enkel voor SAI leden)
Spreker(s)
Joachim Ganseman
Researcher bij SMALS