Data Mining mit Administrativdaten der Sozialen Sicherheit

In diesem Forschungsprojekt des Fachbereichs Soziale Arbeit und des Departements Technik und Informatik wird das Potenzial der Methoden des Data Mining im Bereich Soziale Sicherheit ausgelotet.

Fiche signalétique

Contexte initial

Das interdepartementale Forschungsprojekt lotet das Potenzial der Methoden des Data Mining im Bereich Soziale Sicherheit aus und sucht daran anschliessende Vermarktungsmöglichkeiten. Anhand der Datenbestände der Invalidenversicherung, Arbeitslosenversicherung, Sozialhilfe und der Einkommensdaten der AHV für die Jahre 2005 bis 2010 werden aussagekräftige Verlaufsmuster gefunden, die eine Grundlage für ein Langzeitmonitoring des SECO bilden können.

But

Komplexe Analysemethoden des Data Mining auf grosse Administrativdatensätze der Sozialen Sicherheit anwenden, um Potenzial an enthaltenen Informationen in den Daten zu extrahieren. Entwicklung eines Auswertungstools zu Handen SECO.

Compétences clés

Aufbau Datenbank, Bildung statistische Verläufe, Clustering, Regression, statistische Risikoprofile, Risikoindikatoren, SQL Server: Datenbanken, Integration Services, Analysis Services Cube und Reporting Services, Sequenzdatenanalyse

Résultat

Durch eine Verschränkung von Cluster- und Sequenzanalyse konnten die Vielzahl der beobachteten Verläufe zu vier Clustern gruppiert werden. In der Risikoanalyse erfolgte eine konzeptionelle Operationalisierung von Risiko über die Entfernung von Verläufen vom Arbeitsmarkt. Es wurde ein Risikomodell zur Prognostizierung der Risikostruktur entwickelt. Weitere Indikatoren zum Risiko von Systemverläufen wurden in einem interaktiven Monitoring-Tool auf Basis SQL-Server konsolidiert.

Perspectives

Fortsetzungsprojekt mit Prognose-tool Arbeitsintegration (BREF-Eingabe) Für SECO kann das Abfragetool für spezifische Auswertungen genutzt werden. BFH-interne Nutzung bei Forschungsprojekten im Bereich ALV. Wissenschaftlicher Artikel