Europäische Statistikinstitute unter der Lupe

Copyright: stock.adobe.com/Vitalii Vodolazskyi

SUMO sprach mit Thomas Burg, Alexander Kowarik und Diana Yancheva. Burg und Kowarik sind beide in leitenden Positionen der Bereiche Qualitätsmanagement und Methodik von Statistik Austria. Diana Yancheva setzt sich beim nationalen bulgarischen Statistikinstitut mit Unternehmensstatistik auseinander und seit 2012 ist sie die Vize-Präsidentin. Aus zeitlicher Ressourcenknappheit kam ein Interview mit dem schwedischen Pendant nicht zustande.

Datenerhebung

Laut Burg und Kowarik gebe es in Österreich zwei bereits sehr etablierte Arten von Datenquellen: Erhebungsdaten, zumeist in Form von Stichproben und nachfolgender Befragung, sowie diverse administrative Datenquellen. Derzeit befinde sich die Nutzung neuerer, durch die Digitalisierung entstandener Datenquellen, die man salopp als „Big Data“ bezeichne in der Entwicklung. Unter diesen Begriff fallen diverse Datenquellen, die einen sehr unterschiedlichen Entwicklungsstand haben. Beispiele dafür seien Scannerdaten von Kassen im Einzelhandel für die Preisstatistik oder Daten über Unternehmen via Web Scraping (Anm.: Auslesen von Websites). Zukünftig sollen auch Daten privater EignerInnen wie Mobilfunkdaten als Datenquelle in Frage kommen.
In Bulgarien werden laut Yancheva die Daten nicht über administrative Wege besorgt. Einerseits erfolge dies über Online-Befragungen, die bereits seit über zehn Jahren angewendet und ständig verbessert werden, oder auch über persönliche Interviews und Befragungen von verschiedenen Haushalten. Das Portfolio umfasse auch noch „veraltete“ Methoden, da das Institut so Vergleichbarkeit sicherstelle, erklärt Yancheva. Um auf das Beispiel der Haushaltsbefragungen zurückzukommen – dieses Verfahren besteht bereits seit 90 Jahren. Durch die Digitalisierung haben sich aber auch in Bulgarien neue Methoden etabliert, wie Online-Informationssysteme, wo mit Unternehmen nahtlos zusammengearbeitet werde.

Wie es mit den Daten weitergeht

In Österreich und Bulgarien variieren die Zeiträume der Auswertungen, da die verschiedenen Statistikprodukte unterschiedliche Datengrundlagen haben. Methoden für die große Anzahl der Erhebungen kommen laut Burg und Kowarik aus dem Bereich der Stichprobentheorie sowohl design- als auch modellbasierter Art. Statistische Modelle wie auch Machine-Learning-Modelle kommen in diversen Produkten in verschiedenen Produktionsschritten zum Einsatz – wie etwa bei der Ersetzung von fehlenden Werten oder bei der Erstellung von Flash Estimates (Schnellschätzungen).

Ebenfalls könne bei Flash Estimates die Methode aus der Zeitreihentheorie, etwa zur Vorhersage von noch nicht eingelangten Meldungen, zur Anwendung kommen. Optimierungsmethoden sind laut Burg und Kowarik bei der Erstellung von Geheimhaltungsmustern einsetzbar, um möglichst wenige Zellen in Datenwürfeln sperren zu müssen. Im Kontrast dazu gibt Diana Yancheva einen tieferen Einblick in die Auswertungszeiträume. Jährlich werden vom bulgarischen Statistikinstitut 270 Umfragen durchgeführt. Darunter befinden sich Ergebnisse, die noch im gleichen Monat veröffentlicht werden, genauso wie Ergebnisse, die beinahe ein Jahr später veröffentlicht werden – ein Beispiel stellt die BIP-Veröffentlichung dar. Volkszählungen, die nur alle zehn Jahre durchgeführt werden, benötigen sogar bis zu drei Jahre, bis sie publiziert werden. In Österreich kommt es zu ähnlichen Zeiträumen, wobei Großerhebungen wie Volkszählungen oder Agrarstrukturerhebungen nur bis zu zweieinhalb Jahre brauchen.

In Österreich wurde der Statistik Austria im Jahr 2019 ein Budget von 49,9 Millionen Euro zur Verfügung gestellt. In Bulgarien hingegen steht dem Institut nur ein Budget von 12 Millionen Euro zur Verfügung. Dieses wird in den 28 regionalen sowie dem Hauptstandort verhältnismäßig eingesetzt.

Eine Union – Eine Vorgehensweise?

Ein großer Teil des Arbeitsprogramms eines nationalen statistischen Institutes in Europa ist durch die europäische Legislatur einheitlich normiert. Das betreffe laut Burg und Kowarik zumeist den Lieferzeitpunkt und -umfang der Statistik. Dies bedeute jedoch nicht, dass Durchführung und Datengrundlage in allen Ländern gleich seien. Generell lasse sich sagen, dass vor allem die skandinavischen Länder stärker mit Registern arbeiten, während in Mittel- und Südeuropa mehr direkt erhoben wird. Bei Erhebungen im klassischen Sinne, also Befragungen, gebe es oft einen Modell-Fragebogen, den dann alle Länder in die jeweiligen Landessprachen übersetzen und verwenden.
Auch bei der Auswertung findet man Differenzen. Manche Länder arbeiten bei der Stichprobenfehlerrechnung mit Replikationsverfahren, wie Bootstrap oder Jackknife, und andere mit klassischen Methoden, wie Taylor-Linearisierung, erläutern Burg und Kowarik.
Die schwerwiegendsten Unterschiede seien bei den Investitionen zu finden. Grund dafür sei die differente Wichtigkeit der Investition in innovative Themen wie dem Einsatz neuer Datenquellen und Methoden. So habe ONS (UK) beispielsweise einen eigenen „Data Science Campus” und CBS (NL) ein „Centre for Big Data Statistics”.  

Yancheva fügt noch hinzu, dass die Mitgliedschaft in der EU und somit auch Eurostat die Exploration massiv fördere. Außerdem schaffe die Zusammenarbeit einen fundamentalen Grundstein zur europäischen Integrität.

Daten sind die Grundessenz

Datenerhebungen stellen letztendlich ein numerisches Abbild über das gesamte sozioökonomische Spektrum der für eine Gesellschaft wichtigen Themen dar. Burg und Kowarik betonen, dass es von großer Bedeutung für eine Gesellschaft sei, faktenbasierte Entscheidung treffen zu können, sowie gute objektiv und unabhängig erstellte Daten als Grundlage für einen Diskussionsprozess zu verschiedensten Themen zur Verfügung zu haben. Daher seien Grundsätze wie Unabhängigkeit, Objektivität und Unparteilichkeit wichtige Grundsätze für nationale statistische Institute. Diese seien neben anderen auch im Verhaltenskodex für Europäische Statistiken festgeschrieben, zu dem sich Statistik Austria vollinhaltlich bekennt.
Die gleiche Meinung vertritt auch Yancheva. Außerdem fügt sie an, dass die Ergebnisse sind nicht nur für die Regierung von hoher Relevanz sind, sondern auch für NGOs, Unternehmen und die gesamte Gesellschaft. Denn Daten sind essenziell für den Erfolg von Regierung genauso wie Unternehmen. 

Von Kathrin Minich