Allgemeine ToDos

  • Grundprinzip besser erklären: Alle Messdaten, kontextdaten (eobachtungen, Geotags, Notizen) und referenzdaten (offizielle messdaten meherrer stationen, grenzwerte, meterologische daten) unter einer oberfläche
  • verschiedene darstellungen mit jeweils filterungen und parametern
  • Externe Datenquellen ggf. vorher
  • Umsetzung ausführlicher?

Datenanalyse und Visualisierung

Für die Auswertung und Exploration der Messdaten wurde eine eigenständige Analyseplattform entwickelt. Sie richtet sich an die Teilnehmenden der Datenwerkstatt-Workshops und ermöglicht die gemeinsame Sichtung, Analyse und Interpretation der erhobenen Daten – ohne Programmier- oder Statistikkenntnisse.

Die Plattform wurde nach den Prinzipien der Explorativen Datenanalyse (EDA) konzipiert: Statt standardisierter Auswertungen stehen Visualisierungen im Vordergrund, die direkt an den untersuchten Umweltphänomenen und den spezifischen Fragestellungen der Experimente orientiert sind.


Explorative Datenanalyse

Explorative Datenanalyse (EDA)

Die Explorative Datenanalyse ist ein Ansatz der Statistik, der Daten untersucht, von denen zunächst wenig Zusammenhangswissen existiert. Sie arbeitet induktiv: Ziel ist es, Muster und Besonderheiten in den Daten zu erkennen, neue Einsichten zu gewinnen und daraus Hypothesen abzuleiten.

Die grundlegende Metapher ist die des „Datendetektivs": Die Teilnehmenden erkunden die Daten schrittweise, folgen Auffälligkeiten, vergleichen Muster und entwickeln so ein Verständnis für die Struktur und Zusammenhänge in den Messwerten.


Visualisierungen

Die Plattform bietet verschiedene Visualisierungstypen, die jeweils unterschiedliche Aspekte der Daten zugänglich machen.

Übersicht und Einordnung

Die Übersichtsansicht zeigt die Messwerte aller offiziellen Messstationen in der Umgebung des Projektgebiets. Diese dienen als Referenz und Vergleichsgrundlage für die eigenen Messungen. Die Darstellung enthält verschiedene Grenzwerte (aktuelle und geplante EU-Grenzwerte, WHO-Empfehlungen) sowie Luftqualitätsindizes (deutscher Index, EU-Index, BLUME, US Air Quality Index). So lassen sich die eigenen Messwerte in einen breiteren Kontext einordnen.

Zeitverläufe

Die zentrale Darstellung sind Zeitreihen – Linien- und Bubblediagramme, die den Verlauf der Messwerte über die Zeit zeigen. Alle Sensoren können gemeinsam dargestellt werden, mit verschiedenen Glättungsoptionen und zeitlichen Aggregationen. Die von den Teilnehmenden erfassten Notizen und Fotos werden direkt an der entsprechenden Stelle in der Zeitreihe zur Kontextualisierung der Messwerte angezeigt. So lassen sich Auffälligkeiten in den Messwerten mit dem dokumentierten Kontext verknüpfen – etwa ein plötzlicher Anstieg mit einer notierten Baustelle oder einem Straßenfest.

Verteilungen

Violindiagramme zeigen, wie die Messwerte eines Sensors verteilt sind. Diese Darstellung hilft, die Streuung der Werte zu verstehen, Ausreißer zu erkennen und die Datenqualität einzelner Sensoren zu beurteilen.

Räumliche Darstellungen

Die Kartenansicht zeigt die räumliche Verteilung der Messwerte als Farbwolken. Zusätzlich wurde eine innovative dreidimensionale Kartendarstellung entwickelt, die räumliche Verteilung und zeitliche Entwicklung integriert: Zwei Dimensionen zeigen die geografische Position, die dritte Dimension den Zeitverlauf. So lassen sich räumliche und zeitliche Muster in einer einzigen Ansicht erfassen.

Korrelationen

Korrelationsanalysen zeigen Zusammenhänge zwischen verschiedenen Variablen – etwa zwischen Messwerten, Wetterdaten und nutzerdefinierten Kontextvariablen. Die Darstellung erfolgt als Balkendiagramm (Korrelationsstärke zwischen Variablenpaaren) und als gerichteter Graph (Variablen als Knoten, Korrelationen als Verbindungen). Die Netzwerkdarstellung macht komplexe Zusammenhänge auf einen Blick sichtbar: Starke Korrelationen erscheinen als dicke Linien, schwache als dünne.


BACI-Analyse und -Visualisierung

Für die Auswertung von Interventions-Experimenten wurde eine neue Analyse- und Visualisierungsmethode entwickelt.

Das BACI-Experimentdesign

BACI steht für „Before-After-Control-Impact" – ein Experimentdesign, das Messungen vor und nach einer Intervention an sowohl betroffenen (Impact) als auch nicht betroffenen (Control) Standorten vergleicht.

Warum dieser Aufwand? Ein einfacher Vorher-Nachher-Vergleich kann täuschen: Wenn die Luftqualität nach einer Straßensperrung besser ist, könnte das auch am Wetter liegen. Durch den gleichzeitigen Vergleich mit Kontrollstandorten lässt sich dieser Effekt herausrechnen. Die Frage ist nicht „Wurde es besser?", sondern „Wurde es stärker besser als an den Kontrollpunkten?".

Die entwickelte Methode

Die im Projekt entwickelte BACI-Analysemethode basiert auf multivariater Regression und wurde speziell für die Anforderungen von interventionsbasierten Citizen-Sensing-Projekten konzipiert.

  • Robustheit: Sie ermöglicht Interventionsanalysen auch mit Sensoren, die nicht absolut vergleichbar sind – solange sie relativ konsistent messen. Das ist für Low-Cost-Sensoren entscheidend.
  • Erweiterbarkeit: Zusätzliche Kontrollsensoren oder Kontrollvariablen (etwa Wetterdaten) können einbezogen werden.
  • Qualitätsmetriken: Die Methode liefert statistische Kennzahlen zur Bewertung der Ergebnisse – R² (Bestimmtheitsmaß) für die Modellgüte, Cohen’s d für die Effektstärke und Signifikanzwerte für die statistische Belastbarkeit.

Laienverständliche Darstellung

Ein zentrales Ziel war eine Visualisierung, die auch ohne wissenschaftliche Vorbildung eine Interpretation ermöglicht. Die BACI-Auswertungskarte zeigt die Sensorstandorte mit ihrer Rolle im Experiment, den gemessenen Interventionseffekt als Zahlenwert und Farbkodierung, die Qualitätsmetriken sowie eine verbale Zusammenfassung des Ergebnisses.

Diese Darstellung eignet sich für die Kommunikation an Stakeholder – Behörden, politische Entscheidungsträger oder die interessierte Öffentlichkeit. Die Visualisierung ist ein guter Schritt in Richtung Verständlichkeit, aber noch nicht vollständig selbsterklärend. Die Methode ist auf beliebige Messparameter übertragbar, etwa Verkehrszählungen oder Lärmbelastung.

Anwendung: Straßensperrung Proskauer Straße

In der Fallstudie Samariterviertel wurde die BACI-Methode eingesetzt, um die Auswirkungen einer baustellenbedingten Straßensperrung zu untersuchen. Das Experimentdesign umfasste vier Standortkategorien: die gesperrte Straße (Impact), angrenzende Straßen, potenzielle Umgehungsstraßen und Kontrollstandorte.

Die Anwendung zeigte: Für Feinstaub (PM2.5) war keine Korrelation mit der Sperrung nachweisbar – überregionale Einflüsse überlagerten lokale Effekte. Die NO₂-Messungen von zwei Sensoren im gesperrten Bereich ermöglichten trotz begrenzter statistischer Aussagekraft eine methodische Demonstration: Der Interventionseffekt konnte ermittelt und laienverständlich visualisiert werden.


Externe Datenquellen

Die Plattform integriert verschiedene externe Datenquellen, um die Messwerte in einen breiteren Kontext zu setzen und Vergleiche zu ermöglichen.

Offizielle Messstationen des Berliner Luftgütemessnetzes (BLUME) und des Hessischen Landesamtes für Naturschutz, Umwelt und Geologie (HLNUG) liefern Referenzwerte für den Vergleich mit den SensEm-Sensoren. Meteorologische Daten des Deutschen Wetterdienstes – Temperatur, Luftfeuchtigkeit, Windgeschwindigkeit, Windrichtung, Niederschlag – helfen bei der Interpretation von Mustern in den Messwerten. Kalender- und Zeitdaten wie Feiertage, Schulferien und Wochenenden ermöglichen die Analyse periodischer Muster.

Die Verknüpfung erfolgt automatisch über die raum-zeitlichen Bezüge: Jeder Messwert wird mit allen relevanten Kontextinformationen angereichert, die für seinen Ort und Zeitpunkt vorliegen.


Erkenntnisse aus dem Einsatz

Die Erprobung der Analyseplattform in den Datenwerkstatt-Workshops lieferte wichtige Erkenntnisse.

Was funktioniert

Die Verknüpfung von Messdaten mit Beobachtungen und Kontextwissen half, Muster zu erklären und Ausreißer einzuordnen. Die Einladung von Fachexperten zu den Datenwerkstätten verbesserte die Interpretationsqualität deutlich. Die BACI-Visualisierung erwies sich als gut geeignet für die Ergebniskommunikation – sie reduziert die Komplexität auf eine verständliche Aussage, ohne die Qualitätsmetriken zu verschweigen.

Was schwierig war

Teilnehmende empfanden manche Visualisierungen als zu abstrakt. Insbesondere statistische Darstellungen wie Korrelationsdiagramme erforderten Erklärung. Ohne Vergleichswerte und Orientierungshilfen fiel die Einordnung der Messwerte schwer – die Integration von Grenzwerten und offiziellen Messdaten war ein wichtiger Schritt, reichte aber nicht immer aus. Die Teilnehmenden äußerten insgesamt gewisse Unsicherheiten bei der Interpretation der Messergebnisse. Fachliche Unterstützung durch Experten war unverzichtbar.