Daten-Detektiv auf der Suche nach der verlorenen (Winter-)Zeit
Der Mathematik-Professor Dr. Jens Flemming untersucht, ob bei der Umstellung von Sommer- auf Winterzeit Verkehrszählungen eine ganze Stunde unter den Tisch bzw. aus der Speicherung fallen lassen. Dieses statistische Problem hat zwar keinen großen Einfluss auf die Ergebnisse eines Jahres, bringt den Mathematiker der Westsächsischen Hochschule Zwickau (WHZ) aber auf weiterführende Probleme – und die Suche nach Lösungen durch Data Science.
Verschwinden bei der Umstellung von Sommer- auf Winterzeit Fahrzeuge? Diesen Eindruck könnte man gewinnen, wenn man die Statistiken der automatischen Verkehrszählungen an Autobahnen und Bundesstraßen des letzten Oktoberwochenendes genau anschaut. Für die Doppelstunde 2:00 bis 3:00 Uhr wird nur der Zählwert einer Stunde gespeichert. Direkte Auswirkungen hat dieser Datenverlust nicht, da am frühen Sonntagmorgen generell wenig Verkehr ist. Aber Prof. Jens Flemming findet in diesem kleinen Datenverlust den Ansatz zu universelleren Fragen.
Zeitumstellung kann an unerwarteten Stellen Probleme schaffen
„Interessant ist das Problem aus zwei anderen Gründen: Einerseits zeigt es sehr schön, an wie vielen, auch unerwarteten Stellen die Zeitumstellung in unserer sehr uhrenabhängigen, technologieorientierten Gesellschaft Probleme schafft. Andererseits sieht man, dass praktisch keine Datensammlung fehlerfrei ist. Und Fehler in den Daten führen letztlich immer zu Fehlern in mit diesen Daten trainierten künstlichen Intelligenzen. Ein System zur Stauvorhersage würde zum Beispiel regelmäßig in der Umstellungsnacht im Herbst anschlagen, da plötzlich das Verkehrsaufkommen einzubrechen scheint, was auf eine Verkehrsbehinderung vor der Zählstation hindeuten kann,“ erklärt der Mathematiker den Hintergrund.
Durchforsten von Daten als spannende Detektivarbeit
Die Voraussetzungen zur Nutzung künstlicher Intelligenz sind für Prof. Jens Flemming in seinem Lehrgebiet Data Science Hauptthema. Die Erschließung und Aufbereitung großer Datenmengen beinhaltet neben automatisierten Verfahren zur Erkennung von unerwarteten Abweichungen auch immer das manuelle Durchforsten der Datenbestände. „Dieses Durchforsten wird als explorative Datenanalyse (EDA) bezeichnet und ist eine wichtige, nur durch viel praktische Übung erlernbare Grundfähigkeit jedes guten Data Scientisten,“ so Prof. Flemming.
Dabei ist der Daten-Detektiv eher zufällig auf die fehlerhaften Verkehrszählungen gekommen: „Für meine Data-Science-Vorlesungen bin ich immer auf der Suche nach interessanten Datensätzen, die nicht zu komplex, aber auch nicht langweilig sind. Mit den Studierenden untersuche ich diese Datensätze dann, reinige sie und extrahiere die für die weitere Verwendung interessanten Teile. So bin ich auch zu den Daten der Verkehrszählstellen gekommen. Das Reinigen macht im Data Science die Hauptarbeit aus, da man wie ein Detektiv Ungereimtheiten oder Fehlstellen in der Datendokumentation nachspüren muss. Im konkreten Fall war die Dokumentation unsauber, was bei genauerem Betrachten der Daten die Probleme mit der Zeitumstellung vermuten ließ. Der Verdacht wurde dann durch umfangreiche Analyse bestätigt.“
Data Science identifiziert Fehlerquellen
Den Datenverlust beheben können die Data Scientisten im Fall der Verkehrszählungen nicht, aber sie liefern die Möglichkeit, solche Probleme in großen Datenmengen zu identifizieren. Die Ursache des Problems muss von den „Verkehrszählern“ erkannt werden. Von Fehlern im Messgerät über ungeeignete Nachbearbeitung bis hin zu reinen Darstellungsproblemen gibt es viele Möglichkeiten.
Auch wenn die Ursache dem Daten-Forscher nicht bekannt ist, Lösungen, wie die Probleme behoben werden könnten, hat Prof. Jens Flemming: „Die einfachste Lösung wäre, die Zeitstempel in einer umstellungsfreien Zeit zu speichern, also beispielsweise alles in Winterzeit oder alles in der sonst für solche Zwecke üblichen GMT (Greenwich mean time). Oder die Zeitumstellung einfach abschaffen.“
Ansprechpartner für die Medien:
Prof. Dr. Jens Flemming
Telefon: 0375 536 1380
E-Mail: jens.flemming@fh-zwickau.de
Prof. Dr. Jens Flemming ist seit September 2019 Professor für Mathematik an der Westsächsischen Hochschule Zwickau. Nach seiner Promotion in Chemnitz arbeitete er an der TU als akademischer Assistent und habilitierte dort 2018. Der 35-jährige ist verheiratet und Vater von vier Kindern.
Studiengang Data Science an der WHZ:
Der digitale Fortschritt verändert die Art und Weise, wie wir leben und Wohlstand erwirtschaften, grundlegend. Das gilt auch für die Fundamente unserer Wertschöpfungsprozesse, in denen sich Daten zu einem zentralen Rohstoff und datenbasierende Geschäftsmodelle zu einer Grundlage für alle Wirtschaftszweige entwickeln. Die Nutzung und Auswertung von Daten und Datenströmen sind Taktgeber des Fortschrittes in allen Sektoren - sei es mit Blick auf die Industrie, die Mobilität, die Energie, die Bildung oder das Gesundheitswesen.
Data Science – die Datenwissenschaft – ist sehr interdisziplinär. Wichtig ist ein breites Interesse an wirtschaftlichen, naturwissenschaftlichen und technischen Zusammenhängen, mathematisches Spezialwissen ist für dieses Studium nicht nötig.
Das Studium an der WHZ dauert in Vollzeit 7 Semester, in Teilzeit 14 Semester. Mit einer Hochschulzugangsberechtigung (Abitur, Fachhochschulreife, Aufstiegsqualifikation, erfolgreiche Zugangsprüfung u.a.) sind Bewerbungen immer zum Wintersemester möglich. In diesem Jahr wurde aufgrund der besonderen Situation die Bewerbungsfrist bis zum 16. Oktober verlängert.