Zu Hauptinhalt springen

Big Data Analytics und Datenqualit?t

Aufgrund schnell wachsender Mengen an strukturierten aber vor allem auch unstrukturierten Daten (Big Data) ist Datenqualit?t heute ein hoch relevantes Thema. So werden bspw. gro?e Mengen an unstrukturierten Daten aus unterschiedlichen, verteilten Quellen in diversen Formaten gesammelt und analysiert (oft in Echtzeit), um relevante Erkenntnisse abzuleiten und unternehmerische Entscheidungen zu unterstützen. Damit die abgeleiteten Ergebnisse valide und wertstiftend sind, ist die Sicherstellung der Qualit?t der zugrundeliegenden Daten unabdingbar.


Konkret werden im Rahmen der Forschungsarbeiten quantitative Methoden und Modelle zur Messung, Steuerung und Verbesserung der Datenqualit?t entwickelt und evaluiert. Dabei werden folgende Ziele verfolgt:

  1. Entwicklung von Ans?tzen zur Messung der Datenqualit?t strukturierter und unstrukturierter Daten: Es werden effiziente quantitative Ans?tze zur Messung der Datenqualit?t für datenwertorientierte Qualit?tsdimensionen (bspw. Korrektheit, Konsistenz, Aktualit?t, Vollst?ndigkeit, Eindeutigkeit) entwickelt. bwin娱乐_bwin娱乐官网欢迎您@e sollen aufgrund der z. T. enormen Datenmengen automatisiert anwendbar und für unterschiedliche Datenformate (z. B. strukturierte und unstrukturierte Daten) sowie verteilte Daten (z. B. unternehmensinterne und -externe Daten) geeignet sein.
  2. Entwicklung maschineller Lernverfahren zur Berücksichtigung der Datenqualit?t: Zur Analyse strukturierter und unstrukturierter Daten werden maschinelle Lernverfahren (weiter)entwickelt, um das gemessene Datenqualit?tsniveau (vgl. 1.) methodeninh?rent zu berücksichtigen. bwin娱乐_bwin娱乐官网欢迎您@e Einbeziehung der Datenqualit?t führt nicht nur dazu, dass sich die ermittelten Ergebnisse (z. B. Klassen- oder Clusterzuordnung) sehr stark ?ndern k?nnen. Vielmehr wird auch die Güte der Ergebnisse abh?ngig von der Qualit?t der Inputdaten ermittelt und ausgewiesen, um Entscheidungen wesentlich besser und transparenter als bisher unterstützen zu k?nnen.
  3. Entscheidungskalküle zur Bewertung der Datenqualit?t und zur Planung von Ma?nahmen: Es wird an Entscheidungskalkülen gearbeitet, die eine ?konomische Bewertung von Datenqualit?tsma?nahmen gerade auch im Kontext von Big Data erlauben. Dabei gilt es sowohl die Kosten als auch den Nutzen unter Berücksichtigung der Charakteristika von Big Data m?glichst automatisiert zu ermitteln. Der Nutzen von Datenqualit?tsma?nahmen resultiert prim?r aus der besseren Entscheidungsqualit?t, die mit h?herer Datenqualit?t einhergeht, wobei insbesondere der konkrete Anwendungsfall sowie die verwendeten maschinellen Lernverfahren zu berücksichtigen sind.
  4. Datenqualit?t in der Informationssicherheit: Die Bewertung und Verbesserung der Datenqualit?t ist im Kontext der Informationssicherheit besonders herausfordernd. Erstens sind die Auswirkungen einer guten versus schlechten Datenqualit?t speziell in der Informationssicherheit mit einer ungleich h?heren Entscheidungsunsicherheit behaftet. Zweitens kommt hinzu, dass die Qualit?t der Datenbasis für die Analysen und Entscheidungen auch gew?hrleistet sein muss, selbst oder gerade wenn diese Datenbasis mehrere Unternehmen mit (anonymisierten) Sicherheitsvorf?llen umfasst.

Einen ?berblick über die Fragestellungen gibt folgende Abbildung:


Abgeschlossene, laufende und zukünftige Forschungsprojekte:


Publikationen zu diesem Forschungsthema


  1. STARTSEITE UR
  2. Fakult?t für Informatik und Data Science

Lehrstuhl für Wirtschaftsinformatik II

Prof. Dr. Bernd Heinrich

Team Rechts

Sekretariat

Tel.: +49 (0)941 943-6101
Fax:  +49 (0)941 943-6120
E-Mail

Universit?tsstra?e 31
93053 Regensburg