Was bedeutet Data Science?

Was bedeutet Data Science?
Es ist wie bei der Renovierung eines Badezimmers: Der Fliesenleger kommt erst, wenn der Installateur da war und die Wände vorgeschliffen sind. Ähnlich verhält es sich mit Daten: Sind die Vorarbeiten nicht ordentlich verrichtet, kann der Data Scientist auf kein solides Datenfundament aufbauen.

Data Science ist eine Schnittmenge aus Informatik – für den Umgang mit großen Datenmengen, Statistik, für die Optimierungsverfahren des Maschinellen Lernens und Domänenexpertise – für die Interpretation der Daten und Ergebnisse.

Im Gegensatz zum Data Engineering, das sich vor allen Dingen um die Zusammenführung und Bereitstellung von Daten handelt, arbeiten Data Scientists mit den bereits aufbereiteten Daten. Während Data Analysts vor allen Dingen auf Modellierung und visuelle Aufbereitung der Daten spezialisiert sind, suchen Daten Scientists nach Korrelationen und Abhängigkeiten in oder zwischen den Daten. Diese Abhängigkeiten werden dann mithilfe statistischer Verfahren genutzt und für verschiedenste Anwendungsbereiche verwendet.

Was bedeutet Data Science?

Wann braucht ein Unternehmen eigene Data Scienctists?

Das hängt stark vom Unternehmen ab. Im E-Commerce beispielsweise ist die Verwendung von Data Science Verfahren gängige Praxis, denn sie können den Umsatz stark beeinflussen. Ein eigenes Data Science Team ist hier gegebenenfalls sinnvoll. Andere Unternehmen können diese Bedarfe mit externer Hilfe realisieren. Dabei ist wichtig, dass es innerhalb des Unternehmens AnsprechpartnerInnen gibt, die sich mit Daten und den grundsätzlichen Analysemöglichkeiten auskennen. Wenn dann Data Scientists als ExpertInnen herangezogen werden, können diese möglichst schnell mit Daten und Domänenwissen versorgt werden, damit diese effiziente erste Analysen durchführen können.

Welche Skills brauchen Data Scientists?

Data Scientists brauchen – neben den technischen Fähigkeiten mit großen Datenmengen umzugehen und einer fundierten mathematischen Ausbildung – vor allen die Fähigkeit, sich schnell in neue Fachthemen hineinzudenken und die wesentlichen Fachaspekte auf die Daten projizieren zu können. Es gibt Data Scientists, die stärker in der Implementierung sind oder wiederum welche, die ihre Stärke im mathematischen Modellieren eines Problems haben. Je größer das Team, desto mehr kann es spezialisierte Profile geben.

Im Normalfall sind Data Science Teams aber eher klein und somit fallen viele unterschiedliche Aufgaben in den Verantwortungsbereich von Data Scientists. Am wichtigsten ist jedoch, sich nicht von technisch komplexen Systemen abschrecken zu lassen, Dinge erst einmal pragmatisch anzugehen, um abschätzen zu können, ob eine weitere Arbeit an einer Problemstellung überhaupt zielführend ist.

Stefan Balke

Besuchen Sie den Lehrgang Certified Business Data Scientist des Controller Instituts. Nächster Start: 23. März 2022 | Wien.

Kommentare