Wiener "Datenumwandler" wollen den US-Markt erobern

Datenschutz und die Nutzung personenbezogener Daten müssen kein Widerspruch sein, wenn sie nur richtig aufbereitet werden. Wie das geht, zeigt das Wiener Start-up Mostly AI. Mithilfe künstlicher Intelligenz und Machine-learning-Technologie kann Mostly.AI reale Datensätze in künstliche umwandeln. "Die synthetischen Datensätze von uns sehen genauso echt aus wie die Original-Kundendaten eines Unternehmens, mit genauso vielen Details, aber ohne die ursprünglichen persönlichen Datenpunkte", erläutert Mostly.AI-Vorstandschef Tobias Hann dem KURIER.
"Datensynthetisierung" nennt sich dieser Vorgang. Der Vorteil: Durch die Anonymisierung ist eine Zuordnung zu einer real existierenden Person praktisch nicht mehr möglich, zugleich bleiben die spezifischen Merkmale und damit die Aussagekraft der Daten erhalten.

Daten sind der Rohstoff der Digitalisierung
Als Beispiel nennt Hann Kundendaten von Banken. Hier könne die KI-Software aus vorhandenen Kunden-, Standort- und Transaktionsdaten synthetische Daten generieren, mit denen ohne Datenschutzbedenken weitergearbeitet werden kann. Mit Simulationen könne dann das Kundenverhalten genau analysiert werden, um daraus neue Produkte oder Dienstleistungen zu entwickeln.
Ein weiterer Vorteil: Es können auch Daten simuliert werden, die die Bank gar nicht erhoben hat. "Die Datensätze sind oft lückenhaft vorhanden, künstliche Intelligenz kann diese Lücken ausgleichen", erläutert Tann. Synthetische Daten seien also nicht genauso gut wie die echten, sondern sogar besser.
Synthetische Daten sind grundsätzlich künstlich erzeugte Daten, die nicht aus realen Ereignissen stammen. Sie werden an Hand von Algorithmen hergestellt und können für diverse Zwecke, etwa als Testdaten für die Produktion, für die Forschung und Entwicklung oder für Lernmodelle genutzt werden.
Durch synthetische Daten können Beschränkungen in der Nutzung von authentischen Daten, die durch deren Sensibilität oder wegen gesetzlichen Regulierungen nicht genutzt werden dürfen, umgangen werden. Außerdem sind die Anwender nicht an bestimmte Bedingungen, die durch reale Daten bestimmt werden, festgelegt.
Bei Mostly.AI werden synthetische Daten auf Grundlage realer Daten generiert. Dabei werden personenbezogene Daten anonymisiert, und weiterverarbeitet. Der Prozess der Synthese kann auch dazu verwendet werden, Originaldaten zu erweitern, etwa um Verzerrungen zu beheben, seltene Ereignisse hochzurechnen oder Grenzfälle zu generieren, die im Original nicht vorhanden sind.
Hier ein Erklärvideo von Mostly.AI:
Der Markt mit künstlichen Daten wächst stark. Laut dem Marktforschern von Gartner werden bis 2024 schon 60 Prozent der Daten, die für die Entwicklung von KI- und Analyseprojekten verwendet werden, synthetisch generiert. Die Einsatzbereiche reichen vom Gesundheitssektor, wo sensible Patientendaten einfacher für die Forschung und Entwicklung zur Verfügung gestellt werden können, über die Bilderkennung von selbstfahrenden Autos bis zum Aufspüren von Geldwäsche. Nicht alle Datenschützer sind jedoch überzeugt, dass die Synthetisierung tatsächlich alle Datenschutzbedenken ausräumen kann. Die Entwicklung ist hier aber erst am Anfang.
Pionier
Mostly.AI zählt europaweit zu den Pionieren in diesem noch sehr jungen Geschäftszweig der Datensynthetisierung. Namhafte Investoren trauen dem Start-up viel zu. Soeben schloss das Unternehmen eine Serie-B-Finanzierungsrunde in Höhe von 25 Mio. Dollar ab. Angeführt wurde die Runde von Europas größten Tech-Venture-Fonds Molten Ventures.
Gegründet wurde Mostly.AI 2017 vom Mathematiker und Ökonomen Michael Platzer gemeinsam mit den Datenwissenschaftern Klaudius Kalcher und Roland Boubela. Ihre Idee war, das Potenzial von KI zu nutzen, um strukturierte Geschäftsdaten zu generieren. Mit der Umsetzung der europäischen Datenschutzgrundverordnung (DSVG) stieg der Bedarf nach anonymisierten Daten. WU-Absolvent Hann ist seit zwei Jahren Vorstandschef bei Mostly.AI. Zuvor war Berater bei der Boston Consulting Group und Mitgründer von drei Start-ups.

Bank-Referenzen
Zu den Referenzkunden zählen die Erste Bank, Bawag PSK, Citigroup und der spanische Telekomanbieter Telefonica. Zuletzt gebe es auch verstärkt Anfragen aus dem Gesundheitsbereich, so Hann. Mit dem Investorengeld will er vor allem den US-Markt weiter aufbauen, eine Niederlassung in New York gibt es schon. "Unser Markt ist global, ein wichtiger Fokus sind die USA", hat Hann große Ziele. Die Zahl der Mitarbeitenden soll noch in diesem Jahr von 40 auf 65 aufgestockt werden. Umsatz- und Ertragszahlen gibt Hann keine bekannt, wie alle Start-ups sei man noch in der Verlustzone.
Kommentare