KI und ML - Der richtige Angang

Immer mehr Unternehmen wollen maschinelles Lernen und künstliche Intelligenz für sich zu nutzen. Die wenigsten Unternehmen verfügen aber bereits über geeignetes Personal und müssen entsprechendes Know-how erst aufbauen. Wie man das am besten angeht, erklärt Homer Strong, Director of Data Science bei Cylance, im Interview. 

Welche Fähigkeiten sollte jemand mitbringen und wer eignet sich insbesondere wenn Unternehmen einen solchen Bereich aufbauen wollen? Und vor allem, wo findet man diese Leute?

Homer Strong (Bild, Quelle: Cylance): Es gibt natürlich einige grundsätzliche technische Voraussetzungen, die jemand mitbringen sollte. Dazu gehören Programmieren, statistisches Know-how und Wissen um die Funktionsweise von Algorithmen. Das sind wohl die wichtigsten für einen Ingenieur im Bereich maschinelles Lernen. Das allein reicht aber nicht. Es ist ganz entscheidend, dass jemand zusätzlich über herausragende Kommunikationsfähigkeiten verfügt und gewohnt ist, wissenschaftlich zu denken. Typischerweise kommen die Bewerber deshalb aus einem eher akademischen Umfeld mit einem Hintergrund als Informatiker oder Computerwissenschaftler. Aber inzwischen rekrutieren sich auch immer mehr Bewerber aus der Praxis und zwar aus ganz unterschiedlichen Bereichen. In den beiden vergleichsweise jungen Berufsbildern „ML Engineer“ oder „Data Scientist“ sind inzwischen Naturwissenschaftler, Physiker, Wirtschaftswissenschaftler vertreten, genauso wie eine steigende Zahl von Autodidakten ohne wissenschaftlichen Hintergrund. Solche Leute finden Sie nicht selten in Open-Source-Projekten bei denen maschinelles Lernen genutzt wird oder anhand entsprechender Veröffentlichungen. Beides sind gute Indikatoren über welche technischen Fähigkeiten jemand verfügt. Das akademische Umfeld ist sicherlich ein geeigneter Ort, die richtigen Bewerber zu finden, leicht ist es allerdings in keinem der genannten Felder.

Könnte man die Kriterien in etwa so formulieren: Man braucht unterschiedliche Mitarbeiter in den unterschiedlichen Stadien eines Projekts?

Homer Strong: Absolut richtig, ja. ML Engineers und Data Scientists müssen den kompletten Analyse-Stack beherrschen. Data Scraping oder andere Erfassungsmethoden, das Bereinigen und das Verwalten der Daten binden viele Ressourcen. Wenn sich das Projekt dann weiter entwickelt und das Team entsprechend wächst, bilden sich stärker spezialisierte Rollen heraus. Beispielsweise solche Mitarbeiter, die riesige Dateninfrastrukturen, Big Data wie etwa Spark verwalten.

Wie unterscheiden sich solche Projekte von üblichen Coding-Projekten?

Homer Strong: In allererster Linie dadurch, dass Sie oftmals um einen gewissen experimentellen Anteil nicht herumkommen. Es gibt immer eine bestimmte Anzahl an Wiederholungen beim Entwickeln und Trainieren eines Modells. Für Probleme, die bereits gut dokumentiert sind und zu denen ausreichendes Fachwissen zur Verfügung steht, und wenn dann noch die zugrunde liegenden Daten bereinigt sind, ähneln solche Projekte durchaus ganz durchschnittlichen Coding-Unterfangen. Das gilt etwa für die Methode des kollaborativen Filterns  oder für das Klassifizieren von Spam. Allerdings gibt es immer wieder Fälle, bei denen der zuständige ML Engineer nicht darum herumkommt innerhalb vieler Wiederholungen auch zu experimentieren. Etwa mit verschiedenen Funktionen, unterschiedlichen Architekturen oder Typen von Modellen. Es gibt bei derlei Projekten keinerlei Garantie, dass die Resultate dann tatsächlich zufriedenstellend sind. Es ist durchaus möglich, dass Sie lediglich herausfinden, dass Sie weitere Daten sammeln und analyisieren müssen. Und selbst, wenn Sie ein Modell tatsächlich bereits einsetzen, kann es notwendig werden, es in periodischen Abständen neu zu evaluieren und zu aktualisieren. Etwa weil sich das ursprüngliche Referenzkonzept verändert hat.

Worin bestehen die größten Herausforderungen und wie bekommt man sie am besten in den Griff?

Homer Strong: Maschinelles Lernen hat beide Seiten. Es ist eine ganz besonders herausfordernde Sache, aber auch eine besonders dankenswerte und erfolgversprechende. Um es mit Richard Feynman zu sagen „Machen Sie sich nichts vor, denn Sie selbst sind es, dem Sie etwas vormachen". Dieser Satz hat leider gerade in Bezug auf maschinelles Lernen seine Berechtigung. Gerade in diesem Metier unterliegt man leicht der Täuschung, dass etwas funktioniert, auch wenn es das nicht tut. Ein Beispiel. Es ist vergleichweise einfach, Informationen aus einem Trainings-Set in das eigentliche Test-Setting zu übernehmen. Das führt dazu, dass das Modell wesentlich präziser zu sein scheint, als es tatsächlich der Fall ist. Es empfiehlt sich stattdessen mit einer explorativen Analyse zu beginnen, und beim eigentlichen Modellansatz sehr sparsam vorzugehen. Das heißt etwa, sich an Experimenten zu orientieren, deren Resulate wiederholbar sind, wenn man zuverlässig funktionierende Modelle evaluieren will.

 

www.cylance.com

Zwei Welten verbinden

Whitepaper "Zwei Welten verbinden"

Whitepaper von Siemens zu „Grundlagen und Funktion der sicheren Anbindung industrieller Kommunikations-
netzwerke an die Unternehmens-IT“

» Jetzt kostenlos downloaden!

Digital Factory Journal:
Jetzt kostenlos testen

Digital Factory Journal - Jetzt kostenlos bestellen

Mit unserem neuen Fachmedium „Digital Factory Journal“ greifen wir neue Lösungsansätze, Geschäftsmodelle und Anwendungen aus der Praxis auf und berichten darüber mit hoher journalistischer Kompetenz für die Entscheider in der Industrie. Unser redaktioneller Fokus liegt dabei auf Ready-to-Use-Lösungen aus der IT- und Automatisierungswelt.

» Bestellen Sie jetzt Ihr kostenloses Jahresabo!

Top-3-Interviews

Prof. Dr. Uwe Kubach, SAP: M2M im Internet der Dinge - IT trifft Industrie 4.0

Frank Maier, Lenze: Industrie 4.0 seit 70 Jahren

Prof. Dr. Markus Schneider, PuLL Beratung GmbH: Lean Manufacturing im Zeitalter von Industrie 4.0

Aus der Praxis

Wenn Mensch und Roboter in Einklang arbeiten: Die Leichtbauroboter von ABB und Kuka im Einsatz

Die Smartwatch im industriellen Einsatz: Asys, In-Tech und Monkey Works berichten über Lösungen

Digitale Zwillinge optimieren in der virtuellen Welt die Realität: Siemens gibt Einblicke in die Entstehung der Nanobox Simatic IPC227E

Seminare

Von Techniktrends bis zu Management-, Normungs- und Sicherheitsthemen – das aktuelle Seminarprogramm im Überblick:

» Automatisierungstechnik
» Informationstechnik
» Normen und Sicherheit
» Elektrotechnik
» Mess- und Prüftechnik
» Energietechnik
» Organisation/Management/Recht