Vernetzen Sie sich mit uns

AI 101

Standardmodelle oder benutzerdefinierte Modelle für maschinelles Lernen?

mm
Von der Stange vs. maßgeschneiderte Modelle

Wann ist Bauen besser als der Kauf einer Lösung von der Stange?

Unternehmen können unterschiedliche Ansätze zur Modellentwicklung verfolgen. Von vollständig verwalteten ML-Diensten bis hin zu benutzerdefinierten Modellen. Abhängig von den Geschäftsanforderungen, dem verfügbaren Fachwissen und den Planungsbeschränkungen müssen sie eine Entscheidung treffen: Sollen sie maßgeschneiderte Lösungen von Grund auf entwickeln? Oder sollten sie sich für einen Standardservice entscheiden?

Für alle Phasen der ML-Workloads muss eine Entscheidung darüber getroffen werden, wie die verschiedenen Puzzleteile zusammenpassen. Von der Datenerfassung, -aufbereitung und -visualisierung bis hin zum Feature-Engineering, Modelltraining und der Auswertung stellen sich Machine-Learning-Ingenieure immer wieder die gleiche Frage: Wird es eine individuell implementierte Lösung sein, die von Grund auf geschrieben und entwickelt wurde? Oder wird es ein Standardservice sein?

Aber wann ist Bauen besser als der Kauf einer Lösung von der Stange? Die wichtigsten Unterscheidungsmerkmale zwischen den beiden Ansätzen: Vorverarbeitungsaufwand, Entwicklungsgeschwindigkeit und das erforderliche Fachwissen.

Was ist bei der Entscheidung für die Verwendung von Standardmodellen oder benutzerdefinierten Modellen für maschinelles Lernen zu beachten?

Vorverarbeitungsaufwand

ML-Projekte stehen vor allen möglichen Herausforderungen, aber die vielleicht größte Herausforderung ist die Verfügbarkeit von Trainingsdaten. Der Mangel an Trainingsdaten kann ein Projekt stoppen, bevor es überhaupt begonnen hat. Bevor ein Projekt überhaupt beginnt, können erhebliche Vorverarbeitungskosten durch die Datenerfassung, Datenkennzeichnung, Bereinigung und Vorverarbeitung anfallen. Dies ist die bekannte Falle, an der viele ML-Projekte scheitern: Die Vorverarbeitung verbraucht am Ende 80 % der zugewiesenen Ressourcen, während für das eigentliche Modelltraining und die eigentliche Modellbewertung nur wenige Ressourcen übrig bleiben.

Standardlösungen erleichtern den Aufwand bei der Vorverarbeitung. Sie sind so konzipiert, dass sie die gängigsten Vorgänge mit nur geringem Konfigurationsaufwand ausführen können. Das Beste daran ist: Für alle Phasen von ML-Workloads gibt es Standardlösungen.

Andererseits erfordern maßgeschneiderte Implementierungen in der Regel einen höheren Vorverarbeitungsaufwand. Das bedeutet nicht, dass sie vollständig abgetan werden müssen: Sie müssen weiterhin eine bestimmte ML-Stufe an die Besonderheiten des zu lösenden Problems anpassen. Für einen besonders schmutzigen Datensatz sind möglicherweise spezielle Bereinigungsregeln erforderlich. Gleichzeitig kann es sein, dass für einen bestimmten Funktionsumfang ein individuelles Feature-Engineering erforderlich ist, ebenso wie bei neuronalen Architekturen geringfügige Anpassungen erforderlich sein können. In diesem Fall decken maßgeschneiderte Lösungen, die von Grund auf neu erstellt werden, wahrscheinlich alle Anforderungen ab.

Entwicklungsgeschwindigkeit 

Standardlösungen konzentrieren sich eher auf die Konfiguration als auf die Implementierung. Anstatt Ressourcen darauf zu verwenden, es herauszufinden was sollte getan werden, auf die sich ML-Teams konzentrieren werden wie Die verschiedenen Puzzleteile passen zusammen. Dieser Ansatz ermöglicht es Unternehmen, Forschern und Ingenieuren, Prototypen und Proofs of Concept schnell umzusetzen. Anstatt das Rad neu zu erfinden, ermöglichen Standardlösungen die Nutzung vorhandenen Wissens und sparen so Entwicklungszeit.

Maßgeschneiderte Lösungen, die von Grund auf implementiert werden, sind im Hinblick auf die Entwicklungsgeschwindigkeit bekanntermaßen viel langsamer. Dies liegt an ihrem erhöhten Wartungsbedarf: Ingenieure müssen beides herausfinden was und der wie der Lösung. Je komplexer die Lösung ist, desto mehr Zeitressourcen sind erforderlich, um ihre Skalierbarkeit und Verfügbarkeit während der Produktion sicherzustellen. Aus dieser Perspektive stehen maßgeschneiderte Lösungen und Zeitaufwand in einem direkten Verhältnis: Je komplexer eine Lösung, desto mehr Zeit wird dafür benötigt.

Normalerweise liegt die Wahrheit jedoch irgendwo in der Mitte: Eine vorhandene Codebasis wird überarbeitet und an die Anforderungen des aktuellen Projekts angepasst. Dies ist beispielsweise beim bekannten Transfer-Learning-Ansatz für das Modelltraining der Fall.

Expertise

So wie es mehrere Ebenen gibt, auf denen maschinelles Lernen durchgeführt wird, gibt es auch mehrere Kompetenzebenen, auf denen ML-Modelle entwickelt werden können, von codefreien Schnittstellen bis hin zur Erstellung von Modellen von Grund auf.

Es gibt Standardlösungen, für die nur sehr geringe Fachkenntnisse im Bereich maschinelles Lernen erforderlich sind. Durch die Verwendung intuitiver Schnittstellen und sogar Drag-and-Drop-Ansätzen ist es für jeden (vom Business-Analysten bis zum Software-Ingenieur) extrem einfach geworden, ein Modell für maschinelles Lernen zu erstellen und bereitzustellen. Während dieser einfache Ansatz zur Modellentwicklung für Prototyping-Zwecke funktionieren kann, ist es unwahrscheinlich, dass er die Anforderungen von Produktionssystemen erfüllt.

Für die ordnungsgemäße Konfiguration, Einrichtung und Wartung von Standardlösungen in der Produktion ist weiterhin Fachwissen erforderlich. Problemumgehungen, Code-Patches, die Verbindung zu verschiedenen API-Schnittstellen und die Behandlung von Bereitstellungsproblemen sind häufige Aufgaben, die erforderlich sind, um die Leistung von Modellen in Produktionsumgebungen sicherzustellen.

Maßgeschneiderte Lösungen werden in der Regel auf infrastruktureller Ebene umgesetzt und daran führt kein Weg vorbei: Fachwissen ist auf jeden Fall erforderlich. Abhängig von der Unternehmensgröße und den Projektzielen können multidisziplinäre Teams für die Wartung der Produktionssysteme erforderlich sein. Datenwissenschaftler, ML-Ingenieure und Geschäftsanalysten kommen zusammen, um Inferenzergebnisse zu verstehen und Produktionsmodelle aufrechtzuerhalten.

Was sollten Sie verwenden: an Standardmodell oder benutzerdefiniertes Modell für maschinelles Lernen?

Eine ML-Lösung besteht aus vielen einzelnen Komponenten und Diensten, die zu einer zusammenhängenden Lösung zusammengefügt werden müssen. Es geht nie darum, zu 100 % kundenspezifisch zu sein oder zu 100 % von der Stange zu gehen, da unterschiedliche Geschäftsprobleme unterschiedliche Lösungen erfordern. In den meisten Fällen basieren ML-basierte Lösungen auf einer Mischung aus beidem: Standarddiensten zur Gewinnung allgemeiner Erkenntnisse, kombiniert mit benutzerdefinierten Modellen für höhere Genauigkeit und Modellierung domänenspezifischen Wissens.

Der Trick besteht darin, zu wissen, wann individuelle Lösungen von Grund auf implementiert werden müssen und welche Teile des Projekts die Vorteile von Standarddiensten nutzen können. Dies hängt weitgehend von der Art des zu lösenden Problems, den Geschäftsanforderungen, den verfügbaren Daten und den allgemeinen Einschränkungen der Entwicklungsumgebung ab.

Weitere Informationen zu KI- und Technologietrends finden Sie unter Josh Miramant, CEO von Blue Orange Digitals datengesteuerten Lösungen für Supply Chain, Automatisierung von Dokumenten im Gesundheitswesen und mehr.

Das könnte Ihnen auch gefallen:

Verwenden Sie NLP, um Kommentare in sozialen Medien zu klassifizieren

Wie die Sprachverarbeitung durch das Open-Source-BERT-Modell von Google verbessert wird  

Josh Miramant ist der CEO und Gründer von Blau Orange Digital, eine erstklassige Agentur für Datenwissenschaft und maschinelles Lernen mit Niederlassungen in New York City und Washington DC. Miramant ist ein beliebter Redner, Zukunftsforscher und strategischer Geschäfts- und Technologieberater für Unternehmen und Start-ups. Er hilft Unternehmen dabei, ihre Geschäfte zu optimieren und zu automatisieren, datengesteuerte Analysetechniken zu implementieren und die Auswirkungen neuer Technologien wie künstliche Intelligenz, Big Data und das Internet der Dinge zu verstehen.