Künstliche Intelligenz

Top MLOps-Tools-Leitfaden: Weights & Biases, Comet und mehr

Published June 24, 2024

Updated April 4, 2026

Aayush Mittal Mittal

MLOps Tools Guide: Weights & Biases, Comet and More

Machine Learning Operations (MLOps) ist eine Reihe von Praktiken und Grundsätzen, die darauf abzielen, die Prozesse der Entwicklung, Bereitstellung und Wartung von Machine-Learning-Modellen in Produktionsumgebungen zu vereinheitlichen. Es kombiniert Prinzipien aus DevOps, wie kontinuierliche Integration, kontinuierliche Lieferung und kontinuierliche Überwachung, mit den besonderen Herausforderungen der Verwaltung von Machine-Learning-Modellen und -Datensätzen.

Da die Verbreitung von Machine Learning in verschiedenen Branchen weiter wächst, ist auch die Nachfrage nach robusten MLOps-Tools gestiegen. Diese Tools helfen dabei, den gesamten Lebenszyklus von Machine-Learning-Projekten zu strukturieren, von der Datenvorbereitung und dem Modelltraining bis zur Bereitstellung und Überwachung. In diesem umfassenden Leitfaden werden wir einige der besten MLOps-Tools erkunden, darunter Weights & Biases, Comet und andere, sowie ihre Funktionen, Anwendungsfälle und Codebeispiele.

Was ist MLOps?

MLOps, oder Machine Learning Operations, ist ein interdisziplinäres Feld, das die Prinzipien von ML, Software-Engineering und DevOps-Praktiken kombiniert, um die Bereitstellung, Überwachung und Wartung von ML-Modellen in Produktionsumgebungen zu strukturieren. Durch die Etablierung standardisierter Workflows, die Automatisierung wiederkehrender Aufgaben und die Implementierung robuster Überwachungs- und Governance-Mechanismen ermöglicht MLOps es Organisationen, die Modellentwicklung zu beschleunigen, die Bereitstellungszuverlässigkeit zu verbessern und den Wert von ML-Initiativen zu maximieren.

Erstellung und Wartung von ML-Pipelines

Beim Erstellen eines auf Machine Learning basierenden Produkts oder einer Dienstleistung bedeutet das Trainieren und Evaluieren des Modells auf einigen Echtzeitproben nicht unbedingt das Ende der Verantwortung. Sie müssen das Modell für die Endbenutzer verfügbar machen, überwachen und gegebenenfalls für eine bessere Leistung neu trainieren. Eine herkömmliche Machine-Learning-Pipeline (ML) ist eine Sammlung verschiedener Stadien, die Datenerfassung, Datenvorbereitung, Modelltraining und -evaluation, Hyperparameter-Tuning (falls erforderlich), Modellbereitstellung und -skalierung, Überwachung, Sicherheit und Compliance sowie CI/CD umfassen.

Ein Machine-Learning-Engineering-Team ist für die Arbeit an den ersten vier Stadien der ML-Pipeline verantwortlich, während die letzten beiden Stadien in die Verantwortung des Betriebsteams fallen. Da es in den meisten Organisationen eine klare Abgrenzung zwischen den Machine-Learning- und Betriebsteams gibt, sind effektive Zusammenarbeit und Kommunikation zwischen den beiden Teams für die erfolgreiche Entwicklung, Bereitstellung und Wartung von ML-Systemen unerlässlich. Diese Zusammenarbeit von ML- und Betriebsteams ist das, was man MLOps nennt und konzentriert sich auf die Strukturierung des Prozesses der Bereitstellung von ML-Modellen in der Produktion sowie auf die Wartung und Überwachung. Obwohl MLOps eine Abkürzung für ML und Betrieb ist, darf man sich nicht von der Tatsache täuschen lassen, dass es auch die Zusammenarbeit zwischen Datenwissenschaftlern, DevOps-Ingenieuren und IT-Teams ermöglicht.

Die Kernverantwortung von MLOps besteht darin, eine effektive Zusammenarbeit zwischen ML- und Betriebsteams zu erleichtern, um den Modellentwicklungs- und -bereitstellungsprozess mit Hilfe von CI/CD-Praktiken zu beschleunigen, die durch Überwachung, Validierung und Governance von ML-Modellen ergänzt werden. Tools und Software, die automatisierte CI/CD, einfache Entwicklung, Bereitstellung im großen Maßstab, Arbeitsablaufstrukturierung und verbesserte Zusammenarbeit ermöglichen, werden oft als MLOps-Tools bezeichnet. Nach umfangreichen Recherchen habe ich eine Liste verschiedener MLOps-Tools zusammengestellt, die in großen Technologieunternehmen wie Netflix, Uber, DoorDash, LUSH usw. verwendet werden. Wir werden alle diese Tools später in diesem Artikel besprechen.

Typen von MLOps-Tools

MLOps-Tools spielen in jeder Phase des Machine-Learning-Lebenszyklus eine wichtige Rolle. In diesem Abschnitt werden Sie eine klare Aufschlüsselung der Rollen einer Liste von MLOps-Tools in jeder Phase des ML-Lebenszyklus sehen.

Workflow-Orchestrierungstools

Die Workflow-Orchestrierung im Bereich Machine Learning bezieht sich auf den Prozess der Verwaltung und Koordinierung der verschiedenen Aufgaben und Komponenten, die in den gesamten ML-Workflow, von der Datenvorbereitung und dem Modelltraining bis zur Modellbereitstellung und -überwachung, involviert sind.

MLOps-Software ist in diesem Bereich sehr beliebt, da sie Funktionen wie Workflow-Management, Abhängigkeitsmanagement, Parallelisierung, Versionskontrolle und Bereitstellungsautomatisierung bietet, die es Organisationen ermöglichen, ihre ML-Workflows zu strukturieren, die Zusammenarbeit zwischen Datenwissenschaftlern und Ingenieuren zu verbessern und die Lieferung von ML-Lösungen zu beschleunigen.

Modell-Trainingsframeworks

Diese Phase umfasst den Prozess der Erstellung und Optimierung von Vorhersagemodellen mit gelabelten und ungelabelten Daten. Während des Trainings lernen die Modelle die zugrunde liegenden Muster und Beziehungen in den Daten, indem sie ihre Parameter anpassen, um den Unterschied zwischen vorhergesagten und tatsächlichen Ergebnissen zu minimieren. Sie können diese Phase als die codeintensivste Phase der gesamten ML-Pipeline betrachten. Deshalb müssen Datenwissenschaftler aktiv an dieser Phase beteiligt sein, da sie verschiedene Algorithmen und Parameterkombinationen ausprobieren müssen.

Machine-Learning-Frameworks wie scikit-learn sind sehr beliebt für das Training von Machine-Learning-Modellen, während TensorFlow und PyTorch für das Training von Deep-Learning-Modellen, die aus verschiedenen neuronalen Netzen bestehen, sehr beliebt sind.

Modell-Bereitstellungs- und -Serverplattformen

Sobald das Entwicklungsteam das Modell trainiert hat, muss es das Modell für die Inferenz in der Produktionsumgebung verfügbar machen, in der diese Modelle Vorhersagen generieren können. Dies umfasst in der Regel die Bereitstellung des Modells auf einer Server-Infrastruktur, die Einrichtung von APIs für die Kommunikation, Modellversionierung und -verwaltung, automatisierte Skalierung und Lastverteilung sowie die Gewährleistung von Skalierbarkeit, Zuverlässigkeit und Leistung.

MLOps-Tools bieten Funktionen wie Containerisierung, Orchestrierung, Modellversionierung, A/B-Testing und Protokollierung, die es Organisationen ermöglichen, ML-Modelle effizient und effektiv bereitzustellen und zu servieren.

Überwachungs- und Beobachtbarkeitstools

Die Entwicklung und Bereitstellung von Modellen ist kein einmaliger Prozess. Wenn Sie ein Modell auf einer bestimmten Datenverteilung entwickeln, erwarten Sie, dass das Modell Vorhersagen für dieselbe Datenverteilung in der Produktion treffen kann. Dies ist jedoch nicht ideal, da die Datenverteilung in der realen Welt anfällig für Änderungen ist, was zu einer Verschlechterung der Vorhersagekraft des Modells führt, was als Daten-Drift bezeichnet wird. Es gibt nur einen Weg, um Daten-Drift zu erkennen, nämlich durch kontinuierliche Überwachung der Modelle in der Produktion.

Die Modell-Überwachung und -Beobachtbarkeit in Machine Learning umfassen die Überwachung von Schlüsselmetriken wie Vorhersagegenauigkeit, Latenz, Durchsatz und Ressourcenauslastung sowie die Erkennung von Anomalien, Drift und Konzeptverschiebungen in der Datenverteilung. MLOps-Überwachungstools können die automatisierte Erfassung von Telemetriedaten, die Echtzeitanalyse und -visualisierung von Metriken sowie die Auslösung von Warnungen und Aktionen auf der Grundlage vordefinierter Schwellenwerte oder Bedingungen ermöglichen.

Zusammenarbeits- und Experiment-Verfolgungsplattformen

Angenommen, Sie arbeiten an der Entwicklung eines ML-Systems zusammen mit einem Team von Datenwissenschaftlern. Wenn Sie keine Mechanismen verwenden, um zu verfolgen, welche Modelle bereits ausprobiert wurden, wer an welchem Teil der Pipeline arbeitet usw., wird es schwierig, zu bestimmen, welche Modelle bereits von Ihnen oder anderen ausprobiert wurden. Es könnte auch der Fall sein, dass zwei Entwickler daran arbeiten, dieselben Funktionen zu entwickeln, was eine echte Verschwendung von Zeit und Ressourcen ist. Und da Sie nichts im Zusammenhang mit Ihrem Projekt verfolgen, können Sie diese Kenntnisse nicht für andere Projekte nutzen, was die Reproduzierbarkeit einschränkt.

Zusammenarbeits- und Experiment-Verfolgungs-MLOps-Tools ermöglichen es Datenwissenschaftlern und Ingenieuren, effektiv zusammenzuarbeiten, Wissen zu teilen und Experimente für die Modellentwicklung und -optimierung zu reproduzieren. Diese Tools bieten Funktionen wie Experiment-Verfolgung, Versionierung, Nachverfolgung der Herkunft und Modell-Register, die es Teams ermöglichen, Experimente zu protokollieren, Änderungen zu verfolgen und Ergebnisse über verschiedene Iterationen von ML-Modellen zu vergleichen.

Datenspeicherung und -versionierung

Beim Arbeiten an ML-Pipelines werden Sie erhebliche Änderungen an den Rohdaten in der Vorbereitungsphase vornehmen. Aus irgendeinem Grund, wenn Sie Ihr Modell nicht sofort trainieren können, möchten Sie diese vorverarbeiteten Daten speichern, um wiederholte Arbeit zu vermeiden. Gleiches gilt für den Code; Sie werden immer weiter an dem Code arbeiten, den Sie in Ihrer vorherigen Sitzung hinterlassen haben.

MLOps-Datenspeicher- und -versions-Tools bieten Funktionen wie Datenversionierung, Artefakt-Verwaltung, Metadaten-Verfolgung und Daten-Herkunftsverfolgung, die es Teams ermöglichen, Änderungen zu verfolgen, Experimente zu reproduzieren und Konsistenz und Reproduzierbarkeit über verschiedene Iterationen von ML-Modellen hinweg zu gewährleisten.

Rechenleistung und Infrastruktur

Wenn Sie über das Training, die Bereitstellung und die Skalierung von Modellen sprechen, kommt alles auf Rechenleistung und Infrastruktur an. Insbesondere in der heutigen Zeit, in der große Sprachmodelle (LLMs) für verschiedene branchenspezifische generative KI-Projekte eingesetzt werden. Sie können sicherlich ein einfaches Klassifizierungsmodell auf einem System mit 8 GB RAM und ohne GPU-Gerät trainieren, aber es wäre nicht ratsam, ein LLM-Modell auf derselben Infrastruktur zu trainieren.

Rechenleistungs- und Infrastruktur-Tools bieten Funktionen wie Containerisierung, Orchestrierung, Auto-Skalierung und Ressourcen-Verwaltung, die es Organisationen ermöglichen, Cloud-Ressourcen, On-Premises-Infrastruktur oder Hybrid-Umgebungen für ML-Workloads effizient zu nutzen.

Die besten MLOps-Tools und -Plattformen für 2024

Obwohl Weights & Biases und Comet bekannte MLOps-Startups sind, gibt es noch viele andere Tools, die verschiedene Aspekte des Machine-Learning-Lebenszyklus unterstützen. Hier sind einige bemerkenswerte Beispiele:

MLflow: MLflow ist eine Open-Source-Plattform, die dabei hilft, den gesamten Machine-Learning-Lebenszyklus zu verwalten, einschließlich Experiment-Verfolgung, Reproduzierbarkeit, Bereitstellung und einem zentralen Modell-Register.
Kubeflow: Kubeflow ist eine Open-Source-Plattform, die darauf ausgelegt ist, die Bereitstellung von Machine-Learning-Modellen auf Kubernetes zu vereinfachen. Sie bietet eine umfassende Reihe von Tools für Datenvorbereitung, Modelltraining, Modell-Optimierung, Vorhersage-Bereitstellung und Modell-Überwachung in Produktionsumgebungen.
BentoML: BentoML ist ein Python-erstes Tool für die Bereitstellung und Wartung von Machine-Learning-Modellen in der Produktion. Es unterstützt parallele Inferenz, adaptive Batch-Verarbeitung und Hardware-Beschleunigung, was eine effiziente und skalierbare Modell-Bereitstellung ermöglicht.
TensorBoard: Von dem TensorFlow-Team entwickelt, ist TensorBoard ein Open-Source-Visualisierungstool für Machine-Learning-Experimente. Es ermöglicht Benutzern, Metriken zu verfolgen, Modell-Graphen zu visualisieren, Embeddings zu projizieren und Experiment-Ergebnisse zu teilen.
Evidently: Evidently AI ist eine Open-Source-Python-Bibliothek für die Überwachung von Machine-Learning-Modellen während der Entwicklung, Validierung und in der Produktion. Es überprüft Daten- und Modellqualität, Daten-Drift, Ziel-Drift und Regressions- und Klassifizierungsleistung.
Amazon SageMaker: Amazon Web Services SageMaker ist eine umfassende MLOps-Lösung, die Modell-Training, Experiment-Verfolgung, Modell-Bereitstellung, Überwachung und mehr abdeckt. Es bietet eine kollaborative Umgebung für, die Automatisierung von ML-Workflows und die kontinuierliche Überwachung von Modellen in der Produktion ermöglicht.

Was ist Weights & Biases?

Weights & Biases (W&B) ist eine beliebte Plattform für die Verfolgung und Visualisierung von Machine-Learning-Experimenten, die es Datenwissenschaftlern und ML-Praktikern ermöglicht, ihre Modelle mit Leichtigkeit zu verwalten und zu analysieren. Es bietet eine Reihe von Tools, die jeden Schritt des ML-Workflows unterstützen, von der Projekteinrichtung bis zur Modell-Bereitstellung.

Schlüsselfunktionen von Weights & Biases

Experiment-Verfolgung und -Protokollierung: W&B ermöglicht es Benutzern, Experimente zu protokollieren und zu verfolgen, wobei es wesentliche Informationen wie Hyperparameter, Modell-Architektur und Datensatz-Details erfasst. Durch die Protokollierung dieser Parameter können Benutzer Experimente leicht reproduzieren und Ergebnisse vergleichen, was die Zusammenarbeit zwischen Team-Mitgliedern erleichtert.

import wandb

# Initialize W&amp;B
wandb.init(project="my-project", entity="my-team")

# Log Hyperparameter
config = wandb.config
config.learning_rate = 0.001
config.batch_size = 32

# Log Metriken während des Trainings
wandb.log({"loss": 0.5, "accuracy": 0.92})

Visualisierungen und Dashboards: W&B bietet ein interaktives Dashboard, um Experiment-Ergebnisse zu visualisieren, was es leicht macht, Trends zu analysieren, Modelle zu vergleichen und Bereiche für Verbesserungen zu identifizieren. Diese Visualisierungen umfassen anpassbare Charts, Konfusionsmatrizen und Histogramme. Das Dashboard kann mit Kollaborateuren geteilt werden, was eine effektive Kommunikation und Wissensaustausch ermöglicht.

# Log Konfusionsmatrix
wandb.log({"confusion_matrix": wandb.plot.confusion_matrix(predictions, labels)})

# Log ein benutzerdefiniertes Diagramm
wandb.log({"chart": wandb.plot.line_series(x=[1, 2, 3], y=[[1, 2, 3], [4, 5, 6]])})

Modell-Versionierung und -Vergleich: Mit W&B können Benutzer leicht verschiedene Versionen ihrer Modelle verfolgen und vergleichen. Diese Funktion ist besonders wertvoll, wenn mit verschiedenen Architekturen, Hyperparametern oder Vorbereitungstechniken experimentiert wird. Durch die Aufrechterhaltung einer Modell-Historie können Benutzer die beste ausführende Konfiguration identifizieren und datengetriebene Entscheidungen treffen.

# Speichern Sie Modell-Artefakt
wandb.save("model.h5")

# Loggen Sie mehrere Versionen eines Modells
with wandb.init(project="my-project", entity="my-team"):
# Trainieren und loggen Sie Modellversion 1
wandb.log({"accuracy": 0.85})

with wandb.init(project="my-project", entity="my-team"):
# Trainieren und loggen Sie Modellversion 2
wandb.log({"accuracy": 0.92})

Integration mit beliebten ML-Frameworks: W&B integriert sich nahtlos mit beliebten ML-Frameworks wie TensorFlow, PyTorch und scikit-learn. Es bietet leichte Integrationen, die minimale Code-Modifikationen erfordern, sodass Benutzer die Funktionen von W&B nutzen können, ohne ihre bestehenden Workflows zu stören.

import wandb
import tensorflow as tf

# Initialisieren Sie W&amp;B und loggen Sie Metriken während des Trainings
wandb.init(project="my-project", entity="my-team")
wandb.tensorflow.log(tf.summary.scalar('loss', loss))

Was ist Comet?

Comet ist eine Cloud-basierte Machine-Learning-Plattform, auf der Entwickler Experimente verfolgen, vergleichen, analysieren und optimieren können. Es ist darauf ausgelegt, schnell zu installieren und einfach zu bedienen, sodass Benutzer mit nur wenigen Codezeilen ihre ML-Experimente verfolgen können, ohne auf eine bestimmte Bibliothek angewiesen zu sein.

Schlüsselfunktionen von Comet

Benutzerdefinierte Visualisierungen: Comet ermöglicht es Benutzern, benutzerdefinierte Visualisierungen für ihre Experimente und Daten zu erstellen. Darüber hinaus können Benutzer Community-provided Visualisierungen auf Panels nutzen, um ihre Fähigkeit zur Analyse und Interpretation von Ergebnissen zu verbessern.
Echtzeit-Überwachung: Comet bietet Echtzeit-Statistiken und -Graphen über laufende Experimente, sodass Benutzer den Fortschritt und die Leistung ihrer Modelle während des Trainings überwachen können.
Experiment-Vergleich: Mit Comet können Benutzer ihre Experimente leicht vergleichen, einschließlich Code, Metriken, Vorhersagen, Erkenntnissen und mehr. Diese Funktion erleichtert die Identifizierung der beste ausführenden Modelle und Konfigurationen.
Fehlerbehebung und -Verfolgung: Comet ermöglicht es Benutzern, Modellfehler, Umgebungs-spezifische Fehler und andere Probleme, die während des Trainings- und Evaluierungsprozesses auftreten können, zu debuggen.
Modell-Überwachung: Comet ermöglicht es Benutzern, ihre Modelle zu überwachen und Benachrichtigungen zu erhalten, wenn Probleme oder Fehler auftreten, um eine rechtzeitige Intervention und Abmilderung zu ermöglichen.
Zusammenarbeit: Comet unterstützt die Zusammenarbeit innerhalb von Teams und mit Geschäftspartnern, um einen nahtlosen Wissensaustausch und eine effektive Kommunikation zu ermöglichen.
Framework-Integration: Comet kann leicht mit beliebten ML-Frameworks wie TensorFlow, PyTorch und anderen integriert werden, was es zu einem vielseitigen Tool für verschiedene Projekte und Anwendungsfälle macht.

Auswahl des richtigen MLOps-Tools

Bei der Auswahl eines MLOps-Tools für Ihr Projekt sollten Sie Faktoren wie die Vertrautheit Ihres Teams mit bestimmten Frameworks, die Projektanforderungen, die Komplexität des Modells (oder der Modelle) und die Bereitstellungs-Umgebung berücksichtigen. Einige Tools sind möglicherweise besser für bestimmte Anwendungsfälle oder integrieren sich nahtloser in Ihre bestehende Infrastruktur.

Darüber hinaus ist es wichtig, die Dokumentation des Tools, die Community-Unterstützung und die Leichtigkeit der Einrichtung und Integration zu bewerten. Ein gut dokumentiertes Tool mit einer aktiven Community kann den Lernprozess erheblich beschleunigen und die Fehlersuche erleichtern.

Best Practices für effektives MLOps

Um den maximalen Nutzen aus MLOps-Tools und -Praktiken zu ziehen und eine erfolgreiche Modell-Bereitstellung und -Wartung zu gewährleisten, ist es entscheidend, bestimmte Richtlinien zu befolgen. Hier sind einige wichtige Überlegungen:

Konsistente Protokollierung: Stellen Sie sicher, dass alle relevanten Hyperparameter, Metriken und Artefakte konsistent über Experimente hinweg protokolliert werden. Dies fördert die Reproduzierbarkeit und erleichtert den Vergleich zwischen verschiedenen Durchläufen.
Zusammenarbeit und Teilen: Nutzen Sie die Zusammenarbeitsfunktionen von MLOps-Tools, um Experimente, Visualisierungen und Erkenntnisse mit Team-Mitgliedern zu teilen. Dies fördert den Wissensaustausch und verbessert die Gesamtergebnisse des Projekts.
Dokumentation und Notizen: Führen Sie umfassende Dokumentationen und Notizen innerhalb des MLOps-Tools, um Experiment-Details, Beobachtungen und Erkenntnisse zu erfassen. Dies hilft beim Verständnis vergangener Experimente und erleichtert zukünftige Iterationen.
Kontinuierliche Integration und Bereitstellung (CI/CD): Implementieren Sie CI/CD-Pipelines für Ihre Machine-Learning-Modelle, um automatisiertes Testen, Bereitstellen und Überwachen zu gewährleisten. Dies strukturiert den Bereitstellungsprozess und reduziert das Risiko von Fehlern.

Code-Beispiele und Anwendungsfälle

Um die praktische Anwendung von MLOps-Tools besser zu verstehen, betrachten wir einige Code-Beispiele und Anwendungsfälle.

Experiment-Verfolgung mit Weights & Biases

Weights & Biases bietet eine nahtlose Integration mit beliebten Machine-Learning-Frameworks wie PyTorch und TensorFlow. Hier ist ein Beispiel, wie Sie Metriken loggen und während des Modell-Trainings mit PyTorch visualisieren können:

import wandb
import torch
import torchvision

# Initialisieren Sie W&amp;B
wandb.init(project="image-classification", entity="my-team")

# Laden Sie Daten und Modell
train_loader = torch.utils.data.DataLoader(...)
model = torchvision.models.resnet18(pretrained=True)

# Einrichten des Trainings-Loops
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
criterion = torch.nn.CrossEntropyLoss()

for epoch in range(10):
for inputs, labels in train_loader:
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()

# Loggen Sie Metriken
wandb.log({"loss": loss.item()})

# Speichern Sie das Modell
torch.save(model.state_dict(), "model.pth")
wandb.save("model.pth")

In diesem Beispiel initialisieren wir einen W&B-Lauf, trainieren ein ResNet-18-Modell auf einer Bildklassifizierungsaufgabe und loggen den Trainings-Verlust bei jedem Schritt. Wir speichern auch das trainierte Modell als Artefakt mit wandb.save(). W&B verfolgt automatisch System-Metriken wie GPU-Auslastung, und wir können den Trainings-Fortschritt, Verlust-Kurven und System-Metriken im W&B-Dashboard visualisieren.

Modell-Überwachung mit Evidently

Evidently ist ein leistungsstarkes Tool für die Überwachung von Machine-Learning-Modellen in der Produktion. Hier ist ein Beispiel, wie Sie es verwenden können, um Daten-Drift und Modell-Leistung zu überwachen:

import evidently
import pandas as pd
from evidently.model_monitoring import ModelMonitor
from evidently.model_monitoring.monitors import DataDriftMonitor, PerformanceMonitor

# Laden Sie Referenz-Daten
ref_data = pd.read_csv("reference_data.csv")

# Laden Sie Produktions-Daten
prod_data = pd.read_csv("production_data.csv")

# Laden Sie das Modell
model = load_model("model.pkl")

# Erstellen Sie Daten- und Leistungs-Überwachung
data_monitor = DataDriftMonitor(ref_data)
perf_monitor = PerformanceMonitor(ref_data, model)

# Überwachen Sie Daten und Leistung
model_monitor = ModelMonitor(data_monitor, perf_monitor)
model_monitor.run(prod_data)

# Generieren Sie ein HTML-Bericht
model_monitor.report.save_html("model_monitoring_report.html")

In diesem Beispiel laden wir Referenz- und Produktions-Daten sowie ein trainiertes Modell. Wir erstellen Instanzen von DataDriftMonitor und PerformanceMonitor, um Daten-Drift und Modell-Leistung zu überwachen. Dann führen wir diese Überwachungen auf den Produktions-Daten mit ModelMonitor aus und generieren einen HTML-Bericht mit den Ergebnissen.

Bereitstellung mit BentoML

BentoML vereinfacht den Prozess der Bereitstellung und Wartung von Machine-Learning-Modellen. Hier ist ein Beispiel, wie Sie es verwenden können, um ein scikit-learn-Modell mit BentoML zu paketieren und bereitzustellen:

import bentoml
from bentoml.io import NumpyNdarray
from sklearn.linear_model import LogisticRegression

# Trainieren Sie das Modell
clf = LogisticRegression()
clf.fit(X_train, y_train)

# Definieren Sie den BentoML-Dienst
class LogisticRegressionService(bentoml.BentoService):
@bentoml.api(input=NumpyNdarray(), batch=True)
def predict(self, input_data):
return self.artifacts.clf.predict(input_data)

@bentoml.artifacts([LogisticRegression.artifacts])
def pack(self, artifacts):
artifacts.clf = clf

# Paketieren und speichern Sie das Modell
svc = bentoml.Service("logistic_regression", runners=[LogisticRegressionService()])
svc.pack().save()

# Bereitstellen Sie das Modell
svc = LogisticRegressionService.load()
svc.start()

In diesem Beispiel trainieren wir ein scikit-learn-LogisticRegression-Modell und definieren einen BentoML-Dienst, um Vorhersagen zu servieren. Dann paketieren wir das Modell und seine Artefakte mit bentoml.Service und speichern es auf der Festplatte. Schließlich laden wir das gespeicherte Modell und starten den BentoML-Dienst, um es für die Vorhersage bereitzustellen.

Fazit

Im sich schnell entwickelnden Bereich des Machine Learning spielen MLOps-Tools eine entscheidende Rolle bei der Strukturierung des gesamten Lebenszyklus von Machine-Learning-Projekten, von der Experimentierung und Entwicklung bis zur Bereitstellung und Überwachung. Tools wie Weights & Biases, Comet, MLflow, Kubeflow, BentoML und Evidently bieten eine Reihe von Funktionen und Fähigkeiten, um verschiedene Aspekte des MLOps-Workflows zu unterstützen.

Durch die Nutzung dieser Tools können die Zusammenarbeit, Reproduzierbarkeit und Effizienz verbessern, während sie gleichzeitig die Bereitstellung zuverlässiger und leistungsfähiger Machine-Learning-Modelle in Produktionsumgebungen gewährleisten. Da die Verbreitung von Machine Learning in verschiedenen Branchen weiter wächst, wird die Bedeutung von MLOps-Tools und -Praktiken nur noch zunehmen, um Innovationen voranzutreiben und es Organisationen zu ermöglichen, das volle Potenzial von künstlicher Intelligenz und Machine-Learning-Technologien zu nutzen.

Aayush Mittal

Ich habe die letzten fünf Jahre damit verbracht, mich in die faszinierende Welt des Machine Learning und Deep Learning zu vertiefen. Meine Leidenschaft und mein Fachwissen haben mich dazu geführt, an über 50 verschiedenen Software-Entwicklungsprojekten mitzuwirken, mit einem besonderen Fokus auf KI/ML. Meine anhaltende Neugier hat mich auch zum Natural Language Processing hingezogen, ein Feld, das ich weiter erforschen möchte.

Unite.AI