Vernetzen Sie sich mit uns

KĂĽnstliche Intelligenz

Stärken Sie Ihre ML- und KI-Bemühungen mit Datentransformation – Vordenkern

mm

Je größer die Vielfalt, Geschwindigkeit und Menge der Daten, über die wir verfügen, desto praktikabler wird es, prädiktive Analysen und Modelle zu nutzen, um Wachstum vorherzusagen und Bereiche mit Chancen und Verbesserungen zu identifizieren. Um den größtmöglichen Nutzen aus den Tools für Berichterstellung, maschinelles Lernen (ML) und künstliche Intelligenz (KI) zu ziehen, muss ein Unternehmen jedoch auf Daten aus vielen Quellen zugreifen und sicherstellen, dass die Daten von hoher Qualität und vertrauenswürdig sind. Dies ist oft das größte Hindernis bei der Umsetzung von Big Data in eine Geschäftsstrategie.

Datenexperten verbringen so viel Zeit damit, Daten zu sammeln und zu validieren, um sie für die Verwendung vorzubereiten, dass ihnen kaum noch Zeit bleibt, sich auf ihr Hauptziel zu konzentrieren: die Analyse der Daten und die Ableitung von Geschäftswert daraus. Es überrascht nicht, dass 76 Prozent der Datenwissenschaftler sagen, dass die Datenaufbereitung der Teil ihres Jobs ist, der ihnen am wenigsten Spaß macht. Darüber hinaus erfordern aktuelle Datenaufbereitungsbemühungen wie Data Wrangling und traditionelles ETL manuellen Aufwand von IT-Experten und reichen nicht aus, um den Umfang und die Komplexität von Big Data zu bewältigen.

Unternehmen, die die Leistungsfähigkeit der KI nutzen möchten, müssen sich von diesen langwierigen und größtenteils manuellen Prozessen lösen, die das Risiko von „Garbage-in-Garbage-out“-Ergebnissen erhöhen. Stattdessen benötigen sie Datentransformationsprozesse, die Rohdaten in mehreren Quellen und Formaten extrahieren, sie zusammenführen und normalisieren und mit Geschäftslogik und Metriken einen Mehrwert schaffen, um sie für die Analyse vorzubereiten. Durch die komplexe Datentransformation können sie sicher sein, dass KI/ML-Modelle auf sauberen, genauen Daten basieren, die vertrauenswürdige Ergebnisse liefern.

Nutzen Sie die Leistungsfähigkeit der Cloud mit ELT

Der beste Ort zum Aufbereiten und Transformieren von Daten ist heute ein Cloud Data Warehouse (CDW) wie Amazon Redshift, Google BigQuery, Microsoft Azure Synapse oder Snowflake. Während herkömmliche Data-Warehousing-Ansätze erfordern, dass Daten extrahiert und transformiert werden, bevor sie geladen werden können, nutzt ein CDW die Skalierbarkeit und Leistung der Cloud für eine schnellere Datenaufnahme und -transformation und ermöglicht das vorherige Extrahieren und Laden von Daten aus vielen unterschiedlichen Datenquellen es innerhalb der CDW umwandeln.

Im Idealfall verschiebt das ELT-Modell die Daten zunächst in einen Abschnitt des CDW, der für Staging-Rohdaten reserviert ist. Von dort aus kann das CDW seine nahezu unbegrenzten Rechenressourcen für die Datenintegration und ETL-Jobs nutzen, die die bereitgestellten Daten bereinigen, aggregieren, filtern und zusammenführen. Die Daten können dann in ein anderes Schema – beispielsweise einen Datentresor oder ein Star-Schema – umgewandelt werden, um die Daten für Berichte und Analysen zu optimieren

Der ELT-Ansatz ermöglicht Ihnen auch die Replikation von Rohdaten innerhalb des CDW zur späteren Vorbereitung und Transformation bei Bedarf. Auf diese Weise können Sie Business-Intelligence-Tools verwenden, die das Schema beim Lesen bestimmen und bei Bedarf spezifische Transformationen durchführen. So können Sie dieselben Daten effektiv auf verschiedene Arten transformieren, während Sie neue Verwendungsmöglichkeiten dafür entdecken.

Beschleunigung von Modellen fĂĽr maschinelles Lernen

Diese Beispiele aus der Praxis zeigen, wie zwei Unternehmen in unterschiedlichen Branchen die Datentransformation in einem CDW nutzen, um KI-Initiativen voranzutreiben.

Eine Boutique-Marketing- und Werbeagentur hat eine proprietäre Kundenmanagementplattform entwickelt, um ihren Kunden dabei zu helfen, ihre Kunden besser zu identifizieren, zu verstehen und zu motivieren. Durch die Transformation von Daten innerhalb eines CDW integriert die Plattform schnell und einfach Echtzeit-Kundendaten über alle Kanäle hinweg in eine 360-Grad-Kundenansicht, die die KI/ML-Modelle der Plattform informiert, um Kundeninteraktionen konsistenter, zeitnaher und personalisierter zu gestalten.

Ein globales Logistikunternehmen, das 100 Millionen Lieferungen an 37 Millionen einzelne Kunden in 72 Ländern durchführt, benötigt riesige Datenmengen, um seine täglichen Abläufe voranzutreiben. Durch die Einführung der Datentransformation innerhalb eines CDW konnte das Unternehmen in einem einzigen Jahr 200 Modelle für maschinelles Lernen bereitstellen. Diese Modelle erstellen täglich 500,000 Vorhersagen, was die Effizienz erheblich verbessert und einen erstklassigen Kundenservice ermöglicht, der zu einer Reduzierung eingehender Callcenter-Anrufe um 40 Prozent geführt hat.

Best Practices fĂĽr den Einstieg

Unternehmen, die ihre KI/ML-Initiativen mit der Kraft der Datentransformation in der Cloud unterstützen möchten, müssen ihren spezifischen Anwendungsfall und ihre Bedürfnisse verstehen. Beginnen Sie damit, was Sie mit Ihren Daten tun möchten – Kraftstoffkosten durch Optimierung der Lieferrouten senken, Umsatz steigern, indem Sie den Kundendienstmitarbeitern in Echtzeit die nächstbesten Angebote übermitteln usw. – und können Ihre Prozesse rückentwickeln, um herauszufinden, welche Daten liefern relevante Ergebnisse.

Sobald Sie festgestellt haben, welche Daten Ihr KI/ML-Projekt zum Erstellen seiner Modelle benötigt, benötigen Sie eine cloudnative ELT-Lösung, die Ihre Daten einsatzbereit macht. Suchen Sie nach einer Lösung, die:

  • Ist herstellerneutral und in der Lage, mit Ihrem aktuellen Technologie-Stack zu arbeiten

  • Ist flexibel genug, um nach oben und unten zu skalieren und sich anzupassen, wenn sich Ihr Technologie-Stack ändert

  • Kann komplexe Datentransformationen aus mehreren Datenquellen verarbeiten

  • Bietet ein Pay-as-you-go-Preismodell, bei dem Sie nur fĂĽr das bezahlen, was Sie nutzen

  • Wurde speziell fĂĽr Ihr bevorzugtes CDW entwickelt, sodass Sie die Funktionen dieses CDW voll nutzen können, um Aufträge schneller auszufĂĽhren und Daten nahtlos umzuwandeln.

Eine Cloud-Datentransformationslösung, die auf die gemeinsamen Nenner aller CDWs eingeht, bietet möglicherweise ein konsistentes Erlebnis, aber nur eine Lösung, die die leistungsstarken Differenzierungsfunktionen des von Ihnen gewählten CDW ermöglicht, kann die hohe Leistung liefern, die die Zeit bis zur Erkenntnis verkürzt. Mit der richtigen Lösung können Sie Ihre KI/ML-Projekte in kürzerer Zeit mit saubereren, vertrauenswürdigen Daten aus mehr Quellen betreiben – und schnellere, zuverlässigere Ergebnisse generieren, die bisher nicht realisierte Geschäftswerte und Innovationen vorantreiben.

David Langton ist ein erfahrener Softwareprofi mit über 20 Jahren Erfahrung in der Entwicklung preisgekrönter Technologien und Produkte. David fungiert derzeit als VP of Product bei Millionen, ein Anbieter von Datentransformationslösungen. Vor seiner Tätigkeit bei Matillion arbeitete er als Data Warehouse-Manager und Auftragnehmer in der Finanzbranche.