Künstliche Intelligenz
Ihre ML- und KI-Bemühungen mit DatenTransformation vorantreiben – Thought Leaders

Je größer die Vielfalt, Geschwindigkeit und Menge der Daten, die wir haben, desto leichter wird es, Predictive-Analytics und -Modelle zu verwenden, um Wachstum vorherzusagen und Bereiche für Verbesserungen zu identifizieren. Allerdings erfordert es, um den größten Nutzen aus Berichterstattung, Machine-Learning- (ML-) und KI-Tools zu ziehen, dass ein Unternehmen auf Daten aus vielen Quellen zugreift und sicherstellt, dass diese Daten von hoher Qualität und vertrauenswürdig sind. Dies ist oft die größte Hürde, um Big Data in eine Geschäftsstrategie umzuwandeln.
Datenexperten verbringen so viel Zeit damit, Daten zu sammeln und zu validieren, um sie für die Verwendung vorzubereiten, dass sie wenig Zeit haben, um sich auf ihren eigentlichen Zweck zu konzentrieren: die Analyse der Daten und die Ableitung von Geschäftswert daraus. Es ist nicht verwunderlich, dass 76 Prozent der Data-Scientist sagen, dass die Datenvorbereitung der unangenehmste Teil ihres Jobs ist. Darüber hinaus erfordern aktuelle Datenvorbereitungsanstrengungen wie Data-Wrangling und traditionelles ETL manuelle Anstrengungen von IT-Experten und sind nicht ausreichend, um mit dem Umfang und der Komplexität von Big Data umzugehen.
Unternehmen, die die Macht von KI nutzen möchten, müssen sich von diesen mühsamen und überwiegend manuellen Prozessen lösen, die das Risiko von “Müll rein, Müll raus”-Ergebnissen erhöhen. Stattdessen benötigen sie Daten-Transformation-Prozesse, die rohe Daten in mehreren Quellen und Formaten extrahieren, verbinden und normalisieren und mit Geschäftslogik und Metriken Wert hinzufügen, um sie für die Analyse bereit zu machen. Mit komplexer Daten-Transformation können sie sicherstellen, dass AI/ML-Modelle auf sauberen, genauen Daten basieren, die vertrauenswürdige Ergebnisse liefern.
Die Macht der Cloud mit ELT nutzen
Der beste Ort, um Daten heute vorzubereiten und zu transformieren, ist ein Cloud-Datenlager (CDW) wie Amazon Redshift, Google BigQuery, Microsoft Azure Synapse oder Snowflake. Während traditionelle Ansätze für Data-Warehousing erfordern, dass Daten extrahiert und transformiert werden, bevor sie geladen werden können, nutzt ein CDW die Skalierbarkeit und Leistung der Cloud für eine schnellere Datenaufnahme und -Transformation und ermöglicht es, Daten aus vielen verschiedenen Datenquellen zu extrahieren und zu laden, bevor sie im CDW transformiert werden.
Idealerweise bewegt das ELT-Modell die Daten zunächst in einen Abschnitt des CDW, der für rohe Staging-Daten reserviert ist. Von dort aus kann das CDW seine fast unbegrenzten Rechenressourcen für Datenintegration und ETL-Jobs nutzen, die die gestaffelten Daten reinigen, aggregieren, filtern und verbinden. Die Daten können dann in ein anderes Schema transformiert werden – beispielsweise ein Data-Vault- oder Star-Schema -, um die Daten für Berichterstattung und Analyse zu optimieren.
Der ELT-Ansatz ermöglicht es auch, rohe Daten innerhalb des CDW zu replizieren, um sie später vorzubereiten und zu transformieren, wenn und wie erforderlich. Dies ermöglicht es, Business-Intelligence-Tools zu verwenden, die das Schema beim Lesen bestimmen und spezifische Transformationen auf Abruf erzeugen, um effektiv die gleichen Daten auf verschiedene Weise zu transformieren, wenn Sie neue Verwendungszwecke dafür entdecken.
Machine-Learning-Modelle beschleunigen
Diese realen Beispiele zeigen, wie zwei Unternehmen in verschiedenen Branchen Daten-Transformation in einem CDW nutzen, um KI-Initiativen voranzutreiben.
Eine Boutique-Marketing- und Werbeagentur baute eine eigene Kundenmanagement-Plattform, um ihren Kunden zu helfen, ihre Kunden besser zu identifizieren, zu verstehen und zu motivieren. Durch die Transformation von Daten innerhalb eines CDW kann die Plattform Echtzeit-Kundendaten über Kanäle hinweg schnell und einfach in eine 360-Grad-Kundenansicht integrieren, die die AI/ML-Modelle der Plattform für eine konsistentere, zeitgerechtere und personalisierte Kundeninteraktion informiert.
Ein globales Logistikunternehmen, das 100 Millionen Lieferungen an 37 Millionen einzigartige Kunden in 72 Ländern durchführt, benötigt enorme Mengen an Daten, um seine täglichen Operationen zu betreiben. Die Einführung von Daten-Transformation innerhalb eines CDW ermöglichte es dem Unternehmen, 200 Machine-Learning-Modelle in nur einem Jahr zu deployen. Diese Modelle liefern 500.000 Vorhersagen pro Tag und verbessern die Effizienz erheblich und treiben einen besseren Kundenservice, der die Anrufe im Callcenter um 40 Prozent reduziert.
Best Practices für den Einstieg
Unternehmen, die ihre KI/ML-Initiativen mit der Macht der Daten-Transformation in der Cloud unterstützen möchten, müssen ihren spezifischen Anwendungsfall und ihre Bedürfnisse verstehen. Wenn Sie mit dem beginnen, was Sie mit Ihren Daten erreichen möchten – beispielsweise die Reduzierung der Treibstoffkosten durch die Optimierung von Lieferstrecken oder die Steigerung von Verkäufen durch die Lieferung von Next-Best-Offer an Kundenberater in Echtzeit -, können Sie Ihre Prozesse rückwärts konstruieren, um zu bestimmen, welche Daten relevante Ergebnisse liefern werden.
Sobald Sie bestimmt haben, welche Daten Ihr KI/ML-Projekt benötigt, um seine Modelle zu erstellen, benötigen Sie eine cloud-native ELT-Lösung, die Ihre Daten für die Verwendung bereit macht. Suchen Sie nach einer Lösung, die:
-
Herstellerunabhängig ist und mit Ihrem aktuellen Technologie-Stack funktioniert
-
Flexibel genug ist, um sich auf- und abzuskalieren und sich an Ihre sich ändernde Technologie zu anpassen
-
Komplexe Daten-Transformationen aus mehreren Datenquellen handhaben kann
-
Ein pay-as-you-go-Preismodell anbietet, bei dem Sie nur für das zahlen, was Sie nutzen
-
Speziell für Ihr bevorzugtes CDW entwickelt wurde, damit Sie die Funktionen des CDW voll nutzen können, um Jobs schneller auszuführen und Daten nahtlos zu transformieren.
Eine Cloud-Daten-Transformation-Lösung, die auf die gemeinsamen Nenner aller CDWs abgestimmt ist, kann ein konsistentes Erlebnis bieten, aber nur eine Lösung, die die leistungsstarken unterschiedlichen Funktionen Ihres gewählten CDW ermöglicht, kann die hohe Leistung liefern, die die Zeit bis zum Erkenntnisgewinn beschleunigt. Die richtige Lösung ermöglicht es Ihnen, Ihre KI/ML-Projekte mit mehr sauberen, vertrauenswürdigen Daten aus mehr Quellen in weniger Zeit zu betreiben – und generiert schnellere, zuverlässigere Ergebnisse, die bisher unerreichte Geschäftswerte und Innovationen vorantreiben.












