Connect with us

Kecerdasan buatan

Dayakan Upaya ML dan AI Anda dengan Transformasi Data – Pemimpin Pemikiran

mm

Semakin besar variasi, kecepatan, dan volume data yang kita miliki, maka semakin memungkinkan untuk menggunakan analitik prediktif dan pemodelan untuk memprediksi pertumbuhan dan mengidentifikasi area peluang dan perbaikan. Namun, untuk mendapatkan nilai terbesar dari pelaporan, mesin pembelajaran (ML), dan alat kecerdasan buatan (AI) memerlukan organisasi untuk mengakses data dari banyak sumber dan memastikan bahwa data tersebut berkualitas tinggi dan dapat dipercaya. Ini sering menjadi hambatan terbesar untuk mengubah big data menjadi strategi bisnis.

Profesional data menghabiskan banyak waktu untuk mengumpulkan dan memvalidasi data untuk mempersiapkannya untuk digunakan sehingga mereka memiliki sedikit waktu untuk fokus pada tujuan utama mereka: menganalisis data dan menghasilkan nilai bisnis dari itu. Tidak mengherankan, 76 persen ilmuwan data mengatakan bahwa persiapan data adalah bagian yang paling tidak menyenangkan dari pekerjaan mereka. Selain itu, upaya persiapan data saat ini seperti data wrangling dan ETL tradisional memerlukan upaya manual dari profesional IT dan tidak cukup untuk menangani skala dan kompleksitas big data.

Perusahaan yang ingin memanfaatkan kekuatan AI perlu meninggalkan proses yang membosankan dan sebagian besar manual yang meningkatkan risiko “sampah masuk, sampah keluar” hasil. Sebaliknya, mereka memerlukan proses transformasi data yang mengekstrak data mentah dari beberapa sumber dan format, menggabungkan dan menormalkannya, dan menambahkan nilai dengan logika bisnis dan metrik untuk membuatnya siap untuk analitik. Dengan transformasi data yang kompleks, mereka dapat yakin bahwa model AI/ML didasarkan pada data yang bersih dan akurat yang menghasilkan hasil yang dapat dipercaya.

Memanfaatkan Kekuatan Cloud dengan ELT

Tempat terbaik untuk mempersiapkan dan mengubah data saat ini adalah gudang data cloud (CDW) seperti Amazon Redshift, Google BigQuery, Microsoft Azure Synapse, atau Snowflake. Sementara pendekatan tradisional untuk penggudangan data memerlukan data untuk diekstrak dan diubah sebelum dapat dimuat, CDW memanfaatkan skalabilitas dan kinerja cloud untuk penggunaan data yang lebih cepat dan transformasi dan memungkinkan untuk mengekstrak dan memuat data dari banyak sumber data yang berbeda sebelum mengubahnya di dalam CDW.

Idealnya, model ELT awalnya memindahkan data ke bagian CDW yang dicadangkan untuk data tahap mentah. Dari sana, CDW dapat menggunakan sumber daya komputasi yang hampir tidak terbatas yang tersedia untuk pekerjaan integrasi data dan ETL yang membersihkan, mengagregat, menyaring, dan menggabungkan data yang ditahap. Data kemudian dapat diubah menjadi skema yang berbeda – data vault atau Star Schema, misalnya, mengoptimalkan data untuk pelaporan dan analitik

Pendekatan ELT juga memungkinkan Anda untuk mereplikasi data mentah di dalam CDW untuk persiapan dan transformasi nanti ketika dan jika diperlukan. Ini memungkinkan Anda untuk menggunakan alat intelijen bisnis yang menentukan skema pada saat membaca dan menghasilkan transformasi khusus sesuai permintaan, secara efektif memungkinkan Anda untuk mengubah data yang sama dengan beberapa cara ketika Anda menemukan penggunaan baru untuk itu.

Mengakselerasi Model Pembelajaran Mesin

Contoh dunia nyata ini menunjukkan bagaimana dua perusahaan di industri yang berbeda menggunakan transformasi data dalam CDW untuk mengarahkan inisiatif AI.

Sebuah biro iklan dan periklanan boutique membangun platform manajemen pelanggan proprietary untuk membantu klien mereka lebih baik mengidentifikasi, memahami, dan memotivasi pelanggan mereka. Dengan mengubah data di dalam CDW, platform tersebut dengan cepat dan mudah mengintegrasikan data pelanggan waktu nyata di seluruh saluran ke dalam tampilan pelanggan 360 derajat yang menginformasikan model AI/ML platform untuk membuat interaksi pelanggan lebih konsisten, tepat waktu, dan dipersonalisasi.

Sebuah perusahaan logistik global yang melakukan 100 juta pengiriman ke 37 juta pelanggan unik di 72 negara memerlukan sejumlah besar data untuk daya operasional sehari-harinya. Mengadopsi transformasi data di dalam CDW memungkinkan perusahaan untuk mengirimkan 200 model pembelajaran mesin dalam satu tahun. Model-model ini membuat 500.000 prediksi setiap hari, secara signifikan meningkatkan efisiensi dan mengarahkan layanan pelanggan yang unggul yang telah mengurangi panggilan ke pusat panggilan masuk sebesar 40 persen.

Praktik Terbaik untuk Memulai

Perusahaan yang ingin mendukung inisiatif AI/ML mereka dengan kekuatan transformasi data di cloud perlu memahami kasus penggunaan dan kebutuhan spesifik mereka. Memulai dengan apa yang ingin Anda lakukan dengan data Anda – mengurangi biaya bahan bakar dengan mengoptimalkan rute pengiriman, meningkatkan penjualan dengan mengirimkan penawaran terbaik berikutnya kepada agen layanan pelanggan secara waktu nyata, dll. – memungkinkan Anda untuk merancang ulang proses Anda sehingga Anda dapat mengidentifikasi data mana yang akan menghasilkan hasil yang relevan.

Setelah Anda menentukan data apa yang dibutuhkan proyek AI/ML Anda untuk membangun modelnya, Anda memerlukan solusi ELT cloud-asli yang akan membuat data Anda siap untuk digunakan. Cari solusi yang:

  • Bebas vendor dan dapat bekerja dengan tumpukan teknologi saat ini

  • Cukup fleksibel untuk meningkatkan dan menurun dan beradaptasi ketika tumpukan teknologi Anda berubah

  • Dapat menangani transformasi data yang kompleks dari beberapa sumber data

  • Menawarkan model harga berbayar sesuai dengan yang Anda gunakan

  • Dibuat khusus untuk CDW yang dipilih sehingga Anda dapat memanfaatkan sepenuhnya fitur CDW untuk menjalankan pekerjaan lebih cepat dan mengubah data dengan lancar.

Solusi transformasi data cloud yang memenuhi denominasi umum dari semua CDW mungkin menyediakan pengalaman yang konsisten, tetapi hanya yang memungkinkan fitur pembeda yang kuat dari CDW yang dipilih dapat menghasilkan kinerja tinggi yang mempercepat waktu untuk wawasan. Solusi yang tepat akan memungkinkan Anda untuk memberdayakan proyek AI/ML Anda dengan data yang lebih bersih, dapat dipercaya dari lebih banyak sumber dalam waktu yang lebih singkat – dan menghasilkan hasil yang lebih cepat, lebih dapat diandalkan yang mengarahkan nilai bisnis dan inovasi yang belum pernah terjadi sebelumnya.

David Langton adalah seorang profesional perangkat lunak berpengalaman dengan lebih dari 20 tahun pengalaman dalam menciptakan teknologi dan produk yang memenangkan penghargaan. David saat ini menjabat sebagai VP of Product di Matillion, sebuah penyedia solusi transformasi data. Sebelum bergabung dengan Matillion, ia bekerja sebagai manajer gudang data dan kontraktor di industri keuangan.