Connect with us

Kecerdasan buatan

Ingo Mierswa, Pendiri & Presiden di RapidMiner, Inc – Seri Wawancara

mm

Ingo Mierswa adalah Pendiri & Presiden di RapidMiner, Inc. RapidMiner membawa kecerdasan buatan ke perusahaan melalui platform ilmu data yang terbuka dan dapat diperluas. Dibangun untuk tim analitik, RapidMiner menyatukan seluruh siklus hidup ilmu data dari persiapan data hingga pembelajaran mesin hingga penerapan model prediktif. Lebih dari 625.000 profesional analitik menggunakan produk RapidMiner untuk menghasilkan pendapatan, mengurangi biaya, dan menghindari risiko.

Apa yang menjadi inspirasi Anda untuk meluncurkan RapidMiner?

Saya telah bekerja di bisnis konsultasi ilmu data selama banyak tahun dan saya melihat kebutuhan akan platform yang lebih intuitif dan dapat diakses oleh orang-orang tanpa pendidikan formal di ilmu data. Banyak solusi yang ada pada saat itu bergantung pada pengkodean dan scripting dan mereka tidaklah ramah pengguna. Selain itu, ini membuat data sulit untuk dikelola dan mempertahankan solusi yang dikembangkan dalam platform tersebut. Secara dasar, saya menyadari bahwa proyek-proyek ini tidak perlu begitu sulit, jadi kami mulai menciptakan platform RapidMiner untuk memungkinkan siapa saja menjadi ilmuwan data yang hebat.

Dapatkah Anda membahas tentang tata kelola transparansi penuh yang saat ini digunakan oleh RapidMiner?

Ketika Anda tidak dapat menjelaskan model, itu sangat sulit untuk menyetel, mempercayai, dan menerjemahkan. Banyak pekerjaan ilmu data adalah komunikasi hasil kepada orang lain sehingga pemangku kepentingan dapat memahami bagaimana meningkatkan proses. Ini memerlukan kepercayaan dan pemahaman yang mendalam. Juga, masalah kepercayaan dan terjemahan dapat membuat sangat sulit untuk mengatasi persyaratan perusahaan untuk mendapatkan model ke produksi. Kami sedang melawan pertempuran ini dengan beberapa cara:

Sebagai platform ilmu data visual, RapidMiner secara inheren memetakan penjelasan untuk semua pipa data dan model dalam format yang sangat dapat dikonsumsi yang dapat dipahami oleh ilmuwan data atau non-ilmuwan data. Ini membuat model transparan dan membantu pengguna memahami perilaku model dan mengevaluasi kekuatan dan kelemahan serta mendeteksi potensi bias.

Selain itu, semua model yang dibuat di platform datang dengan visualisasi ekstensif untuk pengguna – biasanya pengguna yang membuat model – untuk mendapatkan wawasan model, memahami perilaku model, dan mengevaluasi bias model.

RapidMiner juga menyediakan penjelasan model – bahkan ketika dalam produksi: Untuk setiap prediksi yang dibuat oleh model, RapidMiner menghasilkan dan menambahkan faktor-faktor yang mempengaruhi keputusan yang dibuat oleh model tersebut dalam produksi.

Akhirnya – dan ini sangat penting bagi saya secara pribadi karena saya mengemudi ini dengan tim teknik kami beberapa tahun yang lalu – RapidMiner juga menyediakan kemampuan simulator model yang sangat kuat, yang memungkinkan pengguna untuk mensimulasikan dan mengamati perilaku model berdasarkan data input yang disediakan oleh pengguna. Data input dapat diatur dan diubah dengan sangat mudah, memungkinkan pengguna untuk memahami perilaku prediktif model pada berbagai kasus hipotetis atau dunia nyata. Simulator juga menampilkan faktor-faktor yang mempengaruhi keputusan model. Pengguna – dalam hal ini bahkan pengguna bisnis atau ahli domain – dapat memahami perilaku model, memvalidasi keputusan model terhadap hasil nyata atau pengetahuan domain, dan mengidentifikasi masalah. Simulator memungkinkan Anda untuk mensimulasikan dunia nyata dan melihat ke masa depan – ke masa depan Anda, sebenarnya.

Bagaimana RapidMiner menggunakan pembelajaran dalam?

Penggunaan pembelajaran dalam oleh RapidMiner adalah sesuatu yang kami banggakan. Pembelajaran dalam dapat sangat sulit untuk diterapkan dan non-ilmuwan data sering bergelut dengan pengaturan jaringan tanpa dukungan ahli. RapidMiner membuat proses ini semudah mungkin bagi pengguna semua jenis. Pembelajaran dalam, misalnya, adalah bagian dari produk Auto machine learning (ML) kami yang disebut RapidMiner Go. Di sini pengguna tidak perlu tahu apa-apa tentang pembelajaran dalam untuk menggunakan model-model yang canggih tersebut. Selain itu, pengguna kuat dapat lebih dalam dan menggunakan perpustakaan pembelajaran dalam populer seperti Tensorflow, Keras, atau DeepLearning4J langsung dari alur kerja visual yang mereka bangun dengan RapidMiner. Ini seperti bermain dengan balok bangunan dan menyederhanakan pengalaman bagi pengguna dengan keterampilan ilmu data yang lebih sedikit. Melalui pendekatan ini, pengguna kami dapat membangun arsitektur jaringan yang fleksibel dengan fungsi aktivasi yang berbeda dan jumlah node yang ditentukan pengguna, beberapa lapisan dengan jumlah node yang berbeda, dan memilih dari berbagai teknik pelatihan.

Apa jenis pembelajaran mesin lain yang digunakan?

Semua! Kami menawarkan ratusan algoritma pembelajaran yang berbeda sebagai bagian dari platform RapidMiner – semua yang dapat diterapkan dalam bahasa pemrograman ilmu data yang umum digunakan Python dan R. Di antara lainnya, RapidMiner menawarkan metode untuk Naive Bayes, regresi seperti Model Linear Umum, clustering seperti k-Means, FP-Growth, Decision Trees, Random Forests, Parallelized Deep Learning, dan Gradient Boosted Trees. Ini dan banyak lagi adalah bagian dari perpustakaan pemodelan RapidMiner dan dapat digunakan dengan satu klik.

Dapatkah Anda membahas tentang bagaimana Auto Model mengetahui nilai optimal untuk digunakan?

RapidMiner AutoModel menggunakan otomatisasi cerdas untuk mempercepat semua yang dilakukan pengguna dan memastikan model yang akurat dan solid dibangun. Ini termasuk pemilihan instance dan penghapusan outlier otomatis, rekayasa fitur untuk jenis data kompleks seperti tanggal atau teks, dan rekayasa fitur otomatis multi-objek untuk memilih fitur optimal dan membangun yang baru. Auto Model juga termasuk metode pembersihan data lainnya untuk memperbaiki masalah umum dalam data seperti nilai yang hilang, profil data dengan menilai kualitas dan nilai kolom data, normalisasi data dan berbagai transformasi lainnya.

Auto Model juga mengekstrak metadata kualitas data – misalnya, seberapa banyak kolom berperilaku seperti ID atau apakah ada banyak nilai yang hilang. Metadata ini digunakan sebagai tambahan untuk metadata dasar dalam mengotomatisasi dan membantu pengguna dalam ‘menggunakan nilai optimal’ dan menangani masalah kualitas data.

Untuk detail lebih lanjut, kami telah memetakan semua ini dalam Blueprint Auto Model kami. (Gambar di bawah untuk konteks tambahan)

Ada empat fase dasar di mana otomatisasi diterapkan:

– Persiapan data: Analisis data otomatis untuk mengidentifikasi masalah kualitas umum seperti korelasi, nilai yang hilang, dan stabilitas.
– Pemilihan model dan optimasi otomatis, termasuk validasi penuh dan perbandingan kinerja, yang menyarankan teknik pembelajaran mesin terbaik untuk data yang diberikan dan menentukan parameter optimal.
– Simulasi model untuk membantu menentukan tindakan spesifik yang harus diambil untuk mencapai hasil yang diinginkan yang diprediksi oleh model.
– Dalam fase penerapan dan operasi model, pengguna ditunjukkan faktor-faktor seperti drift, bias, dan dampak bisnis, secara otomatis tanpa pekerjaan tambahan yang diperlukan.

Bias komputer adalah masalah dengan jenis AI apa pun, apakah ada kontrol yang ada untuk mencegah bias dari muncul dalam hasil?

Ya, ini sangat penting untuk ilmu data etis. Fitur tata kelola yang disebutkan sebelumnya memastikan bahwa pengguna dapat selalu melihat secara tepat apa data yang telah digunakan untuk membangun model, bagaimana data tersebut ditransformasikan, dan apakah ada bias dalam pemilihan data. Selain itu, fitur-fitur kami untuk deteksi drift adalah alat lain yang kuat untuk mendeteksi bias. Jika model dalam produksi menunjukkan banyak drift dalam data input, ini dapat menjadi tanda bahwa dunia telah berubah secara dramatis. Namun, ini juga dapat menjadi indikator bahwa ada bias parah dalam data pelatihan. Di masa depan, kami mempertimbangkan untuk melangkah lebih jauh dan membangun model pembelajaran mesin yang dapat digunakan untuk mendeteksi bias dalam model lain.

Dapatkah Anda membahas tentang RapidMiner AI Cloud dan bagaimana ia membedakan diri dari produk kompetitor?

Persyaratan untuk proyek ilmu data dapat besar, kompleks, dan intensif komputasi, yang membuat penggunaan teknologi cloud menjadi strategi yang menarik bagi ilmuwan data. Sayangnya, berbagai platform ilmu data cloud asli mengikat Anda ke layanan cloud dan penawaran penyimpanan data dari vendor cloud tertentu.

RapidMiner AI Cloud adalah layanan cloud kami yang menyajikan platform RapidMiner. Penawaran ini dapat disesuaikan dengan lingkungan pelanggan mana pun, terlepas dari strategi cloud mereka. Ini sangat penting saat ini karena sebagian besar bisnis mendekati manajemen data cloud dengan sangat cepat dalam iklim saat ini. Fleksibilitas benar-benar yang membedakan RapidMiner AI Cloud. Ini dapat berjalan di layanan cloud mana pun, tumpukan cloud pribadi, atau dalam setup hibrida. Kami adalah portabel cloud, agnostik cloud, multi-cloud – apa pun yang Anda sukai.

RapidMiner AI Cloud juga sangat rendah masalah, karena tentu saja, kami menawarkan kemampuan untuk mengelola semua atau sebagian dari penerapan untuk klien sehingga mereka dapat fokus menjalankan bisnis mereka dengan AI, bukan sebaliknya. Ada bahkan opsi on-demand, yang memungkinkan Anda memutar lingkungan sesuai kebutuhan untuk proyek singkat.

RapidMiner Radoop menghilangkan beberapa kompleksitas di balik ilmu data, dapatkah Anda menjelaskan bagaimana Radoop menguntungkan pengembang?

Radoop terutama untuk non-pengembang yang ingin memanfaatkan potensi big data. RapidMiner Radoop menjalankan alur kerja RapidMiner langsung di dalam Hadoop dengan cara tanpa kode. Kami juga dapat memasukkan mesin eksekusi RapidMiner ke dalam Spark sehingga mudah untuk mendorong alur kerja lengkap ke Spark tanpa kompleksitas yang datang dari pendekatan berbasis kode.

Apakah entitas pemerintah dapat menggunakan RapidMiner untuk menganalisis data untuk memprediksi wabah potensial, mirip dengan cara BlueDot beroperasi?

Sebagai platform ilmu data dan pembelajaran mesin umum, RapidMiner dimaksudkan untuk mempermudah dan meningkatkan proses pembuatan dan pengelolaan model, terlepas dari subjek atau domain apa yang ada di pusat masalah ilmu data/pembelajaran mesin. Meskipun fokus kami bukan pada memprediksi wabah, dengan data yang tepat, ahli subjek (seperti virolog atau ahli epidemiologi, dalam hal ini) dapat menggunakan platform untuk membuat model yang dapat memprediksi wabah dengan akurat. Bahkan, banyak peneliti menggunakan RapidMiner – dan platform kami gratis untuk tujuan akademis.

Apakah ada yang lain yang ingin Anda bagikan tentang RapidMiner?

Cobalah! Anda mungkin terkejut betapa mudahnya ilmu data dan seberapa banyak platform yang baik dapat meningkatkan produktivitas Anda dan tim Anda.

Terima kasih atas wawancara yang luar biasa ini, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi RapidMiner.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.