Connect with us

Ingo Mierswa, Fondator și Președinte la RapidMiner, Inc – Seria de Interviuri

Inteligență artificială

Ingo Mierswa, Fondator și Președinte la RapidMiner, Inc – Seria de Interviuri

mm

Ingo Mierswa este Fondator și Președinte la RapidMiner, Inc. RapidMiner aduce inteligența artificială în cadrul companiilor prin intermediul unei platforme de știință a datelor deschise și extensibile. Proiectată pentru echipele de analize, RapidMiner unifică întregul ciclu de viață al științei datelor, de la pregătirea datelor la învățarea automată și până la implementarea modelului predictiv. Mai mult de 625.000 de profesioniști în analize utilizează produsele RapidMiner pentru a genera venituri, a reduce costurile și a evita riscurile.

Ce v-a inspirat să lansați RapidMiner?

Am lucrat în domeniul consultanței de știință a datelor timp de mulți ani și am văzut nevoia unei platforme care să fie mai intuitivă și mai accesibilă pentru oamenii fără o educație formală în știința datelor. Multe dintre soluțiile existente la acea vreme se bazau pe codare și scripting și pur și simplu nu erau prietenoase cu utilizatorul. Mai mult, acestea făceau ca datele să fie dificil de gestionat și de întreținut soluțiile dezvoltate în cadrul acestor platforme. În esență, am realizat că aceste proiecte nu trebuiau să fie atât de dificile, așa că am început să creăm platforma RapidMiner pentru a permite oricui să devină un mare om de știință a datelor.

Puteți discuta despre guvernanța transparentă pe care o utilizează RapidMiner?

Când nu puteți explica un model, este destul de greu să îl reglați, să îl încredințați și să îl traduceți. O mare parte a muncii de știință a datelor constă în comunicarea rezultatelor către alții, astfel încât stakeholderii să poată înțelege cum să îmbunătățească procesele. Acest lucru necesită încredere și o înțelegere profundă. De asemenea, problemele de încredere și de traducere pot face foarte greu să se depășească cerințele corporative pentru a pune un model în producție. Ne luptăm cu această bătălie în mai multe moduri:

Ca o platformă de știință a datelor vizuală, RapidMiner explică în mod intrinsic o explicație pentru toate conductele de date și modelele într-un format foarte consumabil care poate fi înțeles de oamenii de știință a datelor sau de non-oameni de știință a datelor. Acesta face modelele transparente și ajută utilizatorii să înțeleagă comportamentul modelului și să evalueze punctele sale forte și slabe și să detecteze potențialele prejudecăți.

În plus, toate modelele create în platformă vin cu extinse visualizări pentru utilizator – de obicei utilizatorul care creează modelul – pentru a obține insight-uri despre model, pentru a înțelege comportamentul modelului și pentru a evalua prejudecățile modelului.

RapidMiner oferă, de asemenea, explicații ale modelului – chiar și atunci când este în producție: pentru fiecare predicție creată de un model, RapidMiner generează și adaugă factorii de influență care au condus la sau au influențat deciziile luate de acel model în producție.

În cele din urmă – și acest lucru este foarte important pentru mine personal, deoarece am condus acest proces cu echipele noastre de ingineri în urmă cu câțiva ani – RapidMiner oferă, de asemenea, o capacitate extrem de puternică de simulare a modelului, care permite utilizatorilor să simuleze și să observe comportamentul modelului pe baza datelor de intrare furnizate de utilizator. Datele de intrare pot fi setate și modificate foarte ușor, permițând utilizatorului să înțeleagă comportamentul predictiv al modelului în diferite cazuri ipotetice sau din lumea reală. Simulatorul afișează, de asemenea, factorii care influențează decizia modelului. Utilizatorul – în acest caz, chiar și un utilizator de business sau un expert în domeniu – poate înțelege comportamentul modelului, poate valida decizia modelului împotriva rezultatelor reale sau a cunoștințelor din domeniu și poate identifica problemele. Simulatorul ne permite să simulăm lumea reală și să aruncăm o privire în viitor – în viitorul nostru, de fapt.

Cum utilizează RapidMiner învățarea profundă?

Utilizarea învățării profunde de către RapidMiner este ceva de care suntem foarte mândri. Învățarea profundă poate fi foarte dificilă de aplicat, iar non-oamenii de știință a datelor se luptă adesea cu setarea rețelelor fără suportul expert. RapidMiner face acest proces cât mai simplu posibil pentru toți utilizatorii. Învățarea profundă este, de exemplu, parte a produsului nostru de mașină de învățare automată (ML) numit RapidMiner Go. Aici, utilizatorul nu are nevoie să știe nimic despre învățarea profundă pentru a utiliza aceste tipuri de modele sofisticate. În plus, utilizatorii puternici pot merge mai departe și pot utiliza biblioteci populare de învățare profundă, cum ar fi Tensorflow, Keras sau DeepLearning4J, direct din fluxurile de lucru vizuale pe care le construiesc cu RapidMiner. Acest lucru este ca și cum ai juca cu blocuri și simplifică experiența pentru utilizatorii cu mai puține abilități de știință a datelor. Prin această abordare, utilizatorii noștri pot construi arhitecturi de rețele flexibile cu funcții de activare diferite și un număr definit de straturi și noduri, multiple straturi cu numere diferite de noduri și pot alege dintre diferite tehnici de antrenament.

Care este alt tip de învățare automată utilizat?

Toate! Oferta noastră include sute de algoritmi de învățare diferiți ca parte a platformei RapidMiner – tot ceea ce se poate aplica în limbajele de programare de știință a datelor Python și R. Printre altele, RapidMiner oferă metode pentru Naive Bayes, regresie, cum ar fi modelele liniare generalizate, clustering, cum ar fi k-Means, FP-Growth, Decision Trees, Random Forests, Parallelized Deep Learning și Gradient Boosted Trees. Acestea și multe altele sunt parte a bibliotecii de modelare a RapidMiner și pot fi utilizate cu un singur clic.

Puteți discuta cum știe modelul Auto să utilizeze valorile optime?

RapidMiner AutoModel utilizează automatizarea inteligentă pentru a accelera tot ceea ce fac utilizatorii și pentru a asigura modele precise și solide. Acest lucru include selectarea instanțelor și eliminarea automată a valorilor anormale, ingineria caracteristicilor pentru tipuri de date complexe, cum ar fi datele sau textele, și ingineria caracteristicilor automate multi-obiectiv pentru a selecta caracteristicile optime și a construi altele. Auto Model include, de asemenea, alte metode de curățare a datelor pentru a remedia problemele comune ale datelor, cum ar fi valorile lipsă, normalizarea datelor și diverse alte transformări.

Auto Model extrage, de asemenea, metadate de calitate a datelor – de exemplu, cât de mult se comportă o coloană ca un ID sau dacă există multe valori lipsă. Aceste metadate sunt utilizate, împreună cu metadatele de bază, pentru a automatiza și a asista utilizatorii în “utilizarea valorilor optime” și în gestionarea problemelor de calitate a datelor.

Pentru mai multe detalii, am cartat totul în Blueprint-ul nostru Auto Model. (Imaginea de mai jos pentru context suplimentar)

Există patru faze de bază în care se aplică automatizarea:

– Pregătirea datelor: Analiza automată a datelor pentru a identifica problemele comune de calitate, cum ar fi corelațiile, valorile lipsă și stabilitatea.
– Selectarea și optimizarea automată a modelului, inclusiv validarea și compararea performanței, care sugerează cele mai bune tehnici de învățare automată pentru datele date și determină parametrii optimi.
– Simularea modelului pentru a determina acțiunile specifice (prescriptive) care trebuie luate pentru a obține rezultatul dorit prevăzut de model.
– În faza de implementare și operare a modelului, utilizatorilor li se arată factori precum deriva, prejudecata și impactul comercial, automat și fără niciun efort suplimentar.

Prejudecata computerizată este o problemă cu orice tip de IA, există controale în loc pentru a preveni prejudecata de a pătrunde în rezultate?

Da, acest lucru este, într-adevăr, extrem de important pentru știința etică a datelor. Caracteristicile de guvernanță menționate anterior asigură că utilizatorii pot vedea întotdeauna exact ce date au fost utilizate pentru construirea modelului, cum au fost transformate și dacă există prejudecăți în selectarea datelor. În plus, caracteristicile noastre de detectare a derivației sunt un alt instrument puternic pentru a detecta prejudecățile. Dacă un model în producție prezintă o derivație semnificativă a datelor de intrare, acest lucru poate fi un semn că lumea s-a schimbat dramatic. Cu toate acestea, poate fi și un indicator că a existat o prejudecată severă în datele de antrenament. În viitor, luăm în considerare să mergem și mai departe și să construim modele de învățare automată care pot fi utilizate pentru a detecta prejudecăți în alte modele.

Puteți discuta despre RapidMiner AI Cloud și cum se diferențiază de produsele concurente?

Cerințele pentru un proiect de știință a datelor pot fi mari, complexe și intensiv computațional, ceea ce a făcut utilizarea tehnologiei cloud atât de atractivă pentru oamenii de știință a datelor. Din nefericire, diversele platforme native de știință a datelor bazate pe cloud leagă utilizatorii de serviciile și ofertele de stocare a datelor ale furnizorului de cloud respectiv.

RapidMiner AI Cloud este, pur și simplu, livrarea noastră de servicii cloud a platformei RapidMiner. Oferta poate fi personalizată pentru orice mediu al clientului, indiferent de strategia sa de cloud. Acest lucru este important în zilele noastre, deoarece abordarea majorității companiilor față de gestionarea datelor cloud evoluează foarte rapid în climatul actual. Flexibilitatea este ceea ce diferențiază RapidMiner AI Cloud. Acesta poate rula în orice serviciu de cloud, stivă de cloud privată sau într-o configurație hibridă. Suntem portabili pentru cloud, agnostici pentru cloud, multi-cloud – oricum doriți să îl numiți.

RapidMiner AI Cloud este, de asemenea, foarte puțin problematic, deoarece, desigur, oferim capacitatea de a gestiona toată sau o parte a implementării pentru clienți, astfel încât aceștia să se poată concentra pe rularea afacerii lor cu IA, și nu invers. Există chiar și o opțiune la cerere, care permite utilizatorilor să pornească un mediu după cum este nevoie pentru proiecte scurte.

RapidMiner Radoop elimină o parte din complexitatea din spatele științei datelor, puteți spune cum Radoop beneficiază dezvoltatorii?

Radoop este, în principal, pentru non-dezvoltatori care doresc să valorifice potențialul datelor mari. RapidMiner Radoop execută fluxurile de lucru RapidMiner direct în Hadoop într-un mod fără cod. Putem, de asemenea, încorpora motorul de execuție RapidMiner în Spark, astfel încât este ușor să introduceți fluxuri de lucru complete în Spark fără complexitatea care vine din abordările centrate pe cod.

Ar putea o entitate guvernamentală să utilizeze RapidMiner pentru a analiza date pentru a prevedea posibile pandemii, similar cu modul în care BlueDot funcționează?

Ca o platformă generală de știință a datelor și învățare automată, RapidMiner este menit să simplifice și să îmbunătățească procesul de creare și gestionare a modelului, indiferent de subiectul sau domeniul din centrul problemei de știință a datelor/învățare automată. Deși focusul nostru nu este pe prevederea pandemiilor, cu datele potrivite, un expert în domeniu (cum ar fi un virolog sau epidemiolog, în acest caz) ar putea utiliza platforma pentru a crea un model care ar putea prevedea cu acuratețe pandemii. De fapt, mulți cercetători utilizează RapidMiner – și platforma noastră este gratuită pentru scopuri academice.

Există altceva pe care ați dori să îl împărtășiți despre RapidMiner?

Încercați! Vă puteți surprinde cât de ușoară poate fi știința datelor și cât de mult poate îmbunătăți productivitatea dvs. și a echipei dvs. o platformă bună.

Mulțumim pentru acest interviu minunat, cititorilor care doresc să afle mai multe ar trebui să viziteze RapidMiner.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.