Stumm Ingo Mierswa, Grënner & President bei RapidMiner, Inc - Interview Series - Unite.AI
Connect mat eis

Interviewen

Ingo Mierswa, Grënner & President bei RapidMiner, Inc - Interview Series

mm
aktualiséiert on

Ingo Mierswa ass de Grënner a President bei RapidMiner, Inc. RapidMiner bréngt kënschtlech Intelligenz fir d'Entreprise duerch eng oppen an erweiterbar Datewëssenschaftsplattform. Gebaut fir Analyseteams, RapidMiner vereenegt de ganzen Datewëssenschaftsliewenszyklus vun Datenvirbereedung bis Maschinnléieren bis prévisibel sinn Modell Deployment. Méi wéi 625,000 analytesch Fachleit benotzen RapidMiner Produkter fir Einnahmen ze féieren, Käschten ze reduzéieren an Risiken ze vermeiden.

Wat war Är Inspiratioun hannert der Start vun RapidMiner?

Ech hat fir vill Joer am Datewëssenschaftsberodungsgeschäft geschafft an ech hunn e Bedierfnes fir eng Plattform gesinn déi méi intuitiv an accessibel ass fir Leit ouni eng formell Ausbildung an der Datewëssenschaft. Vill vun den existente Léisungen zu där Zäit hunn op Kodéierung a Skripting vertraut a si waren einfach net userfrëndlech. Ausserdeem huet et Daten schwéier gemaach d'Léisungen ze managen an z'erhalen, déi bannent dëse Plattformen entwéckelt goufen. Prinzipiell hunn ech gemierkt datt dës Projeten net sou schwéier musse sinn, also hu mir ugefaang d'RapidMiner Plattform ze kreéieren fir datt jiddereen e super Datewëssenschaftler ass.

Kënnt Dir déi voll Transparenz Gouvernance diskutéieren, déi de Moment vum RapidMiner benotzt gëtt?

Wann Dir e Modell net erkläre kënnt, ass et zimmlech schwéier ze stëmmen, ze vertrauen an ze iwwersetzen. Vill Datenwëssenschaftsaarbecht ass d'Kommunikatioun vun de Resultater un anerer sou datt d'Akteuren kënne verstoen wéi d'Prozesser verbesseren. Dëst erfuerdert Vertrauen an déif Verständnis. Och Probleemer mat Vertrauen an Iwwersetzung kënnen et ganz schwéier maachen d'Firma Ufuerderunge ze iwwerwannen fir e Modell a Produktioun ze kréien. Mir kämpfen dës Schluecht op e puer verschidde Weeër:

Als visuell Datewëssenschaftsplattform kartéiert RapidMiner inherent eng Erklärung fir all Datepipelines a Modeller an engem héich verbrauchbare Format dat ka vun Datewëssenschaftler oder Net-Datewëssenschaftler verstane ginn. Et mécht Modeller transparent an hëlleft d'Benotzer fir Modellverhalen ze verstoen an hir Stäerkten a Schwächen ze evaluéieren an potenziell Biases z'entdecken.

Zousätzlech kommen all Modeller, déi an der Plattform erstallt sinn, mat extensiv Visualiséierunge fir de Benotzer - typesch de Benotzer deen de Modell erstallt - fir Modellerkenntnisser ze kréien, Modellverhalen ze verstoen an Modellbias ze evaluéieren.

RapidMiner bitt och Modellerklärungen - och wann an der Produktioun: Fir all Prognose erstallt vun engem Modell, RapidMiner generéiert a füügt d'Aflossfaktoren un, déi zu den Entscheedunge vun deem Modell an der Produktioun gefouert hunn oder beaflosst hunn.

Schlussendlech - an dëst ass ganz wichteg fir mech perséinlech well ech virun e puer Joer dëst mat eisen Ingenieursteams gefuer hunn - RapidMiner bitt och eng extrem mächteg Modellsimulatorkapazitéit, déi d'Benotzer erlaabt d'Modelverhalen ze simuléieren an ze observéieren baséiert op Inputdaten, déi geliwwert ginn. vum Benotzer. Inputdaten kënne ganz einfach agestallt a geännert ginn, wat de Benotzer erlaabt d'predictive Verhalen vun de Modeller op verschidden hypothetesch oder real-Welt Fäll ze verstoen. De Simulator weist och Faktoren déi d'Entscheedung vum Modell beaflossen. De Benotzer - an dësem Fall souguer e Geschäftsbenotzer oder Domainexpert - kann d'Modellverhalen verstoen, d'Entscheedung vum Modell géint real Resultater oder Domainkenntnisser validéieren an Themen identifizéieren. De Simulator erlaabt Iech d'real Welt ze simuléieren an e Bléck an d'Zukunft ze hunn - an Är Zukunft, tatsächlech.

Wéi benotzt RapidMiner déif Léieren?

Dem RapidMiner seng Notzung vun Deep Learning eppes op mir si ganz houfreg. Deep Learning ka ganz schwéier sinn ze bewerben an Net-Datewëssenschaftler kämpfen dacks mat der Opstellung vun dësen Netzwierker ouni Expert Ënnerstëtzung. RapidMiner mécht dëse Prozess sou einfach wéi méiglech fir Benotzer vun all Typ. Deep Learning ass zum Beispill Deel vun eisem Auto Machine Learning (ML) Produkt genannt RapidMiner Go. Hei brauch de Benotzer näischt iwwer déif Léieren ze wëssen fir dës Zorte vu raffinéierte Modeller ze benotzen. Zousätzlech kënnen Power Benotzer méi déif goen a populär Deep Learning Bibliothéike benotzen wéi Tensorflow, Keras oder DeepLearning4J direkt vun de visuelle Workflows déi se mam RapidMiner bauen. Dëst ass wéi mat Bausteng ze spillen a vereinfacht d'Erfahrung fir Benotzer mat manner Datenwëssenschaftsfäegkeeten. Duerch dës Approche kënnen eis Benotzer flexibel Netzwierkarchitekturen mat verschiddenen Aktivéierungsfunktiounen a Benotzerdefinéierter Zuel vu Schichten an Wirbelen bauen, verschidde Schichten mat verschiddenen Zuelen vun Wirbelen, a wielt aus verschiddenen Trainingstechniken.

Wéi eng aner Aart vu Maschinnléiere gëtt benotzt?

Alleguer! Mir bidden Honnerte vu verschiddene Léieralgorithmen als Deel vun der RapidMiner Plattform - alles wat Dir an de wäit benotzte Datewëssenschaftsprogramméierungssprooche Python a R gëlle kënnt. Ënnert anerem bitt RapidMiner Methoden fir Naive Bayes, Regressioun wéi Generaliséierter Linearmodeller, Clustering z. als k-Mëttel, FP-Wuesstum, Entscheedungsbeem, Zoufälleg Bëscher, Paralleliséiert Deep Learning, a Gradient Boosted Trees. Dës a vill méi sinn all Deel vun der Modellerbibliothéik vu RapidMiner a kënne mat engem eenzegen Klick benotzt ginn.

Kënnt Dir diskutéieren wéi den Auto Model déi optimal Wäerter kennt fir ze benotzen?

RapidMiner AutoModel benotzt intelligent Automatioun fir alles ze beschleunegen, wat d'Benotzer maachen a sécherzestellen datt korrekt, Tounmodeller gebaut ginn. Dëst beinhalt d'Instanzauswiel an d'automatesch Outlier Entfernung, Feature Engineering fir komplex Datentypen wéi Datumen oder Texter, a voll multi-objektiv automatiséiert Feature Engineering fir déi optimal Features ze wielen an nei ze konstruéieren. Auto Model enthält och aner Datereinigungsmethoden fir allgemeng Themen an Daten ze fixéieren wéi fehlend Wäerter, Dateprofiléierung andeems d'Qualitéit an de Wäert vun den Datekolonnen bewäerten, Datennormaliséierung a verschidde aner Transformatiounen.

Auto Model extrahéiert och Datenqualitéit Metadaten - zum Beispill, wéi vill eng Kolonn sech wéi eng ID behält oder ob et vill fehlend Wäerter gëtt. Dës Metadaten ginn zousätzlech zu de Basis Metadaten benotzt fir d'Benotzer ze automatiséieren an ze hëllefen beim 'benotzen vun den optimale Wäerter' a mat Datequalitéitsprobleemer ze këmmeren.

Fir méi Detailer, hu mir alles an eisem Auto Model Blueprint kartéiert. (Bild hei drënner fir extra Kontext)

Et gi véier Basisphasen wou d'Automatisatioun applizéiert gëtt:

- Datepräparatioun: Automatesch Analyse vun Daten fir allgemeng Qualitéitsproblemer wéi Korrelatiounen, fehlend Wäerter a Stabilitéit z'identifizéieren.
- Automatiséierter Modellauswiel an Optimiséierung, inklusiv voll Validatioun a Leeschtungsverglach, dat proposéiert déi bescht Maschinnléiertechnike fir gegebene Donnéeën a bestëmmt déi optimal Parameteren.
- Modellsimulatioun fir ze hëllefen déi spezifesch (preskriptiv) Aktiounen ze bestëmmen fir ze huelen fir dat gewënschte Resultat ze erreechen, virausgesot vum Modell.
- An der Modellersetzungs- an Operatiounsphase ginn d'Benotzer Faktore gewisen wéi Drift, Bias a Geschäftsimpakt, automatesch ouni extra Aarbecht erfuerderlech.

Computerbias ass e Problem mat all Typ vun AI, ginn et Kontrollen op der Plaz fir Bias ze vermeiden an de Resultater ze kräischen?

Jo, dëst ass wierklech extrem wichteg fir ethesch Datewëssenschaft. D'Regierungsfeatures, déi virdru erwähnt sinn, suergen datt d'Benotzer ëmmer genau kënne gesinn wéi eng Donnéeën fir Modellbau benotzt goufen, wéi se transforméiert goufen an ob et Bias an der Dateauswiel ass. Zousätzlech sinn eis Features fir Drifterkennung en anert mächtegt Tool fir Bias z'entdecken. Wann e Modell an der Produktioun vill Drift an den Inputdaten weist, kann dat en Zeechen sinn datt d'Welt dramatesch geännert huet. Wéi och ëmmer, et kann och en Indikateur sinn datt et schwéier Bias an den Trainingsdaten war. An Zukunft betruechte mir nach e Schrëtt méi wäit ze goen a Maschinnléiere Modeller ze bauen déi kënne benotzt ginn fir Bias an anere Modeller z'entdecken.

Kënnt Dir d'RapidMiner AI Cloud diskutéieren a wéi se sech vu konkurréiere Produkter differenzéiert?

D'Ufuerderunge fir en Datewëssenschaftsprojet kënne grouss, komplex a rechenintensiv sinn, wat d'Benotzung vu Cloud Technologie esou eng attraktiv Strategie fir Datewëssenschaftler gemaach huet. Leider verbannen déi verschidde gebierteg Cloud-baséiert Datewëssenschaftsplattformen Iech mat Cloud Servicer an Datelagerungsoffer vun deem bestëmmte Cloud Verkeefer.

D'RapidMiner AI Cloud ass einfach eis Cloud Service Liwwerung vun der RapidMiner Plattform. D'Offer kann un d'Ëmfeld vun all Client ugepasst ginn, onofhängeg vun hirer Cloud Strategie. Dëst ass wichteg dës Deeg well déi meescht Geschäfter hir Approche fir Cloud Datemanagement ganz séier am aktuellen Klima evoluéieren. Flexibilitéit ass wierklech wat RapidMiner AI Cloud ënnerscheet. Et kann an all Cloud Service, private Cloud Stack oder an engem Hybrid Setup lafen. Mir sinn Cloud portable, Cloud agnostesch, Multi-Cloud - wat Dir et léiwer nennt.

RapidMiner AI Cloud ass och ganz niddereg Stress, well natierlech bidden mir d'Fäegkeet all oder en Deel vun der Détachement fir Clienten ze managen, sou datt se sech op hir Geschäfter mat AI konzentréieren kënnen, net ëmgedréint. Et gëtt souguer eng On-Demand-Optioun, déi Iech erlaabt Iech en Ëmfeld ze spinnen wéi néideg fir kuerz Projeten.

RapidMiner Radoop eliminéiert e puer vun der Komplexitéit hannert Datenwëssenschaft, kënnt Dir eis soen wéi Radoop d'Entwéckler profitéiert?  

Radoop ass haaptsächlech fir Net-Entwéckler déi d'Potenzial vu Big Data notzen wëllen. RapidMiner Radoop féiert RapidMiner Workflows direkt bannent Hadoop op eng codefräi Manéier aus. Mir kënnen och de RapidMiner Ausféierungsmotor am Spark embed sou datt et einfach ass komplett Workflows an Spark ze drécken ouni d'Komplexitéit déi aus code-centric Approche kënnt.

Géif eng Regierungsentitéit fäeg sinn RapidMiner ze benotzen fir Daten ze analyséieren fir potenziell Pandemie virauszesoen, ähnlech wéi BlueDot funktionéiert?

Als allgemeng Datewëssenschafts- a Maschinnléierplattform ass RapidMiner geduecht fir de Modellkreatioun a Gestiounsprozess ze streamlinéieren an ze verbesseren, egal wéi en Thema oder Domain am Zentrum vun der Datewëssenschaft / Maschinnléiereproblem ass. Och wann eise Fokus net op Pandemie virauszesoen ass, mat de richtegen Donnéeën en Thema Expert (wéi e Virolog oder Epidemiolog, an dësem Fall) kéint d'Plattform benotzen fir e Modell ze kreéieren deen Pandemie präzis viraussoe kann. Tatsächlech benotze vill Fuerscher RapidMiner - an eis Plattform ass gratis fir akademesch Zwecker.

Gëtt et nach eppes wat Dir gär iwwer RapidMiner deele wëllt?

Probéiert et! Dir kënnt iwwerrascht sinn wéi einfach Datewëssenschaft ka sinn a wéi vill eng gutt Plattform Iech an d'Produktivitéit vun Ärem Team verbessert.

Merci fir dëse super Interviewer, Lieser déi méi wësse wëllen sollten besichen RapidMiner.

A founding partner of unite.AI & e Member vun der Forbes Technology Council, Den Antoine ass a futuristesch déi passionéiert ass iwwer d'Zukunft vun AI & Robotik.

Hien ass och de Grënner vun Securities.io, eng Websäit déi sech op d'Investitioun an d'Stéierungstechnologie konzentréiert.