Interviews
Pedro Alves, CEO und Gründer von Ople.ai – Interview-Serie

Pedro Alves ist der CEO und Gründer von Ople.ai, einer Plattform, die Analysten und Fachleute mit leistungsstarken Predictive-Analytics befähigt. Die Plattform verfügt über das Wissen und die Expertise der weltweit führenden Datenwissenschaftler, damit Benutzer sich auf das konzentrieren können, was sie wirklich gut können: die Schaffung von Geschäftswert.
Was hat Sie ursprünglich zur Datenwissenschaft hingezogen?
Im Jahr 2001 sah ich ein enormes Potenzial in Machine Learning und künstlicher Intelligenz. Während meines Studiums der Informatik als Undergrad und der Entscheidung, welches Teilgebiet ich weiterverfolgen wollte, dachte ich: OK, AI/ML ist ein Bereich der Informatik, der mich interessiert – man kann helfen, Ereignisse in jedem Bereich vorherzusagen. Ob Sie in Biologie, Medizin oder Finanzen tätig sind, wenn Sie Machine Learning und AI haben, können Sie diese Bereiche erheblich voranbringen. Ich fand die Mathematik dahinter faszinierend.
Als ich die Graduiertenschule besuchte, entschied ich mich, dass die beste Möglichkeit, meine Expertise in Machine Learning zu verbessern, darin bestand, zu lernen, wie man es anwendet. Ich war immer sehr praktisch; ich wollte nicht nur Theorie lernen, um der Theorie willen. Ich entschied mich, Machine Learning zu studieren, wie es auf den Bereich der Genomik und Proteomik angewendet wird. Alle meine Graduiertenarbeit war in computergestützter Biologie, aber der Schwerpunkt lag auf Machine Learning.
Kurz darauf trat ich in die Gesundheitsbranche ein, wo ich ein großes Potenzial für AI/ML-Anwendungen sah. Das war der Zeitpunkt, an dem ich begann, die Probleme zu sehen, die AI in der Praxis hatte, außerhalb der Akademie. Ich erlebte die Realität von AI und lernte, wie ineffektiv es in der realen Welt angewendet wurde, und nicht wegen technischer Probleme. Also wurde ich von der Lösung dieses Problems angezogen.
Sie waren früher Chief Data Scientist bei Banjo, wo Sie Herausforderungen im Bereich soziale Netzwerke angegangen sind. Können Sie einige dieser Herausforderungen besprechen?
Als Unternehmen detektierten wir Ereignisse, die auf sozialen Medien aufgezeichnet wurden, insbesondere Ereignisse, die als potenzielle Gefahr hervorgehoben werden mussten, wie ein nahegelegener Autounfall oder ein brennendes Gebäude. Wir halfen, diese Ereignisse zu markieren, damit wir erste Hilfe leisten konnten. Wir nutzten soziale Medien zum Guten.
Viele dieser Ereignisse sind selten im Vergleich zu sozialen Medien-Daten. Zum Beispiel gibt es täglich zahlreiche Unfälle in jeder Stadt, aber wenn man auf den Umfang der sozialen Medien-Daten schaut, wird ein Bild von einem Autounfall zu einem winzigen Teil. Denken Sie an Millionen von Bildern von Hunden, Bildern von Essen, Millionen von Bildern von Selfies und dann ein Bild von einem Autounfall, alles innerhalb von wenigen Minuten. Im Wesentlichen suchten wir bei Banjo nach der Nadel im Heuhaufen.
Einige der Herausforderungen, die auftraten, bezogen sich auf Computer-Vision. Obwohl Computer-Vision zu diesem Zeitpunkt ordentlich war, wenn man versuchte, eine von Millionen zu finden, konnte sogar eine kleine Fehlerwahrscheinlichkeit Ihre Chancen, diese seltenen Ereignisse zu erkennen, vollständig zerstören.
Zum Beispiel gab es ein öffentliches Dataset, das, wenn man es zum Trainieren von neuronalen Netzen verwendete, dazu führte, dass diese nicht in der Lage waren, Farben zu erkennen. Selbst wenn ein Bild im Dataset farbenfroh war und das neuronale Netz alle RGB-Bilder ansah, verwendete es Farbe nicht als Erkennungsmerkmal. Nehmen Sie ein traditionelles Polizeiauto und ein traditionales Taxi – beide sind im Wesentlichen das gleiche Auto-Modell mit einem zusätzlichen Stück Ausrüstung oben (z. B. Sirenen auf einem Polizeiauto oder ein Frei/Besetzt-Signal auf einem Taxi). Aber wenn man auf die Farbe schaut, ist der Unterschied zwischen den beiden offensichtlich. Weil wir dieses Beispiel hatten, konnten wir verstehen, dass die Erstellung eines ordentlichen Datasets von entscheidender Bedeutung ist.
Im Jahr 2017 gründeten Sie dann Ople. Was ist die Entstehungsgeschichte hinter diesem Startup?
Ich wollte, dass Unternehmen eine solide Rendite aus der Implementierung von AI erzielen. Laut Gartner sehen zwischen 80 und 90 Prozent aller AI-Projekte nie das Licht der Welt. Dies hat nichts mit technischen Aspekten wie der Genauigkeit des Modells zu tun. Es geht meist um Unternehmenskultur oder Verfahrensaspekte innerhalb des Unternehmens.
Dies kann auf mangelnde Kommunikation zwischen dem Data-Science-Team und den Geschäftsanwendern zurückzuführen sein, was zu Modellen führt, die etwas vorhersagen, was das Geschäftsteam nicht benötigt, weil das Data-Science-Team nicht versteht, was gebaut werden muss. Oder, wenn sie das richtige Modell bauen, dann nutzt das Geschäftsteam die Vorhersagen, wenn das Data-Science-Team fertig ist, nicht. In den meisten Unternehmen sind es Abteilungen wie Vertrieb, Marketing und Logistik, die AI wirklich nutzen sollten, aber es ist das Data-Science-Team, das die Modelle versteht. Wenn diese Teams die Modelle, die für sie gebaut werden, nicht verstehen, neigen sie dazu, deren Vorhersagen nicht zu vertrauen und sie daher nicht zu nutzen.
Wenn AI also nicht dazu beiträgt, wie das Unternehmen Geschäfte macht, was ist der Sinn?
Wir wollten eine Plattform erstellen, die dies herausfindet – wir wollen dem Data-Science-Team oder den Business-Analysten, Data-Analysten, wer auch immer an diesem Prozess im Unternehmen beteiligt ist, helfen, die richtigen Projekte zu bauen und den Mitarbeitern zu helfen, die Modelle zu verstehen und zu vertrauen. Wenn wir das lösen, dann glaube ich, dass Data Science endlich für Unternehmen von echtem Wert sein kann.
Sie haben angegeben, dass Data Scientists wertvolle Zeit mit Aufgaben verbringen, die mit AI automatisiert werden können. Welche Aufgaben sollten automatisiert werden?
Ein Data Scientist benötigt in der Regel mehrere Monate, um ein Modell zu erstellen, und sobald es abgeschlossen ist, wird das Unternehmen das Modell implementieren, obwohl es wahrscheinlich nicht so genau wie möglich ist. In den Monaten nach der Implementierung des Modells wird der Data Scientist weiterhin daran arbeiten, um die Genauigkeit des Modells um kleine inkrementelle Beträge zu erhöhen. Dies ist normalerweise der Bereich, in dem viele Data Scientists ihre Zeit verbringen, wenn sie ihre Zeit stattdessen für andere Aufgaben aufwenden könnten, wie z. B. sicherzustellen, dass die Mitarbeiter die AI-Modelle verstehen, vertrauen und nutzen. All die Zeit, die für Aufgaben wie Feature-Engineering, Modelltraining, Parameter-Anpassung und Algorithmus-Auswahl aufgewendet wird, um die Genauigkeit eines Modells zu erhöhen, kann leicht mit AI automatisiert werden.
Können Sie beschreiben, was Meta-Learning ist und wie Ople dies anwendet?
Bevor ich zu Meta-Learning komme, ist es wichtig, die erste Ebene des Machine Learning zu verstehen. Nehmen wir an, Sie haben ein Dataset, das vorhersagt, wann Maschinen auf einem Fabrikhof ausfallen werden. Die Maschine benachrichtigt die Mitarbeiter, dass sie bald ausfallen wird, damit sie präventive Wartung durchführen können. Dies wird als erste Lernebene betrachtet.
Meta-Learning, oft bekannt als “Lernen, zu lernen”, ist das weitere Verständnis dieses Lernprozesses. Wenn Sie also Ihr Modell trainieren, um Maschinenausfälle vorherzusagen, haben Sie ein weiteres Modell, das beobachtet. Zum Beispiel könnte das zweite Modell Unternehmen helfen zu verstehen, welche Parameter das Vorhersagemodell gut lernt und welche Parameter nicht gut funktionieren. Wenn Sie Meta-Learning durchführen, werden Sie besser darin, effizientere Modelle zu bauen, schneller.
Was ist Ihre Meinung zu synthetischen Daten?
Synthetische Daten können sehr schwierig zu bearbeiten sein, wenn sie nicht richtig ausgeführt werden.
Nehmen wir an, Sie haben medizinische Aufzeichnungen – Sie haben 20 Patienten und für diese Patienten haben Sie ihr Alter, Geschlecht, Gewicht, Größe, Blutdruck, Medikamentenliste usw. Es ist möglich, synthetische Daten mit Machine Learning auf der Grundlage dieser medizinischen Aufzeichnungen zu erstellen. Wenn Sie jedoch nur auf Machine Learning oder Statistik vertrauen, können Sie unsinnige synthetische Daten erhalten. Es kann eine zufällige Kombination der Werte erzeugen, wie ein 3-Jähriger, der 1,80 Meter groß ist, oder eine 1,20 Meter große Person, die 450 Kilo wiegt. Obwohl AI/ML in vielen Fällen zuverlässig sind, würde synthetische Daten für medizinische Aufzeichnungen die Beteiligung eines Arztes erfordern.
Also werden Sie einen medizinischen Fachmann einbeziehen, um Parameter wie “Wenn die Person dieses Alter hat, was ist ein realistischer Größen- und Gewichtsbereich” oder “Wenn sie dieses Medikament einnehmen, welche Medikamente sollten sie nicht einnehmen” zu erstellen. Dieser Prozess würde unweigerlich zu einem riesigen Unterfangen werden und zu kompliziert, um alle Möglichkeiten im Hinblick auf die medizinischen Aufzeichnungen jedes Patienten zu kartieren.
Im Bereich der Bilder können synthetische Daten jedoch viel einfacher zu verstehen und zu erstellen sein. Nehmen wir an, Sie haben ein Bild von einem Auto, und das Auto befindet sich in der oberen linken Ecke. Sie müssen kein Experte sein, um zu wissen, dass dasselbe Auto in der unteren linken Ecke, der oberen rechten Ecke oder in der Mitte sein könnte. Nicht nur kann man die Kamera auf viele Arten ausrichten, sondern man kann auch das Bild neu ausrichten. Das Bild so anpassen, dass das Auto in allen verschiedenen Ecken ist, ist die Erstellung synthetischer Daten – eine weitere einfache Methode ist die Verwendung von Rotation.
Können Sie einige Beispiele dafür geben, wie Ople Unternehmen bei ihren Datenbedürfnissen geholfen hat?
Ople.AI gibt Unternehmen die Möglichkeit, tiefe Datenanalysen auf allen Ebenen des Unternehmens durchzuführen und seinen Mitarbeitern die Chance, den Wert von AI zu entsperren, mit nur wenigen Klicks. Im Gegensatz zu Unternehmen, die auf ein kleines Team von Data Scientists angewiesen sind, um AI zu artikulieren und umzusetzen, ermöglicht die Ople.AI-Plattform Mitarbeitern in verschiedenen Abteilungen, Tools zu nutzen, um Erkenntnisse aus ihren Daten zu gewinnen und so ihre tägliche Effizienz zu steigern.
Mit dem Gesagten ist ein großes Hindernis, das Unternehmen oft bei der Implementierung von AI überwinden müssen, die Erklärbarkeit von Modellen. Es ist von entscheidender Bedeutung, dass Unternehmen AI anbieten, die ihre Mitarbeiter verstehen und vor allem vertrauen können. Die Erklärbarkeit von Modellen hilft dabei. Unser Ziel mit der Ople.AI-Plattform ist es, Mitarbeitern, die möglicherweise nicht AI- oder technisch affine sind, die Chance zu geben, leicht zu verstehen, wie die Modelle Vorhersagen treffen und warum. Die Schaffung von Modell-Erklärbarkeit wird langfristig starke Ergebnisse für Unternehmen erzeugen.
Darüber hinaus gibt es viel mehr Wert, den ein Modell für Unternehmen bieten kann, als nur Vorhersagen zu treffen. AI kann potenzielle Probleme oder Bereiche aufdecken, die genutzt werden können. Wir nennen das Daten-Erklärbarkeit – es sind die verschiedenen Möglichkeiten, wie ein Modell intelligente Erkenntnisse über Daten teilen kann, die für ein Unternehmen von Wert sind. Dies ist ein wichtiger Bereich, in dem AI Unternehmen helfen kann, und ein Bereich, den wir im Hinblick auf unsere Konkurrenz vorantreiben.
Vielen Dank für das Interview. Leser, die mehr erfahren möchten, sollten Ople.ai besuchen.












