Suivez nous sur

Omer Har, cofondateur et directeur technique, Explorium – Série d'entrevues

Intelligence Artificielle

Omer Har, cofondateur et directeur technique, Explorium – Série d'entrevues

mm

Omer Har est un vétéran de la science des données et du génie logiciel avec près d'une décennie d'expérience dans la création de modèles d'IA qui font avancer les grandes entreprises.

Omer Har est le co-fondateur et directeur technique de Explorer, une entreprise qui propose une plateforme de science des données unique en son genre, alimentée par la découverte de données augmentée et l'ingénierie des fonctionnalités. En se connectant automatiquement à des milliers de sources de données externes et en tirant parti de l'apprentissage automatique pour distiller les signaux les plus percutants, la plateforme Explorium permet aux scientifiques des données et aux chefs d'entreprise de piloter la prise de décision en éliminant les obstacles à l'acquisition des bonnes données et en permettant une puissance prédictive supérieure.

Quand avez-vous dĂ©couvert pour la première fois que vous vouliez vous impliquer dans la science des donnĂ©es ?

Mon intérêt pour la science des données remonte à plus d'une décennie, c'est-à-dire depuis combien de temps je pratique et dirige des équipes de science des données. J'ai commencé comme ingénieur logiciel, mais j'ai toujours été attiré par les données complexes et les défis algorithmiques dès le début. J'ai eu la chance d'avoir appris le métier chez Microsoft Research, qui était l'un des rares endroits à l'époque où l'on pouvait vraiment travailler sur des défis complexes d'apprentissage automatique appliqué à grande échelle.

 

Vous avez co-fondé Explorium en 2017, pouvez-vous nous parler de l'inspiration derrière le lancement de cette start-up ?

Explorium est basé sur un besoin simple et très puissant - il y a tellement de données autour de nous qui pourraient potentiellement aider à construire de meilleurs modèles, mais il n'y a aucun moyen de savoir à l'avance quelles sources de données vont avoir un impact, et comment. L'idée originale est venue de Maor Shlomo, co-fondateur et PDG d'Explorium, qui traitait avec une variété de données sans précédent dans son service militaire et s'attaquait aux moyens de les exploiter dans la prise de décision et la modélisation. Lorsque nous nous sommes réunis pour la première fois, il nous a immédiatement semblé clair que cette expérience faisait écho aux besoins auxquels nous étions confrontés dans le monde des affaires, en particulier dans les domaines à croissance rapide axés sur la science des données, comme les licornes des technologies de la publicité et du marketing, où moi et Ou Tamir (co-fondateur et directeur de l'exploitation d'Explorium) menait la croissance grâce aux données.

Avant Explorium, trouver des sources de données pertinentes qui avaient vraiment un impact - pour améliorer la précision de votre modèle d'apprentissage automatique - était un processus laborieux, long et coûteux avec de faibles chances de succès. La raison en est que vous devinez essentiellement et que vous utilisez vos personnes les plus chères - les scientifiques des données - pour expérimenter. De plus, l'acquisition de données elle-même est un processus métier complexe et les équipes de science des données n'ont généralement pas la capacité de s'engager commercialement avec plusieurs fournisseurs de données.

En tant que leader de la science des données mesurée par l'impact commercial généré par les modèles, je n'avais pas le luxe d'envoyer mon équipe à la poursuite de l'oie sauvage. Par conséquent, vous préférez souvent déployer vos efforts sur des choses qui peuvent avoir un impact beaucoup plus faible qu'une nouvelle source de données pertinente, simplement parce qu'elles sont beaucoup plus sous votre contrôle.

 

Explorium a récemment levé avec succès un financement supplémentaire de 31 millions de dollars lors d'une ronde de série B. Avez-vous été surpris de la rapidité avec laquelle votre entreprise s'est développée ?

Jusqu'Ă  prĂ©sent, cela a certainement Ă©tĂ© une promenade en fusĂ©e, et vous ne pouvez jamais tenir cela pour acquis. Je ne peux pas dire que j'ai Ă©tĂ© surpris par l'ampleur du besoin de meilleures donnĂ©es, mais c'est toujours une expĂ©rience incroyable de voir l'impact que vous gĂ©nĂ©rez pour les clients et leur entreprise. Le plus grand dĂ©fi analytique auquel les organisations seront confrontĂ©es au cours de la prochaine dĂ©cennie consiste Ă  trouver les bonnes donnĂ©es pour alimenter leurs modèles et leurs processus automatisĂ©s. Les bons actifs de donnĂ©es peuvent couronner de nouveaux leaders du marchĂ©, de sorte que notre croissance reflète vraiment le nombre croissant de clients qui en sont conscients et font des donnĂ©es une prioritĂ©. En fait, le nombre de « chasseurs de donnĂ©es Â» - des personnes qui recherchent des donnĂ©es dans le cadre de leur travail quotidien - augmente de façon exponentielle d'après notre expĂ©rience.

 

Pourriez-vous expliquer ce qu'est la plate-forme de donnĂ©es d'Explorium et en quoi consiste le processus automatisĂ© de dĂ©couverte de donnĂ©es ?

Explorium propose une plateforme de science des données de bout en bout alimentée par la découverte de données augmentées et l'ingénierie des fonctionnalités. Nous nous concentrons sur la partie "données" de la science des données - ce qui signifie se connecter automatiquement à des milliers de sources de données externes et tirer parti des processus d'apprentissage automatique pour distiller les signaux et les fonctionnalités les plus percutants. Il s'agit d'un processus complexe et en plusieurs étapes, qui commence par se connecter à une myriade de sources contextuellement pertinentes dans ce que nous appelons le catalogue de données Explorium. Ensuite, nous automatisons le processus qui explore cette variété de données interconnectées, en testant des centaines de milliers d'idées de fonctionnalités et de signaux significatifs pour créer l'ensemble de fonctionnalités optimal, créer des modèles par-dessus et les mettre en production de manière flexible.

En automatisant la recherche des donnĂ©es dont vous avez besoin, et pas seulement des donnĂ©es dont vous disposez en interne, la plate-forme Explorium fait Ă  la science des donnĂ©es ce que les moteurs de recherche ont fait pour le Web : nous parcourons, classons et vous apportons les donnĂ©es les plus pertinentes pour le prĂ©dictif. question Ă  portĂ©e de main.

Cela permet aux scientifiques des données et aux chefs d'entreprise d'orienter la prise de décision en éliminant l'obstacle à l'acquisition des bonnes données et en permettant une puissance prédictive supérieure.

 

Ă€ quels types de sources de donnĂ©es externes Explorium puise-t-il ?

Nous avons accès à des milliers de sources dans pratiquement toutes les catégories de données auxquelles vous pouvez penser, y compris les données d'entreprise, géospatiales, comportementales, temporelles, de site Web, etc. Nous avons plusieurs équipes d'experts spécialisées dans l'acquisition de données via des sources ouvertes, publiques et premium, ainsi que des partenariats. Notre accès à des talents uniques issus des meilleures unités de renseignement et de technologie d'Israël apporte un savoir-faire et une expérience considérables dans l'exploitation de la variété des données pour la prise de décision.

 

Comment Explorium utilise-t-il l'apprentissage automatique pour comprendre quels types de donnĂ©es sont pertinents pour les clients ?

Cela fait partie de notre «sauce secrète», donc je ne peux pas plonger dedans, mais à un niveau élevé, nous utilisons l'apprentissage automatique pour comprendre la signification des différentes parties de vos ensembles de données et utilisons des algorithmes en constante amélioration pour identifier quelles sources dans notre évolution catalogue sont potentiellement pertinents. En connectant réellement ces sources à vos données, nous sommes en mesure d'effectuer des processus complexes de découverte de données et d'ingénierie des fonctionnalités, spécialement conçus pour être efficaces pour les données externes et de grande dimension, afin d'identifier les fonctionnalités les plus percutantes à partir des sources les plus pertinentes. Faire tout cela dans le contexte de modèles d'apprentissage automatique rend l'impact statistiquement mesurable et nous permet d'apprendre et d'améliorer constamment nos capacités d'appariement, de génération et de découverte.

 

L'une des solutions proposĂ©es consiste Ă  attĂ©nuer le risque de fraude d'application pour les prĂŞteurs en ligne en utilisant la dĂ©couverte de donnĂ©es augmentĂ©e. Pourriez-vous dĂ©tailler le fonctionnement de cette solution ?

Le prêt consiste à prévoir et à atténuer le risque, qu'il provienne de la capacité de l'emprunteur à rembourser le prêt (par exemple, la performance financière) ou de son intention de le faire (par exemple, la fraude). Les demandes de prêt sont intrinsèquement un compromis entre le désir du prêteur de collecter plus d'informations et sa capacité à rivaliser avec d'autres prestataires, car les questionnaires plus longs et plus encombrants ont des taux de réponse plus faibles, sont biaisés par définition, etc.

Avec Explorium, les banques en place et les challengers en ligne sont en mesure d'augmenter automatiquement le processus de candidature avec des sources externes et objectives qui ajoutent un contexte immédiat et découvrent des relations significatives. Sans trop en dire pour aider les fraudeurs, vous pouvez imaginer que dans le contexte de la fraude, cela pourrait signifier des comportements et des propriétés différents qui se démarquent des vrais candidats si vous êtes en mesure d'en avoir une vue à 360°. Tout, depuis la présence en ligne, les dossiers officiels, les modèles de comportement sur les réseaux sociaux et les empreintes physiques, laisse des miettes de pain qui pourraient être hypothétiques et testées en tant que fonctionnalités et indicateurs potentiels si vous pouvez accéder aux données pertinentes et au savoir-faire vertical. En termes simples, de meilleures données garantissent de meilleurs modèles prédictifs, ce qui aide à traduire le risque réduit et les revenus plus élevés en résultats nets pour les prêteurs.

Dans une perspective plus large, depuis que COVID-19 a frappé à l'échelle mondiale, nous avons constaté une augmentation des nouveaux modèles de fraude ainsi que le besoin des prêteurs de revenir à l'essentiel, car la pandémie a brisé tous les modèles. Personne n'a vraiment pris en compte ce type d'événement "Black Swan", et une partie de notre réponse initiale pour aider ces entreprises a été de générer des signaux personnalisés qui aident à évaluer les risques commerciaux en ces temps incertains et dynamiques.

Vous pouvez en savoir plus dans un excellent article écrit par Maor Shlomo, cofondateur et PDG d'Explorium.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Exploration.

Antoine est un leader visionnaire et partenaire fondateur d'Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de s'extasier sur le potentiel des technologies disruptives et de l'AGI.

En tant que joueur futuriste, il se consacre à l'exploration de la manière dont ces innovations façonneront notre monde. En outre, il est le fondateur de Titres.io, une plateforme axée sur l’investissement dans les technologies de pointe qui redéfinissent l’avenir et remodèlent des secteurs entiers.