Entretiens

Dr. Mike Flaxman, VP de Produit chez HEAVY.AI – Série d’entretiens

Published September 19, 2024

Updated May 20, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Dr. Mike Flaxman est actuellement le VP de Produit chez HEAVY.AI, après avoir occupé le poste de Product Manager et dirigé la pratique de la science des données spatiales dans les services professionnels. Il a passé les 20 dernières années à travailler dans la planification environnementale spatiale. Avant de rejoindre HEAVY.AI, il a fondé Geodesign Technologies, Inc et cofondé GeoAdaptive LLC, deux startups qui appliquent les technologies d’analyse spatiale à la planification. Avant de devenir entrepreneur, il était professeur de planification à MIT et responsable de l’industrie chez ESRI.

HEAVY.AI est une plateforme matériellement accélérée pour l’analyse de données en temps réel et à forte incidence. Elle utilise à la fois le traitement GPU et CPU pour interroger de grandes bases de données rapidement, avec une prise en charge de SQL et des données géospatiales. La plateforme comprend des outils d’analyse visuelle pour les tableaux de bord interactifs, le filtrage croisé et les visualisations de données évolutives, permettant une analyse efficace des grandes données dans diverses industries.

Pouvez-vous nous parler de votre parcours professionnel et de ce qui vous a amené à rejoindre HEAVY.AI ?

Avant de rejoindre HEAVY.AI, j’ai passé des années dans l’enseignement, enseignant finalement l’analyse spatiale à MIT. J’ai également dirigé une petite entreprise de conseil, avec une variété de clients du secteur public. J’ai été impliqué dans des projets de SIG dans 17 pays. Mon travail m’a emmené de la consultation pour des organisations comme la Banque interaméricaine de développement à la gestion de la technologie SIG pour l’architecture, l’ingénierie et la construction chez ESRI, le plus grand développeur de SIG au monde.

Je me souviens vivement de ma première rencontre avec ce qui est maintenant HEAVY.AI, qui remonte à l’époque où, en tant que consultant, j’étais responsable de la planification de scénarios pour le programme de conservation de l’habitat des plages de Floride. Mes collègues et moi avions du mal à modéliser l’habitat des tortues de mer à l’aide de données Landsat de 30 mètres et un ami m’a indiqué des données tout à fait nouvelles et très pertinentes – des données LiDAR de 5 cm. C’était exactement ce dont nous avions besoin sur le plan scientifique, mais quelque chose comme 3600 fois plus grand que ce que nous avions prévu d’utiliser. Comme personne n’allait augmenter mon budget, même d’une fraction de ce montant, j’ai posé les outils que j’avais utilisés et enseignés pendant plusieurs décennies et je suis allé chercher quelque chose de nouveau. HEAVY.AI a traversé et rendu ces données si facilement et sans effort que j’ai été instantanément accroché.

En avançant dans le temps, je pense toujours que ce que fait HEAVY.AI est plutôt unique et que son pari précoce sur l’analyse de données GPU était exactement là où l’industrie devait aller. HEAVY.AI se concentre fermement sur la démocratisation de l’accès aux grandes données. Cela implique bien sûr la composante volume de données et vitesse de traitement, essentiellement en donnant à chacun son propre supercalculateur. Mais un aspect de plus en plus important avec l’avènement des grands modèles de langage est de rendre la modélisation spatiale accessible à beaucoup plus de personnes. Ces jours-ci, plutôt que de passer des années à apprendre une interface complexe avec des milliers d’outils, vous pouvez simplement commencer une conversation avec HEAVY.AI dans la langue humaine de votre choix. Le programme ne génère pas seulement les commandes requises, mais présente également des visualisations pertinentes.

Derrière les scènes, offrir une facilité d’utilisation est bien sûr très difficile. Actuellement, en tant que VP de la gestion de produit chez HEAVY.AI, je suis fortement impliqué dans la détermination des fonctionnalités et des capacités que nous priorisons pour nos produits. Mon expérience approfondie en SIG me permet de vraiment comprendre les besoins de nos clients et de guider notre feuille de route de développement en conséquence.

Comment votre expérience antérieure dans la planification environnementale spatiale et les startups a-t-elle influencé votre travail chez HEAVY.AI ?

La planification environnementale est un domaine particulièrement difficile dans la mesure où vous devez tenir compte à la fois des différents besoins humains et du monde naturel. La solution générale que j’ai apprise tôt était de combiner une méthode appelée planification participative avec les technologies de télédétection et de SIG. Avant de se décider sur un plan d’action, nous faisions plusieurs scénarios et simulions leurs impacts positifs et négatifs sur l’ordinateur à l’aide de visualisations. L’utilisation de processus participatifs nous a permis de combiner diverses formes d’expertise et de résoudre des problèmes très complexes.

Alors que nous ne faisons pas généralement de la planification environnementale chez HEAVY.AI, ce modèle fonctionne toujours très bien dans les contextes commerciaux. Nous aidons donc les clients à construire des jumeaux numériques de parties clés de leur entreprise et à créer et évaluer rapidement des scénarios commerciaux.

Je suppose que mon expérience d’enseignement m’a donné une grande empathie pour les utilisateurs de logiciels, en particulier des systèmes de logiciels complexes. Là où un étudiant bute sur un point est aléatoire, mais là où des dizaines ou des centaines de personnes font des erreurs similaires, vous savez que vous avez un problème de conception. Peut-être que ma partie préférée de la conception de logiciels est de prendre ces enseignements et de les appliquer pour concevoir de nouvelles générations de systèmes.

Pouvez-vous expliquer comment HeavyIQ utilise le traitement du langage naturel pour faciliter l’exploration et la visualisation des données ?

Ces jours-ci, il semble que tout le monde et son frère vantent un nouveau modèle de génie artificiel, la plupart d’entre eux étant des clones oubliables les uns des autres. Nous avons pris un chemin très différent. Nous croyons que l’exactitude, la reproductibilité et la confidentialité sont des caractéristiques essentielles pour les outils d’analyse commerciale, y compris ceux générés avec les grands modèles de langage. Nous avons donc intégré ces éléments à notre offre à un niveau fondamental. Par exemple, nous limitons strictement les entrées de modèle aux bases de données d’entreprise et fournissons des documents à l’intérieur d’un périmètre de sécurité d’entreprise. Nous limitons également les sorties aux derniers HeavySQL et Charts. Cela signifie que quelle que soit la question que vous posez, nous essayerons de répondre avec vos données et nous vous montrerons exactement comment nous avons dérivé cette réponse.

Avec ces garanties en place, cela importe moins à nos clients exactement comment nous traitons les requêtes. Mais derrière les scènes, une autre différence importante par rapport aux modèles de génie artificiel grand public est que nous affinons considérablement les modèles contre les types de questions que les utilisateurs commerciaux posent aux données commerciales, y compris les données spatiales. Par exemple, notre modèle est excellent pour effectuer des joints spatiaux et temporels, qui ne sont pas dans les benchmarks classiques de SQL mais que nos utilisateurs utilisent quotidiennement.

Nous emballons ces capacités de base dans une interface Notebook que nous appelons HeavyIQ. IQ est destiné à rendre l’exploration et la visualisation des données aussi intuitives que possible en utilisant le traitement du langage naturel. Vous posez une question en anglais – comme « Quels étaient les modèles météorologiques en Californie la semaine dernière ? » – et HeavyIQ traduit cela en requêtes SQL que notre base de données accélérée par GPU traite rapidement. Les résultats sont présentés non seulement sous forme de données mais également sous forme de visualisations – cartes, graphiques, ce qui est le plus pertinent. Il s’agit de permettre une interrogation interactive rapide, en particulier lorsqu’il s’agit de grandes bases de données ou de données en mouvement rapide. Ce qui est clé ici est que ce n’est pas toujours la première question que vous posez, mais peut-être la troisième, qui obtient vraiment l’insight clé, et HeavyIQ est conçu pour faciliter cette exploration plus approfondie.

Quels sont les principaux avantages de l’utilisation de HeavyIQ par rapport aux outils de BI traditionnels pour les opérateurs de télécommunications, les services publics et les agences gouvernementales ?

HeavyIQ excelle dans les environnements où vous avez affaire à des données à grande échelle et à haute vélocité – exactement le type de données que les opérateurs de télécommunications, les services publics et les agences gouvernementales gèrent. Les outils de business intelligence traditionnels ont souvent du mal avec le volume et la vitesse de ces données. Par exemple, dans les télécommunications, vous pouvez avoir des milliards d’enregistrements d’appels, mais c’est la petite fraction d’appels manqués que vous devez vous concentrer. HeavyIQ vous permet de passer au crible ces données 10 à 100 fois plus rapidement grâce à notre infrastructure GPU. Cette vitesse, combinée à la capacité d’interroger et de visualiser les données de manière interactive, en fait une chose inestimable pour l’analyse des risques dans les services publics ou la planification de scénarios en temps réel pour les agences gouvernementales.

L’autre avantage déjà évoqué ci-dessus est que les requêtes SQL spatiales et temporelles sont extrêmement puissantes sur le plan analytique – mais peuvent être lentes ou difficiles à écrire à la main. Lorsqu’un système fonctionne à ce que nous appelons « la vitesse de la curiosité », les utilisateurs peuvent poser à la fois plus de questions et des questions plus nuancées. Par exemple, un ingénieur de télécommunications peut remarquer un pic temporel dans les défaillances d’équipement à partir d’un système de surveillance et avoir l’intuition que quelque chose ne va pas dans une installation particulière et vérifier cela avec une requête spatiale renvoyant une carte.

Quelles mesures sont en place pour prévenir la fuite de métadonnées lors de l’utilisation de HeavyIQ ?

Comme décrit ci-dessus, nous avons construit HeavyIQ avec la confidentialité et la sécurité au cœur. Cela inclut non seulement les données mais également plusieurs types de métadonnées. Nous utilisons des métadonnées au niveau de la colonne et de la table pour déterminer quelles tables et colonnes contiennent les informations nécessaires pour répondre à une requête. Nous utilisons également des documents internes à l’entreprise pour aider à ce que l’on appelle la génération assistée par récupération (RAG). Enfin, les modèles de langage eux-mêmes génèrent des métadonnées supplémentaires. Toutes ces métadonnées, en particulier les deux dernières, peuvent être très sensibles sur le plan commercial.

Contrairement aux modèles tiers où vos données sont généralement envoyées à des serveurs externes, HeavyIQ s’exécute localement sur la même infrastructure GPU que le reste de notre plateforme. Cela garantit que vos données et métadonnées restent sous votre contrôle, sans risque de fuite. Pour les organisations qui nécessitent les niveaux de sécurité les plus élevés, HeavyIQ peut même être déployé dans un environnement complètement isolé, garantissant que les informations sensibles ne quittent jamais les équipements spécifiques.

Comment HEAVY.AI atteint-il des performances et une évolutivité élevées avec des ensembles de données massifs en utilisant l’infrastructure GPU ?

Le secret réside essentiellement dans l’évitement du déplacement de données prévalent dans d’autres systèmes. Au cœur, cela commence par une base de données conçue à partir de zéro pour s’exécuter sur les GPU NVIDIA. Nous travaillons dessus depuis plus de 10 ans maintenant et nous croyons vraiment que nous avons la meilleure solution de classe lorsqu’il s’agit d’analyse de données accélérée par GPU.

Même les meilleurs systèmes basés sur CPU s’essoufflent bien avant un GPU moyen. La stratégie une fois que cela se produit sur le CPU nécessite de distribuer les données sur plusieurs cœurs, puis sur plusieurs systèmes (ce que l’on appelle « mise à l’échelle horizontale »). Cela fonctionne bien dans certains contextes où les choses sont moins critiques en termes de temps, mais commence généralement à être gêné par les performances du réseau.

En plus d’éviter ce déplacement de données pour les requêtes, nous évitons également cela pour de nombreuses autres tâches courantes. La première est que nous pouvons rendre des graphiques sans déplacer les données. Ensuite, si vous souhaitez effectuer une modélisation d’inférence ML, nous faisons cela à nouveau sans déplacement de données. Et si vous interrogez les données avec un grand modèle de langage, nous faisons cela encore une fois sans déplacement de données. Même si vous êtes un data scientist et que vous souhaitez interroger les données à partir de Python, nous fournissons des méthodes pour le faire sur GPU sans déplacement de données.

Cela signifie en pratique que nous pouvons effectuer non seulement des requêtes mais également des rendus 10 à 100 fois plus rapides que les bases de données et les serveurs de cartes basés sur le CPU traditionnels. Lorsque vous avez affaire aux grandes bases de données à haute vélocité avec lesquelles travaillent nos clients – comme des modèles météorologiques, des enregistrements d’appels de télécommunications ou des images satellites – ce type de gain de performances est absolument essentiel.

Comment HEAVY.AI maintient-il son avance concurrentielle dans le paysage en constante évolution de l’analyse de données et de l’intelligence artificielle ?

C’est une excellente question et c’est quelque chose à quoi nous réfléchissons constamment. Le paysage de l’analyse de données et de l’intelligence artificielle évolue à un rythme incroyablement rapide, avec de nouvelles avancées et innovations se produisant tout le temps. Cela ne nous fait certainement pas de mal d’avoir une avance de 10 ans sur la technologie de base de données GPU.

Je pense que la clé pour nous est de rester concentrés sur notre mission de base – la démocratisation de l’accès aux grandes données géospatiales. Cela signifie continuellement repousser les limites de ce qui est possible avec l’analyse de données accélérée par GPU et garantir que nos produits offrent des performances et des capacités inégalées dans ce domaine. Une grande partie de cela consiste en notre investissement continu dans le développement de modèles de langage personnalisés et affinés qui comprennent vraiment les nuances de SQL spatial et d’analyse géospatiale.

Nous avons construit une vaste bibliothèque de données d’entraînement, allant bien au-delà des benchmarks génériques, pour garantir que nos outils d’analyse conversationnelle peuvent interagir avec les utilisateurs d’une manière naturelle et intuitive. Mais nous savons également que la technologie seule ne suffit pas. Nous devons rester profondément connectés à nos clients et à leurs besoins évoluant. Au bout du compte, notre avance concurrentielle repose sur notre focalisation sans relâche sur la livraison d’une valeur de transformation à nos utilisateurs. Nous ne suivons pas simplement le marché – nous repoussons les limites de ce qui est possible avec les grandes données et l’intelligence artificielle. Et nous continuerons à le faire, quelle que soit la vitesse à laquelle le paysage évolue.

Comment HEAVY.AI soutient-il les efforts de réponse d’urgence via HeavyEco ?

Nous avons construit HeavyEco lorsque nous avons vu certains de nos plus grands clients des services publics rencontrer des difficultés importantes pour simplement ingérer les sorties actuelles des modèles météorologiques, ainsi que pour les visualiser pour des comparaisons conjointes. Il fallait à l’un de nos clients jusqu’à quatre heures pour charger les données, et lorsque vous êtes confronté à des conditions météorologiques extrêmes en mouvement rapide comme les incendies… cela n’est tout simplement pas suffisant.

HeavyEco est conçu pour fournir des informations en temps réel dans des situations à haute conséquence, comme lors d’un incendie de forêt ou d’une inondation. Dans de telles situations, vous devez prendre des décisions rapidement et sur la base des meilleures données possibles. HeavyEco sert donc d’abord de canal de données géré professionnellement pour des modèles autorisés tels que ceux de la NOAA et de l’USGS. Sur ces données, HeavyEco vous permet de faire tourner des scénarios, de modéliser les impacts au niveau des bâtiments et de visualiser les données en temps réel. Cela donne aux premiers intervenants les informations critiques dont ils ont besoin lorsqu’il en va de la vie. Il s’agit de transformer des ensembles de données complexes et à grande échelle en une intelligence actionnable qui peut guider la prise de décision immédiate.

En fin de compte, notre objectif est de donner à nos utilisateurs la capacité d’explorer leurs données à la vitesse de la pensée. Que vous exécutiez des modèles spatiaux complexes, que vous compariez les prévisions météorologiques ou que vous essayiez d’identifier des modèles dans des séries chronologiques géospatiales, nous voulons que vous puissiez le faire sans obstacle technique.

Qu’est-ce qui distingue le LLM propriétaire de HEAVY.AI des autres LLM tiers en termes de précision et de performances ?

Notre LLM propriétaire est spécifiquement réglé pour les types d’analyses sur lesquelles nous nous concentrons – comme le texte vers SQL et le texte vers la visualisation. Nous avons initialement essayé des modèles tiers traditionnels, mais nous avons constaté qu’ils ne répondaient pas aux exigences élevées de précision de nos utilisateurs, qui prennent souvent des décisions critiques. Nous avons donc affiné une gamme de modèles open source et les avons testés contre des benchmarks industriels.

Notre LLM est beaucoup plus précis pour les concepts SQL avancés dont nos utilisateurs ont besoin, en particulier dans les données géospatiales et temporelles. De plus, puisqu’il s’exécute sur notre infrastructure GPU, il est également plus sécurisé.

En plus des capacités de modèle intégrées, nous fournissons également une interface utilisateur interactive complète pour les administrateurs et les utilisateurs pour ajouter des métadonnées pertinentes pour le domaine ou l’entreprise. Par exemple, si le modèle de base ne fonctionne pas comme prévu, vous pouvez importer ou ajuster des métadonnées au niveau de la colonne, ajouter des informations de guidage et obtenir immédiatement des commentaires.

Comment HEAVY.AI envisage-t-il le rôle de l’analyse de données géospatiales et temporelles dans l’élaboration de l’avenir de diverses industries ?

Nous croyons que l’analyse de données géospatiales et temporelles sera cruciale pour l’avenir de nombreuses industries. Ce sur quoi nous nous concentrons vraiment est d’aider nos clients à prendre de meilleures décisions, plus rapidement. Que vous soyez dans les télécommunications, les services publics ou le gouvernement, ou autre – avoir la capacité d’analyser et de visualiser les données en temps réel peut être un facteur de différenciation.

<p Notre mission est de rendre ce type d'analyse puissante accessible à tous, et pas seulement aux grands acteurs avec des ressources massives. Nous voulons nous assurer que nos clients peuvent tirer parti des données dont ils disposent pour rester en tête et résoudre les problèmes à mesure qu'ils surviennent. Alors que les données continuent de croître et de devenir plus complexes, nous voyons notre rôle comme celui de garantir que nos outils évoluent aux côtés, afin que nos clients soient toujours prêts pour ce qui vient ensuite.

Je vous remercie pour cette excellente interview, les lecteurs qui souhaitent en savoir plus peuvent visiter HEAVY.AI.

Antoine Tardif, CEO & Founder of Unite.AI

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.

Unite.AI

Dr. Mike Flaxman, VP de Produit chez HEAVY.AI – Série d’entretiens

You may like