Interviews
Dr. Mike Flaxman, VP of Product at HEAVY.AI – Interview Series

Dr. Mike Flaxman is momenteel de VP of Product bij HEAVY.AI, nadat hij eerder als Product Manager heeft gewerkt en de Spatial Data Science-praktijk in Professional Services heeft geleid. Hij heeft de afgelopen 20 jaar gewerkt in de ruimtelijke milieuplanning. Voordat hij bij HEAVY.AI kwam, was hij de oprichter van Geodesign Technologies, Inc en medeoprichter van GeoAdaptive LLC, twee startups die ruimtelijke analysetechnologieën toepasten op planning. Voordat hij in de startup-wereld terechtkwam, was hij professor in planning aan het MIT en Industry Manager bij ESRI.
HEAVY.AI is een hardware-versnelde platform voor real-time, high-impact data-analyse. Het maakt gebruik van zowel GPU- als CPU-verwerking om grote datasets snel te doorzoeken, met ondersteuning voor SQL en georuimtelijke data. Het platform omvat visuele analysetools voor interactieve dashboards, cross-filtering en schaalbare gegevensvisualisaties, waardoor efficiënte big data-analyse mogelijk wordt gemaakt in verschillende industrieën.
Kunt u ons vertellen over uw professionele achtergrond en wat u ertoe heeft gebracht om bij HEAVY.AI te komen?
Voordat ik bij HEAVY.AI kwam, heb ik jaren in de academische wereld gewerkt, waar ik uiteindelijk spatial analytics doceerde aan het MIT. Ik heb ook een klein adviesbureau gerund, met een verscheidenheid aan klanten uit de publieke sector. Ik ben betrokken geweest bij GIS-projecten in 17 landen. Mijn werk heeft me van het adviseren van organisaties als de Inter-Amerikaanse Ontwikkelingsbank tot het beheren van GIS-technologie voor architectuur, engineering en constructie bij ESRI, de grootste GIS-ontwikkelaar ter wereld, gebracht.
Ik herinner me nog levendig mijn eerste ontmoeting met wat nu HEAVY.AI is, toen ik als consultant verantwoordelijk was voor scenario-planning voor het Florida Beaches Habitat Conservation Program. Mijn collega’s en ik hadden moeite om zeehondenhabitat te modelleren met 30m Landsat-gegevens en een vriend wees me op enkele nieuwe en zeer relevante gegevens – 5cm LiDAR. Het was exact wat we wetenschappelijk nodig hadden, maar iets wat 3600 keer groter was dan wat we hadden gepland. Niemand zou mijn budget zelfs maar met een fractie van dat bedrag verhogen. Dus die dag legde ik de tools neer die ik decennialang had gebruikt en onderwezen en ging ik op zoek naar iets nieuws. HEAVY.AI sneed door die gegevens heen en rendeerde ze zo soepel en moeiteloos dat ik meteen verslaafd was.
Een paar jaar later denk ik nog steeds dat wat HEAVY.AI doet vrij uniek is en dat de vroege inzet op GPU-analyse exact is waar de industrie nog steeds naartoe moet. HEAVY.AI is vastbesloten om toegang tot big data te democratiseren. Dit heeft niet alleen te maken met de hoeveelheid data en de verwerkingssnelheid, maar ook met het maken van ruimtelijke modellering toegankelijk voor veel meer mensen. Tegenwoordig hoeft u niet meer jaren te besteden aan het leren van een complexe interface met duizenden tools, maar kunt u gewoon een gesprek beginnen met HEAVY.AI in de menselijke taal van uw keuze. Het programma genereert niet alleen de benodigde opdrachten, maar presenteert ook relevante visualisaties.
Achter de schermen is het bereiken van gebruikersgemak natuurlijk heel moeilijk. Momenteel, als VP of Product Management bij HEAVY.AI, ben ik nauw betrokken bij het bepalen van welke functies en mogelijkheden we prioriteren voor onze producten. Mijn uitgebreide achtergrond in GIS stelt me in staat om de behoeften van onze klanten echt te begrijpen en onze ontwikkelingsroadmap dienovereenkomstig te begeleiden.
Hoe heeft uw eerdere ervaring in ruimtelijke milieuplanning en startups uw werk bij HEAVY.AI beïnvloed?
Milieuplanning is een bijzonder uitdagend domein, omdat u moet omgaan met zowel verschillende sets menselijke behoeften als de natuurlijke wereld. De algemene oplossing die ik vroeg leerde, was om een methode genaamd participatory planning te combineren met de technologieën van remote sensing en GIS. Voordat we een actieplan vaststelden, maakten we meerdere scenario’s en simuleerden we hun positieve en negatieve gevolgen in de computer met behulp van visualisaties. Het gebruik van participatory processen stelde ons in staat om verschillende soorten expertise te combineren en zeer complexe problemen op te lossen.
Hoewel we geen milieuplanning doen bij HEAVY.AI, werkt dit patroon nog steeds heel goed in bedrijfsomgevingen. Dus we helpen klanten bij het construeren van digitale tweelingen van belangrijke onderdelen van hun bedrijf en laten hen snel bedrijfsscenario’s maken en evalueren.
Ik denk dat mijn onderwijzervaring me diepe empathie heeft gegeven voor softwaregebruikers, vooral van complexe softwaresystemen. Waar één student ergens over struikelt, is toeval, maar waar tientallen of honderden mensen soortgelijke fouten maken, weet u dat u een ontwerpprobleem heeft. Misschien is mijn favoriete deel van software-ontwerp het nemen van deze inzichten en het toepassen ervan bij het ontwerpen van nieuwe generaties systemen.
Kunt u uitleggen hoe HeavyIQ natuurlijke taalverwerking gebruikt om data-exploratie en visualisatie te faciliteren?
Deze dagen lijkt het erop dat iedereen en zijn broer een nieuwe genAI-model aanprijst, waarvan de meeste vergetelijke klonen van elkaar zijn. Wij hebben een heel andere weg bewandeld. Wij geloven dat nauwkeurigheid, reproduceerbaarheid en privacy essentiële kenmerken zijn voor elk bedrijfsanalyse-instrument, inclusief die gegenereerd met grote taalmodellen (LLM’s). Dus hebben we die op een fundamenteel niveau in onze aanbod opgenomen. Bijvoorbeeld, wij beperken modelinput strikt tot ondernemingsdatabases en om documenten binnen een ondernemingsbeveiligingsperimeter te bieden. Wij beperken output ook tot de laatste HeavySQL en Charts. Dat betekent dat, wat voor vraag u ook stelt, wij zullen proberen om die te beantwoorden met uw gegevens en wij zullen u exact laten zien hoe wij dat antwoord hebben afgeleid.
Met die garanties op hun plaats, maakt het minder uit voor onze klanten hoe wij de queries precies verwerken. Maar achter de schermen is een ander belangrijk verschil met consumenten-genAI dat wij de modellen uitgebreid fijn afstemmen op de specifieke soorten vragen die bedrijfsgebruikers stellen aan bedrijfsgegevens, inclusief ruimtelijke gegevens. Dus is ons model bijvoorbeeld uitstekend in het uitvoeren van ruimtelijke en tijdsreeksjoins, die niet in klassieke SQL-benchmarks zitten, maar die onze gebruikers dagelijks gebruiken.
Wij verpakken deze kernfunctionaliteiten in een Notebook-interface die wij HeavyIQ noemen. IQ gaat over het maken van data-exploratie en visualisatie zo intuïtief mogelijk door middel van natuurlijke taalverwerking (NLP). U stelt een vraag in het Engels – zoals “Wat waren de weerspatronen in Californië vorige week?” – en HeavyIQ vertaalt dat in SQL-queries die onze GPU-versnelde database snel verwerkt. De resultaten worden niet alleen als gegevens, maar ook als visualisaties weergegeven – kaarten, grafieken, wat het meest relevant is. Het gaat erom om snelle, interactieve query’s mogelijk te maken, vooral bij het omgaan met grote of snel veranderende datasets. Wat hierbij essentieel is, is dat het vaak niet de eerste vraag is die u stelt, maar misschien de derde, die echt tot de kerninzicht komt, en HeavyIQ is ontworpen om die diepere exploratie te faciliteren.
Wat zijn de primaire voordelen van het gebruik van HeavyIQ boven traditionele BI-hulpmiddelen voor telecom, nutsbedrijven en overheidsinstanties?
HeavyIQ blinkt uit in omgevingen waarbij u te maken krijgt met grote, hoge snelheidsgegevens – precies het soort gegevens dat telecom, nutsbedrijven en overheidsinstanties hanteren. Traditionele business intelligence-hulpmiddelen hebben vaak moeite met het volume en de snelheid van deze gegevens. Bijvoorbeeld, in de telecommunicatie kunt u miljarden oproeprecords hebben, maar het zijn de kleine fractie van afgebroken oproepen waarop u zich moet concentreren. HeavyIQ laat u toe om door die gegevens 10 tot 100 keer sneller te zoeken dankzij onze GPU-infrastructuur. Deze snelheid, in combinatie met de mogelijkheid om interactief te doorzoeken en visualiseren, maakt het onmisbaar voor risicoanalyse in nutsbedrijven of real-time scenario-planning voor overheidsinstanties.
Het andere voordeel, dat hierboven al is genoemd, is dat ruimtelijke en temporele SQL-queries extreem krachtig zijn voor analyse – maar kunnen langzaam of moeilijk zijn om handmatig te schrijven. Wanneer een systeem op wat wij “de snelheid van de nieuwsgierigheid” noemen werkt, kunnen gebruikers zowel meer vragen als meer nuancevragen stellen. Dus kan een telecom-engineer bijvoorbeeld een tijdelijke piek in apparatuurfouten van een bewakingssysteem opmerken, het vermoeden hebben dat er iets mis is met een bepaald faciliteit en dat controleren met een ruimtelijke query die een kaart teruggeeft.
Wat zijn de maatregelen om metadata-lekken te voorkomen bij het gebruik van HeavyIQ?
Zoals hierboven beschreven, hebben wij HeavyIQ gebouwd met privacy en beveiliging in het hart. Dit omvat niet alleen gegevens, maar ook verschillende soorten metadata. Wij gebruiken kolom- en tabelniveau-metadata uitgebreid om te bepalen welke tabellen en kolommen de informatie bevatten die nodig is om een query te beantwoorden. Wij gebruiken ook interne bedrijfsdocumenten waar beschikbaar om te helpen bij wat bekend staat als retrieval-augmented generation (RAG). Tenslotte genereren de taalmodellen zelf verdere metadata. Van deze, maar vooral de laatste twee, kunnen van grote bedrijfsgevoeligheid zijn.
In tegenstelling tot derdenmodellen waarbij uw gegevens meestal naar externe servers worden verzonden, wordt HeavyIQ lokaal uitgevoerd op dezelfde GPU-infrastructuur als de rest van ons platform. Dit zorgt ervoor dat uw gegevens en metadata onder uw controle blijven, zonder enkel risico op lekken. Voor organisaties die de hoogste niveaus van beveiliging vereisen, kan HeavyIQ zelfs in een volledig geïsoleerde omgeving worden geïmplementeerd, waardoor gevoelige informatie nooit specifieke apparatuur verlaat.
Hoe bereikt HEAVY.AI hoge prestaties en schaalbaarheid met massive datasets met behulp van GPU-infrastructuur?
Het geheim zit eigenlijk in het vermijden van de gegevensoverdracht die in andere systemen aanwezig is. Bij de kern begint dit met een speciaal ontworpen database die vanaf de grond af is ontwikkeld om op NVIDIA-GPU’s te draaien. Wij hebben hier meer dan 10 jaar aan gewerkt en wij geloven echt dat wij de beste oplossing in onze klasse hebben als het gaat om GPU-versnelde analyse.
Zelfs de beste CPU-gebaseerde systemen raken al snel uitgeput, lang voordat een middelmatige GPU. De strategie zodra dit gebeurt op CPU vereist het distribueren van gegevens over meerdere kernen en vervolgens over meerdere systemen (zogenaamde ‘horizontale schaling’). Dit werkt goed in sommige contexten waar dingen minder tijdgevoelig zijn, maar wordt over het algemeen gebotteld op netwerkprestaties.
Naast het vermijden van al deze gegevensoverdracht bij queries, vermijden wij het ook bij veel andere gemeenschappelijke taken. De eerste is dat wij grafieken kunnen renderen zonder de gegevens te verplaatsen. Vervolgens, als u ML-inferentie-modellering wilt, doen wij dat ook zonder gegevensoverdracht. En als u de gegevens ondervraagt met een groot taalmodel, doen wij dat nog steeds zonder gegevensoverdracht. Zelfs als u een datawetenschapper bent en de gegevens wilt ondervragen vanuit Python, bieden wij methoden om dit te doen op GPU zonder gegevensoverdracht.
Wat dit in de praktijk betekent, is dat wij niet alleen queries, maar ook rendering 10 tot 100 keer sneller kunnen uitvoeren dan traditionele CPU-gebaseerde databases en kaartservers. Wanneer u te maken heeft met de massive, hoge snelheidsdatasets waar onze klanten mee werken – dingen als weersmodellen, telecom-oproeprecords of satellietbeelden – is dit soort prestatieverbetering absoluut essentieel.
Hoe houdt HEAVY.AI zijn concurrentievoordeel in de snel evoluerende landschap van big data-analyse en AI?
Dat is een geweldige vraag, en het is iets waar wij constant over nadenken. Het landschap van big data-analyse en AI evolueert met een ongelooflijk snel tempo, met nieuwe doorbraken en innovaties die constant gebeuren. Het doet zeker geen pijn dat wij een voorsprong van 10 jaar hebben op GPU-databasetechnologie.
Ik denk dat de sleutel voor ons is om ons te blijven concentreren op onze kernmissie – het democratiseren van toegang tot big, georuimtelijke gegevens. Dit betekent dat wij constant de grenzen van wat mogelijk is met GPU-versnelde analyse blijven pushen en ervoor zorgen dat onze producten ongeëvenaarde prestaties en mogelijkheden in dit domein leveren. Een groot deel hiervan is onze voortdurende investering in het ontwikkelen van aangepaste, fijngestemde taalmodellen die de nuances van spatial SQL en georuimtelijke analyse echt begrijpen.
Wij hebben een uitgebreide bibliotheek van trainingsgegevens opgebouwd, die verder gaat dan generieke benchmarks, om ervoor te zorgen dat onze conversational analytics-tools op een natuurlijke, intuïtieve manier met gebruikers kunnen communiceren. Maar wij weten ook dat technologie alleen niet genoeg is. Wij moeten in contact blijven met onze klanten en hun evoluerende behoeften. Ons concurrentievoordeel komt uiteindelijk neer op ons onvermoeibare focus op het leveren van transformatieve waarde aan onze gebruikers. Wij houden niet alleen gelijke tred met de markt – wij duwen de grenzen van wat mogelijk is met big data en AI. En wij zullen dat blijven doen, ongeacht hoe snel het landschap evolueert.
Hoe ondersteunt HEAVY.AI noodhulpinspanningen via HeavyEco?
Wij bouwden HeavyEco toen wij zagen dat sommige van onze grootste nutsbedrijfsklanten significante uitdagingen hadden bij het verwerken van de huidige weersmodeluitvoer, evenals het visualiseren ervan voor gezamenlijke vergelijkingen. Het duurde bij één klant tot vier uur om de gegevens alleen maar te laden, en wanneer u tegen snelle, extreme weersomstandigheden aan zit, zoals branden… dat is gewoon niet goed genoeg.
HeavyEco is ontworpen om real-time inzichten te bieden in hoogdringende situaties, zoals tijdens een bosbrand of overstroming. In dergelijke scenario’s moet u snel beslissingen nemen en gebaseerd op de beste beschikbare gegevens. Dus fungeert HeavyEco allereerst als een professioneel beheerd datapipeline voor autoritaire modellen zoals die van NOAA en USGS. Bovenop die modellen laat HeavyEco u scenario’s uitvoeren, gebouwimpact modelleren en gegevens in real-time visualiseren. Dit geeft eerstehulpverleners de kritieke informatie die ze nodig hebben wanneer het ertoe doet. Het gaat erom om complexe, grote datasets om te zetten in actiegerichte inzichten die onmiddellijke besluitvorming kunnen leiden.
Uiteindelijk is ons doel om onze gebruikers de mogelijkheid te geven om hun gegevens te onderzoeken op de snelheid van het denken. Of ze nu complexe ruimtelijke modellen uitvoeren, weersvoorspellingen vergelijken of proberen om patronen in georuimtelijke tijdsreeksen te identificeren, wij willen dat ze dit soepel kunnen doen, zonder enige technische barrières.
Wat onderscheidt de propriëtaire LLM van HEAVY.AI van andere derden-LLM’s in termen van nauwkeurigheid en prestaties?
Onze propriëtaire LLM is specifiek afgestemd op de soorten analyses waarop wij ons richten – zoals text-to-SQL en text-to-visualisatie. Wij hebben aanvankelijk traditionele derdenmodellen geprobeerd, maar vonden dat ze niet voldeden aan de hoge nauwkeurigheidsvereisten van onze gebruikers, die vaak kritische beslissingen nemen. Dus hebben wij een reeks open-source modellen fijngestemd en getest tegen industriebenchmarks.
Onze LLM is veel nauwkeuriger voor de geavanceerde SQL-concepten die onze gebruikers nodig hebben, met name in georuimtelijke en temporele gegevens. Bovendien, omdat het op onze GPU-infrastructuur draait, is het ook veiliger.
Naast de ingebouwde modelmogelijkheden bieden wij ook een volledig interactieve gebruikersinterface voor beheerders en gebruikers om domein- of bedrijfsrelevante metadata toe te voegen. Bijvoorbeeld, als het basismodel niet naar verwachting presteert, kunt u kolomniveau-metadata importeren of aanpassen, of richtingsinformatie toevoegen en meteen feedback krijgen.
Hoe ziet HEAVY.AI de rol van georuimtelijke en temporele data-analyse in de toekomst van verschillende industrieën?
Wij geloven dat georuimtelijke en temporele data-analyse cruciaal zullen zijn voor de toekomst van veel industrieën. Wat wij ons echt concentreren op, is het helpen van onze klanten bij het nemen van betere beslissingen, sneller. Of u nu in de telecom, nutsbedrijven of overheid zit, of andere – het hebben van de mogelijkheid om gegevens in real-time te analyseren en visualiseren, kan een game-changer zijn.
Ons doel is om dit soort krachtige analyses toegankelijk te maken voor iedereen, niet alleen voor de grote spelers met enorme middelen. Wij willen ervoor zorgen dat onze klanten de gegevens die ze hebben, kunnen gebruiken om voorop te blijven en problemen op te lossen zodra ze zich voordoen. Naarmate de gegevens blijven groeien en complexer worden, zien wij onze rol als het zorgen dat onze tools mee evolueren, zodat onze klanten altijd klaar zijn voor wat er maar komt.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten bezoeken HEAVY.AI.












