Interviews
Dr. Mike Flaxman, VP of Product at HEAVY.AI – Interview Serie

Dr. Mike Flaxman er i øjeblikket VP of Product at HEAVY.AI, efter tidligere at have været Product Manager og have ledet Spatial Data Science-praksis i Professional Services. Han har brugt de sidste 20 år på at arbejde med rumlig miljøplanlægning. Før HEAVY.AI grundlagde han Geodesign Technologies, Inc. og var medstifter af GeoAdaptive LLC, to startups, der anvender rumlige analyse-teknologier til planlægning. Før startup-livet var han professor i planlægning på MIT og Industry Manager på ESRI.
HEAVY.AI er en hardware-accelereret platform til realtid, høj-impact data-analyse. Den udnytter både GPU- og CPU-behandling til at forespørge massive datasets hurtigt, med støtte til SQL og georumlige data. Platformen indeholder visuelle analyseværktøjer til interaktive dashboards, krydsfiltrering og skalerbar data-visning, der muliggør effektiv big data-analyse på tværs af forskellige brancher.
Kan du fortælle os om din professionelle baggrund og hvad der førte dig til at tilslutte dig HEAVY.AI?
Før jeg tilsluttede mig HEAVY.AI, tilbragte jeg år i akademiet, hvor jeg underviste i rumlige analyser på MIT. Jeg drev også en lille konsulentvirksomhed med en række offentlige kunder. Jeg har været involveret i GIS-projekter i 17 lande. Mit arbejde har ført mig fra at rådgive organisationer som Inter American Development Bank til at styre GIS-teknologi til arkitektur, ingeniørvidenskab og konstruktion på ESRI, verdens største GIS-udvikler.
Jeg husker tydeligt min første oplevelse med, hvad der nu er HEAVY.AI, som var, da jeg som konsulent var ansvarlig for scenarieplanlægning for Florida Beaches Habitat Conservation Program. Mine kolleger og jeg havde svært ved at modelere havskildpads-habitat ved hjælp af 30m Landsat-data, og en ven pegede på nogle helt nye og meget relevante data – 5cm LiDAR. Det var præcis, hvad vi havde brug for videnskabeligt, men noget, der var cirka 3600 gange større end det, vi havde planlagt at bruge. Det var tydeligt, at ingen ville øge min budget med så meget som en brøkdel af det beløb. Så den dag lagde jeg værktøjerne, jeg havde brugt og undervist i i flere årtier, og gik på udkig efter noget nyt. HEAVY.AI gennemskar og visualiserede disse data så glat og uden besvær, at jeg var øjeblikkeligt fanget.
I takt med, at årene går, mener jeg stadig, at HEAVY.AI gør noget ret unikt, og deres tidlige indsats på GPU-analyse var præcis, hvor branchen stadig har brug for at gå. HEAVY.AI er fast fokuseret på at demokratisere adgangen til big data. Dette indebærer både data-volumen og proceshastighedskomponenten, hvilket grundlæggende giver alle deres egen supercomputer. Men en stadig vigtigere aspekt med indførelsen af store sprogmodeller er at gøre rumlig modelering tilgængelig for mange flere mennesker. I disse dage kan du i stedet for at bruge år på at lære et komplekst interface med tusindvis af værktøjer bare begynde en samtale med HEAVY.AI på det sprog, du foretrækker. Programmet genererer ikke kun de nødvendige kommandoer, men præsenterer også relevante visualiseringer.
Bag scenen er det naturligvis meget svært at levere brugervenlighed. Som VP of Product Management på HEAVY.AI er jeg meget involveret i at bestemme, hvilke funktioner og muligheder vi prioriterer for vores produkter. Min omfattende baggrund inden for GIS giver mig en rigtig god forståelse for vores kunders behov og guide vores udviklingsvejledning derefter.
Hvordan har din tidligere erfaring inden for rumlig miljøplanlægning og startups påvirket dit arbejde på HEAVY.AI?
Miljøplanlægning er et særligt udfordrende område, hvor du skal tage hensyn til både menneskelige behov og den naturlige verden. Den generelle løsning, jeg lærte tidligt, var at parre en metode kaldet deltagende planlægning med teknologierne for fjernsanering og GIS. Før vi fastlagde en handlingsplan, lavede vi flere scenarier og simulerede deres positive og negative virkninger på computeren ved hjælp af visualiseringer. Ved at bruge deltagende processer kunne vi kombinerer forskellige former for ekspertise og løse meget komplekse problemer.
Selv om vi ikke typisk laver miljøplanlægning på HEAVY.AI, fungerer denne mønster stadig meget godt i forretningsmæssige sammenhænge. Så vi hjælper kunder med at konstruere digitale tvillinger af nøgledele af deres forretning, og vi lader dem oprette og evaluere forretnings-scenarier hurtigt.
Jeg antager, at min undervisningserfaring har givet mig dyb empati for software-brugere, især af komplekse software-systemer. Hvor ét studerende snubler på ét sted er tilfældigt, ved du, du har et designproblem, hvis hundredvis af mennesker begår lignende fejl. Måske er mit yndlingsaspekt af software-design at tage disse erfaringer og anvende dem i design af nye generationer af systemer.
Kan du forklare, hvordan HeavyIQ udnytter naturlig sprogbehandling til at lette data-undersøgelse og visualisering?
I disse dage synes det, som om alle og deres bror praler af en ny genAI-model, de fleste af dem er glemte kloner af hinanden. Vi har valgt en meget anderledes vej. Vi mener, at nøjagtighed, reproducerbarhed og privatliv er essentielle egenskaber for alle forretningsanalyseværktøjer, herunder dem, der genereres med store sprogmodeller (LLM’er). Så vi har bygget disse ind i vores tilbud på et grundlæggende niveau. For eksempel begrænser vi modelinddata strengt til virksomhedsdatabaser og til at give dokumenter inden for en virksomheds-sikkerhedsperimeter. Vi begrænser også output til den seneste HeavySQL og Charts. Det betyder, at uanset hvilket spørgsmål du stiller, vil vi prøve at besvare det med dine data, og vi vil vise dig præcis, hvordan vi fik det svar.
Med disse garantier på plads, er det mindre vigtigt for vores kunder, præcis hvordan vi behandler forespørgslene. Men bag scenen er en anden vigtig forskel i forhold til forbruger-genAI, at vi finjusterer modeller omfattende mod de specifikke typer af spørgsmål, som forretningsbrugere stiller til forretningsdata, herunder rumlige data. Så for eksempel er vores model fremragende til at udføre rumlige og tidsmæssige sammenføjninger, som ikke er i klassiske SQL-benchmarks, men vores brugere bruger dagligt.
Vi pakker disse kernefunktioner ind i en Notebook-grænseflade, som vi kalder HeavyIQ. IQ handler om at gøre data-undersøgelse og visualisering så intuitivt som muligt ved at bruge naturlig sprogbehandling (NLP). Du stiller et spørgsmål på engelsk – som “Hvad var vejrforholdene i Californien sidste uge?” – og HeavyIQ oversætter det til SQL-forespørgsler, som vores GPU-accelereret database behandler hurtigt. Resultaterne præsenteres ikke kun som data, men også som visualiseringer – kort, diagrammer, hvad som helst, der er mest relevant. Det handler om at muliggøre hurtig, interaktiv forespørgsel, især når du har at gøre med store eller hurtigt flydende datasets. Det, der er nøgleher, er, at det ofte ikke er det første spørgsmål, du stiller, men måske det tredje, der virkelig kommer til kernen af indsigt, og HeavyIQ er designet til at lette denne dybere undersøgelse.
Hvad er de primære fordele ved at bruge HeavyIQ over traditionelle BI-værktøjer til telekommunikation, utilities og regeringsinstitutioner?
HeavyIQ udmærker sig i miljøer, hvor du har at gøre med store, højhastighedsdata – præcis den type data, som telekommunikations-, utilities- og regeringsinstitutioner behandler. Traditionelle business intelligence-værktøjer kæmper ofte med datavolumen og -hastighed. For eksempel kan du i telekommunikation have milliarder af opkaldsoptegnelser, men det er den lille brøkdel af afbrudte opkald, du skal fokusere på. HeavyIQ giver dig mulighed for at sieve gennem disse data 10 til 100 gange hurtigere takket være vores GPU-infrastruktur. Denne hastighed kombineret med evnen til interaktiv forespørgsel og visualisering gør det uvurderligt for risikoanalyse i utilities eller realtids-scenarieplanlægning for regeringsinstitutioner.
Den anden fordel, der allerede er nævnt ovenfor, er, at rumlige og tidsmæssige SQL-forespørgsler er ekstremt kraftfulde analytisk – men kan være langsomme eller svære at skrive i hånden. Når et system opererer på, hvad vi kalder “curiositets-hastighed”, kan brugere stille både flere spørgsmål og mere nuancerede spørgsmål. Så for eksempel kan en telekommunikationsingeniør bemærke en tidsmæssig stigning i udstyrsfejl fra et overvågningsystem, have en intuition om, at noget er galt på en bestemt facilitet, og tjekke dette med en rumlig forespørgsel, der returnerer et kort.
Hvad er foranstaltninger for at forhindre metadata-lækage, når du bruger HeavyIQ?
Som beskrevet ovenfor har vi bygget HeavyIQ med privatliv og sikkerhed som kerne. Dette inkluderer ikke kun data, men også flere typer metadata. Vi bruger kolonne- og tabel-niveau-metadata omfattende til at bestemme, hvilke tabeller og kolonner indeholder den nødvendige information til at besvare en forespørgsel. Vi bruger også interne virksomhedsdokumenter, hvor det er muligt, til at hjælpe med, hvad der kaldes retrieval-augmented generation (RAG). Endelig genererer sprogmodellerne selv yderligere metadata. Alle disse, men især de sidste to, kan være af høj forretnings-sensitivitet.
I modsætning til tredjepartsmodeller, hvor dine data typisk sendes til eksterne servere, kører HeavyIQ lokalt på samme GPU-infrastruktur som resten af vores platform. Dette sikrer, at dine data og metadata forbliver under din kontrol, uden risiko for lækage. For organisationer, der kræver de højeste sikkerhedsniveauer, kan HeavyIQ endda installeres i en fuldstændig luft-lukket miljø, så følsomme oplysninger aldrig forlader bestemt udstyr.
Hvordan opnår HEAVY.AI høj ydelse og skalerbarhed med massive datasets ved hjælp af GPU-infrastruktur?
Hemmeligheden ligger grundlæggende i at undgå data-bevægelse, der er almindelig i andre systemer. Ved sin kerne starter dette med en formål-bygget database, der er designet fra bunden til at køre på NVIDIA-GPU’er. Vi har arbejdet på dette i over 10 år nu, og vi mener virkelig, at vi har den bedste løsning, når det kommer til GPU-accelereret analyse.
Selv de bedste CPU-baserede systemer løber tør for damp langt før en middelmådig GPU. Strategien, når dette sker på CPU, kræver at distribuere data over flere kerner og derefter flere systemer (såkaldt “horisontal skalerbarhed”). Dette fungerer godt i visse sammenhænge, hvor tingene er mindre tidskritiske, men generelt begynder at blive begrænset af netværkspræstation.
Foruden at undgå all denne data-bevægelse på forespørgsler undgår vi det også på mange andre almindelige opgaver. Først kan vi rendre grafik uden at flytte data. Derefter, hvis du ønsker ML-inferens-model, gør vi det igen uden data-bevægelse. Og hvis du afhører data med en stor sprogmodel, gør vi det igen uden data-bevægelse. Selv hvis du er en data-videnskabsmand og ønsker at afhøre data fra Python, giver vi også metoder til at gøre dette på GPU uden data-bevægelse.
Det, det betyder i praksis, er, at vi kan udføre ikke kun forespørgsler, men også rendering 10 til 100 gange hurtigere end traditionelle CPU-baserede databaser og kort-servere. Når du har at gøre med de massive, højhastigheds-datasets, som vores kunder arbejder med – som vejrmodeller, telekommunikations-opkaldsoptegnelser eller satellitbilleder – er denne ydelsesforbedring absolut afgørende.
Hvordan opretholder HEAVY.AI sin konkurrenceevne i det hurtigt udviklende landskab af big data-analyse og AI?
Det er et godt spørgsmål, og det er noget, vi tænker over konstant. Landskabet af big data-analyse og AI udvikler sig i en ekstremt hurtig takt, med nye gennembrud og innovationer, der sker hele tiden. Det gør bestemt ikke noget skade, at vi har en 10-års føring på GPU-databaseteknologi.
Jeg mener, at det afgørende for os er at forblive fokuseret på vores kerne-mission – at demokratisere adgangen til big, georumlige data. Det betyder konstant at skubbe grænserne for, hvad der er muligt med GPU-accelereret analyse, og sikre, at vores produkter leverer en uovertruffen ydelse og kapaciteter i dette domæne. En stor del af det er vores fortsatte investering i udvikling af brugerdefinerede, finjusterede sprogmodeller, der virkelig forstår nuancerne af rumlig SQL og georumlig analyse.
Vi har opbygget en omfattende bibliotek af træningsdata, der går langt ud over generiske benchmarks, for at sikre, at vores konversationsanalyseværktøjer kan engagere sig med brugere på en naturlig, intuitiv måde. Men vi ved også, at teknologi alene ikke er nok. Vi må forblive dybt forbundet med vores kunder og deres udviklende behov. Til sidst kommer vores konkurrenceevne til at afhænge af vores uophørlige fokus på at levere transformerende værdi til vores brugere. Vi er ikke bare med til at holde trit med markedet – vi skubber grænserne for, hvad der er muligt med big data og AI. Og vi vil fortsætte med det, uanset hvor hurtigt landskabet udvikler sig.
Hvordan støtter HEAVY.AI nød-hjælpsindsatsen gennem HeavyEco?
Vi byggede HeavyEco, da vi så, at nogle af vores største kunder havde betydelige udfordringer med bare at indtage i dag’s vejrmodellernes output, såvel som at visualisere dem til sammenligning. Det tog en kunde op til fire timer bare at indlæse data, og når du er op imod hurtigt flydende ekstreme vejrforhold som brand… det er bare ikke godt nok.
HeavyEco er designet til at give realtids-indsigter i høj-konsekvens-situationer, som under en brand eller oversvømmelse. I sådanne situationer har du brug for at træffe beslutninger hurtigt og baseret på den bedste mulige data. Så HeavyEco fungerer først og fremmest som en professionelt styret data-pipeline til autoritative modeller som dem fra NOAA og USGS. Oven på disse giver HeavyEco dig mulighed for at køre scenarier, byggeværks-påvirkning og visualisere data i realtid. Dette giver førstehjælperne den kritiske information, de har brug for, når det gælder. Det handler om at omdanne komplekse, store datasets til handlebar indsigt, der kan guide øjeblikkelig beslutning.
Til sidst er vores mål at give vores brugere mulighed for at udforske deres data i tanke-hastighed. Uanset om de kører komplekse rumlige modeller, sammenligner vejrprognoser eller forsøger at identificere mønstre i georumlige tidsrækker, vil vi have dem til at kunne gøre det uden besvær, uden tekniske barrierer i vejen.
Hvad adskiller HEAVY.AIs proprietære LLM fra andre tredjeparts-LLM’er i forhold til nøjagtighed og ydelse?
Vores proprietære LLM er specifikt tilpasset til den type analyse, vi fokuserer på – som tekst-til-SQL og tekst-til-visualisering. Vi prøvede oprindeligt traditionelle tredjeparts-modeller, men fandt, at de ikke opfyldte de høje nøjagtighedskrav, vores brugere havde, der ofte træffer kritiske beslutninger. Så vi finjusterede en række åbne kilde-modeller og testede dem mod industriel benchmarks.
Vores LLM er langt mere præcis for de avancerede SQL-koncepter, vores brugere har brug for, især i georumlige og tidsmæssige data. Derudover, da den kører på vores GPU-infrastruktur, er den også mere sikker.
Foruden de indbyggede model-kapaciteter giver vi også en fuld interaktiv brugergrænseflade for administratorer og brugere til at tilføje domæne- eller forretnings-relevant metadata. For eksempel, hvis grundmodellen ikke fungerer, som forventet, kan du importere eller justere kolonne-niveau-metadata eller tilføje vejledningsinformation og få feedback med det samme.
Hvordan ser HEAVY.AI på rollen af georumlig og tidsmæssig data-analyse i at forme fremtiden for forskellige brancher?
Vi mener, at georumlig og tidsmæssig data-analyse vil være afgørende for fremtiden for mange brancher. Det, vi er fokuseret på, er at hjælpe vores kunder med at træffe bedre beslutninger, hurtigere. Uanset om du er i telekommunikation, utilities eller regering, eller andet – at have mulighed for at analysere og visualisere data i realtid kan være en game-changer.
Vores mission er at gøre denne type kraftfuld analyse tilgængelig for alle, ikke kun de store spillere med massive ressourcer. Vi vil sikre, at vores kunder kan udnytte de data, de har, for at forblive foran og løse problemer, når de opstår. Da data fortsætter med at vokse og blive mere komplekst, ser vi vores rolle som at sikre, at vores værktøjer udvikler sig lige så hurtigt, så vores kunder altid er forberedt på, hvad der kommer herefter.
Tak for det gode interview, læsere, der ønsker at lære mere, skal besøge HEAVY.AI.












