Interviews
Jorge Torres, Co-founder & CEO van MindsDB – Interview Series

Jorge Torres is de Co-founder & CEO van MindsDB, een platform dat iedereen helpt om de kracht van machine learning te gebruiken om voorspellende vragen te stellen aan hun data en nauwkeurige antwoorden te ontvangen. MindsDB is ook afgestudeerd aan YCombinator’s recente Winter 2020-batch en werd onlangs erkend als een van de meest veelbelovende AI-bedrijven van Amerika door Forbes.
Wat trok je aanvankelijk aan bij machine learning?
Het is een interessant verhaal. In 2008 woonde en werkte ik in Berkeley voor een startup genaamd Couchsurfing en ik zag deze klas, (cs188- Inleiding tot AI). Hoewel ik niet was aangesloten bij de universiteit op dat moment, vroeg ik de prof. John DeNero of ik kon deelnemen aan een klas en hij stond het toe. Deze professor was briljant en hij maakte iedereen verliefd op het onderwerp. Het was het beste dat me ooit is overkomen. Ik was verbaasd dat computers konden leren om een probleem op te lossen, ik realiseerde me dat dit snel in ontwikkeling was en besloot om het mijn carrière te maken.
Er zijn een paar generatie-definierende gebeurtenissen in technologie die maar een paar keer in een mensenleven voorkomen. Ik was gelukkig genoeg om getuige te zijn van de geboorte van het internet, maar was te jong om iets anders te zijn dan een passieve toeschouwer. Ik geloof dat Machine Learning die volgende generatie-definierende gebeurtenis is en ik wilde er op een betekenisvolle manier aan deelnemen om de technologie en de manier waarop we het gebruiken vooruit te helpen.
MindsDB begon in 2018 op UC Berkeley, kun je wat inzicht delen uit die vroege dagen?
UC Berkeley is een van de werelds grootste onderzoeksinstellingen en heeft een geschiedenis van het creëren en ondersteunen van open-source software, en we dachten dat er geen betere plek was om MindsDB te starten. Onze waarden waren gelijk, ze boden ons onze eerste cheque aan via de UC Berkeley Skydeck Accelerator en de rest is geschiedenis.
De vroege dagen waren niet veel anders dan die van veel startups in de Bay-regio – drie mensen die lange uren werkten aan iets waar ze allemaal in geloofden, maar dat slechts een kleine kans van slagen had. Het enige verschil is dat we in plaats van in een stoffige garage in Palo Alto in de relatieve comfort van de Skydeck Penthouse co-working space (huur vrij) zaten.
Ik geloof dat er enorm veel kracht zit in data. Hoe meer een bedrijf heeft, hoe meer ze in staat zijn om hun bedrijven vooruit te helpen. Maar alleen als ze in staat zijn om betekenisvolle inzichten te krijgen uit hun data.
In de herfst van 2017 kwamen mijn beste vriend Adam Carrigan (COO) en ik tot de conclusie dat te veel bedrijven beperkingen ondervonden bij het extraheren van betekenisvolle informatie uit hun data. Ze realiseerden zich dat een van de grootste beperkingen was in de manier waarop veel van deze bedrijven de kracht van kunstmatige intelligentie ernstig onderbenutten. We geloofden dat machine learning data en de intelligentie die het kan bieden toegankelijk kon maken voor iedereen. Daarom ontwierpen we een platform dat het iedereen mogelijk maakt om de kracht van machine learning te gebruiken om voorspellende vragen te stellen aan hun data en nauwkeurige antwoorden te ontvangen.
We noemen dit platform MindsDB en zijn gericht op het blijven maken van het ontzettend gemakkelijk voor ontwikkelaars om snel de volgende golf van AI-gecentreerde applicaties te creëren die de manier waarop we leven en werken zullen transformeren en voor bedrijven om informatie uit hun data te halen.
Waarom richtte MindsDB zich op het oplossen van het probleem van being data centric in plaats van machine learning centric?
Als je kijkt naar de overgrote meerderheid van het onderzoek in AI, komt een groot percentage uit academische instellingen. ML is historisch gezien model-gecentreerd omdat dit is waar onderzoeksinstellingen waarde kunnen toevoegen; meer onderzoek verbetert modellen of creëert nieuwe, waardoor betere resultaten worden behaald. Data-gecentreerd zijn, aan de andere kant, het toevoegen van betere kwaliteit/more relevante data aan een bestaande benadering is niet gemakkelijk publiceerbaar (de belangrijkste KPI voor onderzoekers).
Echter, de overgrote meerderheid van de toegepaste machine learning-problemen van vandaag profiteren veel meer van verbeterde data dan van verbeterde modellen. Dit komt ook overeen met onze missie om machine learning te democratiseren, de overgrote meerderheid van de mensen buiten de ML-ruimte weten niet veel over ML, maar ze weten zeker veel over hun data.
We zagen dat er twee soorten bedrijven waren, aan de ene kant bedrijven met data in de database, aan de andere kant bedrijven die nog niet hebben ontdekt dat databases bestaan, we realiseerden ons dat als een bedrijf al databases had, hun datamaturiteit had hen al op de goede weg gezet om machine learning toe te passen, terwijl bedrijven die databases nog niet hadden ontdekt, nog een lange weg te gaan hadden, dus richtten we ons op het bieden van waarde voor diegenen die het konden extraheren.
Hoe benadert MindsDB modellering en implementatie in plain SQL?
We creëren representaties van modellen als tabellen die kunnen worden doorgezocht, dus effectief verwijderen we het concept van ‘implementatie’ uit het beeld. Wanneer je een database maakt met CREATE VIEW, is die view live zodra het commando is verwerkt, hetzelfde geldt wanneer je CREATE MODEL in MindsDB doet.
Mensen houden van MindsDB vanwege de vereenvoudiging die jullie hebben gebracht in de ML-Ops-levenscyclus, waarom is het vereenvoudigen van machine learning-implementatie zo belangrijk?
Mensen houden ervan omdat het overbodige ETL-pijpleidingen abstracteert, dus minder dingen om te onderhouden. Ons doel is om gebruikers te laten profiteren van de waarde van machine learning, door niet na te denken over het onderhouden van de ML-infrastructuur als ze al data-infrastructuur onderhouden.
Wat zijn enkele van de voordelen en risico’s van een open-source-startup versus een traditionele startup?
Een Open Source-project kan beginnen met slechts een idee, en mensen zullen je helpen om het op te bouwen onderweg, op de gesloten aanpak moet je beginnen met dezelfde aannamen, maar je moet wel gelijk hebben, want niemand zal je helpen om je product te verbeteren (tenminste niet in hetzelfde volume als in open source), denk aan open source als een collaboratief productgebruikersbenadering.
MindsDB heeft onlangs 16,5 miljoen dollar aan Series A-investeringen ontvangen van Benchmark, waarom is Benchmark de perfecte investeerder en hoe komt hun visie overeen met die van jullie?
Benchmark heeft een onberispelijke staat van dienst in onze industrie, Chetan heeft geholpen bij het opbouwen van bedrijven als mongodb, elastic, airbyte tot wereldleiders in hun domein. We geloven dat er geen betere match is voor MindsDB dan Chetan en Benchmark Capital.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten MindsDB bezoeken.












