Interviews
Jorge Torres, co-fondateur et PDG de MindsDB – Série d'interviews

Jorge Torres, est le co-fondateur et PDG de EspritsDB, une plateforme qui permet à chacun d'exploiter la puissance de l'apprentissage automatique pour poser des questions prédictives à partir de ses données et obtenir des réponses précises. MindsDB est également diplômé de la récente promotion d'hiver 2020 de YCombinator et a récemment été reconnu par Forbes comme l'une des entreprises d'IA les plus prometteuses d'Amérique.
Qu'est-ce qui vous a initialement attiré vers l'apprentissage automatique ?
C'est une histoire intéressante. En 2008, je vivais et travaillais à Berkeley pour une startup appelée Couchsurfing et j'ai vu ce cours (cs188- Introduction à l'IA). Bien que je n'étais pas affilié à l'université à l'époque, j'ai demandé au prof. John DeNero si je pouvais assister à un cours et il m'a permis de le faire. Ce professeur était brillant et il a vraiment fait tomber tout le monde amoureux du sujet. C'est la meilleure chose qui me soit arrivée. J'ai été étonné que les ordinateurs puissent apprendre à résoudre un problème, j'ai réalisé que cela avançait rapidement et j'ai décidé d'en faire mon métier.
Il y a quelques événements générationnels déterminants dans la technologie qui ne se produisent que quelques fois dans une vie. J'ai eu la chance d'être témoin de la naissance d'Internet, mais j'étais bien trop jeune pour être autre chose qu'un observateur passif. Je crois que l'apprentissage automatique est cet événement générationnel de la prochaine génération, et je voulais en faire partie de manière significative pour faire avancer la technologie et la façon dont nous l'utilisons.
MindsDB a commencé à UC Berkeley en 2018, pourriez-vous partager un aperçu de ces premiers jours ?
L'UC Berkeley est l'un des plus grands établissements de recherche au monde et possède une longue tradition de création et de soutien de logiciels open source. Nous avons donc pensé qu'il n'y avait pas de meilleur endroit pour lancer MindsDB. Nos valeurs étaient en phase, ils nous ont offert notre premier essai via l'UC Berkeley Skydeck Accelerator et le reste appartient à l'histoire.
Les premiers jours n'étaient pas sans rappeler de nombreuses startups de la région de la baie - Trois personnes travaillant de longues heures sur quelque chose en quoi elles croyaient toutes, mais n'avaient qu'une petite chance de succès. La seule différence est que plutôt que de travailler dans un garage poussiéreux à Palo Alto, nous étions dans le confort relatif de l'espace de coworking Skydeck Penthouse (loyer gratuit).
Je crois que les données ont un pouvoir énorme. Plus une entreprise en possède, plus elle est capable de propulser ses activités. Mais seulement si elle est capable d'en tirer des informations pertinentes.
À l'automne 2017, mon meilleur ami Adam Carrigan (COO) et moi-même sommes arrivés à la conclusion que trop d'entreprises étaient confrontées à des limites lorsqu'il s'agissait d'extraire des informations significatives de leurs données. Ils ont réalisé que l'une des plus grandes limites était le nombre de ces entreprises qui sous-utilisaient gravement la puissance de l'intelligence artificielle. Nous pensions que l'apprentissage automatique pouvait rendre les données et l'intelligence qu'elles peuvent fournir accessibles à tous. C'est pourquoi nous avons conçu une plate-forme qui permettrait à quiconque d'utiliser la puissance de l'apprentissage automatique pour poser des questions prédictives sur ses données et en recevoir des réponses précises.
Nous appelons cette plate-forme MindsDB et nous nous efforçons de continuer à rendre incroyablement facile pour les développeurs de créer rapidement la prochaine vague d'applications centrées sur l'IA qui transformeront notre façon de vivre et de travailler et pour les entreprises d'extraire des informations de leurs données.
Pourquoi MindsDB s'est-il concentré sur la résolution du problème d'être centré sur les données plutôt que sur l'apprentissage automatique ?
Si vous regardez la grande majorité de la recherche en IA, un grand pourcentage provient d'institutions universitaires. Le ML a toujours été centré sur le modèle, car c'est là que les institutions de recherche peuvent ajouter de la valeur perçue ; plus de recherche améliore les modèles ou en crée de nouveaux, produisant ainsi de meilleurs résultats. Étant centré sur les données, en revanche, l'ajout de données de meilleure qualité/plus pertinentes à une approche existante n'est pas facilement publiable (le KPI clé pour les chercheurs).
Cependant, la grande majorité des problèmes d'apprentissage automatique appliqués aujourd'hui bénéficient bien plus de données améliorées que de modèles améliorés. Cela s'inscrit également dans notre mission de démocratisation de l'apprentissage automatique : la grande majorité des personnes extérieures au domaine de l'apprentissage automatique n'y connaissent pas grand-chose, mais en savent certainement beaucoup sur leurs données.
Nous avons vu qu'il y avait deux types d'entreprises, d'un côté les entreprises avec des données dans la base de données, de l'autre les entreprises qui n'avaient pas encore compris les bases de données, nous nous sommes rendu compte que si une entreprise était sur le groupe de bases de données, leurs données la maturité les avait déjà mis sur la bonne voie pour pouvoir vraiment appliquer l'apprentissage automatique, alors que les entreprises qui n'avaient pas encore découvert les bases de données avaient encore un long chemin à parcourir, nous nous sommes donc concentrés sur la création de valeur pour ceux qui pouvaient réellement l'extraire.
Comment MindsDB aborde-t-il la modélisation et le déploiement en SQL brut ?
Nous créons des représentations de modèles sous forme de tables qui peuvent être interrogées, de sorte que nous supprimons efficacement le concept de « déploiement » de l'image. Lorsque vous tapez sur une base de données CREATE VIEW, cette vue est en direct lorsque la commande est terminée, même chose lorsque vous faites CREATE MODEL dans mindsdb.
Les gens aiment MindsDB en raison de la simplification que vous avez apportée au cycle de vie ML-Ops, pourquoi la simplification du déploiement de l'apprentissage automatique est-elle si importante ?
Les gens l'adorent parce qu'il supprime les pipelines ETL inutiles, donc moins de choses à maintenir. Notre objectif est d'amener les utilisateurs à extraire la valeur de l'apprentissage automatique, en ne pensant pas à maintenir l'infrastructure ML s'ils maintiennent déjà l'infrastructure de données.
Quels sont les avantages et les risques d'ĂŞtre une start-up open source par rapport Ă une start-up traditionnelle ?
Un projet Open Source peut démarrer avec juste une idée, et les gens vous aideront à le construire en cours de route, sur l'approche de source proche, vous devez commencer avec les mêmes hypothèses mais vous feriez mieux d'avoir raison car personne ne va vous aider à améliorer votre produit (du moins pas dans le même volume que dans l'open source), considérez l'open source comme une approche collaborative adaptée à l'utilisateur du produit.
MindsDB récemment a levé une série A de 16.5 millions de dollars investissement de Benchmark, pourquoi Benchmark est-il l'investisseur idéal et comment sa vision correspond-elle à la vôtre ?
Benchmark a un dossier impeccable dans notre industrie, Chetan a aidé des entreprises comme mongodb, elastic, airbyte à devenir les leaders mondiaux dans leurs domaines. Nous pensons qu'il n'y a pas de meilleure solution pour MindsDB que Chetan et Benchmark Capital.
Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter EspritsDB.












