Wywiady
Jorge Torres, współzałożyciel i CEO MindsDB – Seria wywiadów

Jorge Torres jest współzałożycielem i CEO MindsDB, platformy, która umożliwia każdemu wykorzystanie mocy uczenia maszynowego do zadawania przewidywalnych pytań dotyczących danych i otrzymywania dokładnych odpowiedzi. MindsDB jest również absolwentem ostatniej zimowej klasy YCombinator 2020 i został niedawno uznany za jedną z najbardziej obiecujących firm AI w Ameryce przez Forbes.
Czym pierwotnie zainteresowało Cię uczenie maszynowe?
To ciekawa historia. W 2008 roku mieszkałem i pracowałem w Berkeley dla startupu o nazwie Couchsurfing i zobaczyłem ten kurs, (cs188 – Wprowadzenie do sztucznej inteligencji). Chociaż nie byłem związany z uczelnią w tym czasie, poprosiłem profesora Johna DeNero, czy mogę wziąć udział w zajęciach, i on pozwolił mi. Ten profesor był wybitny, i naprawdę sprawił, że wszyscy zakochali się w tym temacie. Było to najlepsze, co mi się przydarzyło. Byłem zdumiony, że komputery mogą nauczyć się rozwiązywać problemy, zrozumiałem, że to się rozwija bardzo szybko i postanowiłem zrobić z tego swoją karierę.
Istnieją pewne wydarzenia definiujące pokolenie w technologii, które zdarzają się tylko kilka razy w życiu. Byłem wystarczająco szczęśliwy, aby być świadkiem narodzin Internetu, ale byłem zbyt młody, aby być czymś więcej niż biernym obserwatorem. Uważam, że uczenie maszynowe to następne wydarzenie definiujące pokolenie, i chciałem być jego częścią w jakiś sposób, aby napędzać do przodu tę technologię i sposób, w jaki ją używamy.
MindsDB powstało na UC Berkeley w 2018 roku, czy mógłbyś podzielić się wiedzą z tych wczesnych dni?
UC Berkeley jest jedną z najlepszych instytucji badawczych na świecie i ma historię tworzenia i wspierania oprogramowania open-source, i myśleliśmy, że nie ma lepszego miejsca, aby zacząć MindsDB. Nasze wartości były zgodne, oferowali nam nasze pierwsze wsparcie finansowe przez UC Berkeley Skydeck Accelerator, a reszta, jak mówią, to historia.
Wczesne dni nie różniły się od wielu startupów w regionie Bay – trzy osoby pracowały długo nad czymś, w co wszystkie wierzyły, ale miały tylko małe szanse na sukces. Jedyna różnica polegała na tym, że zamiast pracować w kurzu w garażu w Palo Alto, byliśmy w relatywnie komfortowym Skydeck Penthouse co-working space (bez opłat).
Wierzę, że istnieje ogromna moc w danych. Im więcej danych ma firma, tym więcej może napędzać swoje interesy do przodu. Ale tylko wtedy, gdy są w stanie uzyskać znaczące spostrzeżenia z nich.
Jesienią 2017 roku mój najlepszy przyjaciel Adam Carrigan (COO) i ja doszliśmy do wniosku, że zbyt wiele firm napotyka ograniczenia, gdy próbują wydobyć znaczące informacje ze swoich danych. Zrozumieliśmy, że jednym z największych ograniczeń jest to, w jaki sposób wiele z tych firm wykorzystuje niewielką moc sztucznej inteligencji. Wierzyliśmy, że uczenie maszynowe może uczynić dane i inteligencję, którą mogą one dostarczyć, dostępnymi dla wszystkich. Dlatego zaprojektowaliśmy platformę, która pozwoli każdemu wykorzystać moc uczenia maszynowego do zadawania przewidywalnych pytań dotyczących swoich danych i otrzymywania dokładnych odpowiedzi.
Nazywamy tę platformę MindsDB i koncentrujemy się na tym, aby kontynuować czynienie jej niezwykle łatwą dla deweloperów do szybkiego tworzenia następnej fali aplikacji opartych na sztucznej inteligencji, które zmienią sposób, w jaki żyjemy i pracujemy, oraz dla firm do wydobywania informacji z ich danych.
Dlaczego MindsDB skupiło się na rozwiązywaniu problemu bycia centrycznym dla danych, a nie centrycznym dla uczenia maszynowego?
Jeśli spojrzymy na ogromną większość badań w dziedzinie AI, duża część pochodzi z instytucji akademickich. Uczenie maszynowe historycznie było centryczne dla modeli, ponieważ to jest miejsce, w którym instytucje badawcze mogą dodać postrzeganą wartość; więcej badań poprawia modele lub tworzy nowe, co daje lepsze wyniki. Bycie centrycznym dla danych, z drugiej strony, dodawanie lepszej jakości / bardziej istotnych danych do istniejącego podejścia nie jest łatwo publikowalne (kluczowy wskaźnik dla badaczy).
Jednak ogromna większość zastosowań uczenia maszynowego korzysta bardziej z poprawy danych niż z poprawy modeli. To również dobrze wpisuje się w naszą misję, aby udemokratyzować uczenie maszynowe, ogromna większość ludzi spoza środowiska ML nie wie zbyt wiele o ML, ale na pewno wie dużo o swoich danych.
Zobaczyliśmy, że istnieją dwa typy firm, z jednej strony firmy z danymi w bazie danych, z drugiej strony firmy, które nie odkryły jeszcze baz danych, zrealizowaliśmy, że jeśli firma była w grupie baz danych, ich dojrzałość danych już umieściła ich na właściwej ścieżce, aby móc naprawdę zastosować uczenie maszynowe, podczas gdy firmy, które jeszcze nie odkryły baz danych, miały długą drogę do przebycia, więc skupiliśmy się na dostarczaniu wartości dla tych, którzy mogli ją wydobyć.
Jak MindsDB podejmuje modelowanie i wdrożenie w zwykłym SQL?
Tworzymy reprezentacje modeli jako tabele, które można zapytać, więc skutecznie usuwamy pojęcie “wdrożenia” z obrazu. Gdy wpisujesz w bazie danych polecenie CREATE VIEW, to widok jest aktywny natychmiast po zakończeniu przetwarzania polecenia, tak samo jak w przypadku polecenia CREATE MODEL w MindsDB.
Ludzie kochają MindsDB ze względu na uproszczenie, które wprowadziliście do cyklu życia ML-Ops, dlaczego uproszczenie wdrożenia uczenia maszynowego jest takie ważne?
Ludzie kochają to, ponieważ abstrahuje niepotrzebne potoki ETL, więc mniej rzeczy do utrzymania. Nasz focus jest taki, aby użytkownicy wydobywali wartość z uczenia maszynowego, nie myśląc o utrzymaniu infrastruktury ML, jeśli już utrzymują infrastrukturę danych.
Jakie są niektóre z zalet i ryzyk bycia startupem open-source w porównaniu z tradycyjnym startupem?
Projekt open-source może zacząć się od samej idei, a ludzie pomogą Ci ją zbudować po drodze, w przypadku podejścia zamkniętego musisz zacząć od tych samych założeń, ale musisz mieć rację, bo nikt nie pomoże Ci poprawić produkt (przynajmniej nie w tym samym stopniu, co w open-source), myśl o open-source jako o współpracy pomiędzy użytkownikiem a produktem.
MindsDB niedawno pozyskał 16,5 mln dolarów w ramach rundy finansowania serii A od Benchmark, dlaczego Benchmark jest idealnym inwestorem i jak ich wizja odpowiada Twojej?
Benchmark ma nieskazitelną reputację w naszej branży, Chetan pomógł firmom takim jak mongodb, elastic, airbyte stać się światowymi liderami w swoich dziedzinach. Wierzymy, że nie ma lepszego dopasowania dla MindsDB niż Chetan i Benchmark capital.
Dziękujemy za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić MindsDB.












