Wywiady

Akilesh Bapu, założyciel i dyrektor generalny DeepScribe – seria wywiadów

Zaktualizowano on 9 grudnia 2022 r.

Akilesh Bapu jest założycielem i dyrektorem generalnym DeepScribe, która wykorzystuje przetwarzanie języka naturalnego (NLP) i zaawansowane głębokie uczenie się do generowania dokładnych, zgodnych i bezpiecznych notatek z rozmów lekarz-pacjent.

Co wprowadziło Cię w sztuczną inteligencję i przetwarzanie języka naturalnego i przyciągnęło Cię do niej?

Jeśli dobrze pamiętam, Jarvis z „Iron Mana” był pierwszą rzeczą, która naprawdę przyciągnęła mnie do świata przetwarzania języka naturalnego i sztucznej inteligencji. Szczególnie fascynujące było dla mnie to, o ile szybciej człowiek był w stanie nie tylko wykonywać zadania, ale także wchodzić w niewiarygodny poziom szczegółowości niektórych zadań i ujawniać pewne informacje, o których nawet by nie wiedział, gdyby nie to. ta sztuczna inteligencja.

Była to koncepcja mówiąca, że „sztuczna sztuczna inteligencja sama w sobie nie będzie tak dobra jak ludzie w większości zadań, ale wystarczy połączyć człowieka i sztuczną inteligencję, a ta kombinacja będzie dominować”. Przetwarzanie języka naturalnego to najskuteczniejszy sposób realizacji kombinacji człowieka i sztucznej inteligencji.

Od tego czasu miałem obsesję na punkcie Siri, Google Now, Alexy i innych. Chociaż nie działały tak płynnie jak Jarvis, bardzo chciałem, aby działały tak jak Jarvis. W szczególności stało się jasne, że polecenia takie jak „Alexa zrób to”, „Alexa zrób tamto” były dość łatwe i dokładne w wykonaniu przy obecnym stanie technologii. Ale jeśli chodzi o coś takiego jak Jarvis, gdzie może faktycznie uczyć się i rozumieć, filtrować i podnosić ważne tematy podczas innej wymiany konwersacyjnej – tak naprawdę nie robiono tego wcześniej. W rzeczywistości ma to bezpośredni związek z jedną z moich głównych motywacji przy zakładaniu DeepScribe. Rozwiązując kwestię dokumentacji dla lekarzy, próbujemy przy tym zastosować zupełnie nową falę inteligencji: inteligencję otoczenia. Sztuczna inteligencja, która może przeszukać Twoje codzienne wypowiedzi, znaleźć przydatne informacje i wykorzystać je, aby Ci pomóc.

Wcześniej prowadziłeś badania z wykorzystaniem głębokiego uczenia się i NLP na Uniwersytecie Kalifornijskim w Berkeley College of Engineering. Na czym polegały Twoje badania?

Wracając do laboratorium badawczego AI w Berkeley, pracowałem nad projektem adnotatora ontologii genów, w którym podsumowywaliśmy artykuły PubMed z określonymi parametrami wyjściowymi.

Omówienie na wysokim poziomie: wykonaj zadanie takie jak podsumowanie artykułu prasowego CNN. W tym zadaniu musisz zebrać artykuły prasowe i podsumować je w mniej więcej kilku zdaniach. Masz dane i możliwość uczenia tych modeli na swoją korzyść w ponad milionie artykułów. Jednak przestrzeń problemowa jest ogromna, ponieważ struktura podsumowań jest ograniczona. Ponadto artykuły nie mają prawie żadnej struktury. Chociaż od czasu, gdy pracowałem nad tym projektem 2.5 roku temu, wprowadzono sporo ulepszeń, problem ten nadal pozostaje nierozwiązany.

W naszym projekcie badawczym opracowywaliśmy jednak ustrukturyzowane streszczenia artykułów. Ustrukturyzowane podsumowanie w tym przypadku jest podobne do typowego podsumowania, z tą różnicą, że znamy dokładną strukturę podsumowania wyjściowego. Jest to pomocne, ponieważ radykalnie ogranicza możliwości wyjściowe naszego modelu uczenia maszynowego — wyzwanie polegało na tym, że nie było wystarczającej liczby szkoleń z adnotacjami, aby uruchomić model głębokiego uczenia się wymagający dużej ilości danych i uzyskać użyteczne wyniki.

Podstawą pracy, jaką wykonałem nad tym projektem, było wykorzystanie wiedzy, jaką posiadamy na temat danych wejściowych, i opracowanie zestawu płytkich modeli uczenia maszynowego do ich obsługi — wynaleziona przez nas technika zwana adnotatorem dwuetapowym. Dwuetapowy adnotator porównał wyniki z prawie 2-krotnością dokładności w porównaniu z poprzednim najlepszym wynikiem (2% w porównaniu z 20%).

Choć projekt ten i DeepScribe mogą brzmieć równolegle, oba projekty są bardzo podobne, jeśli chodzi o sposób wykorzystania dwuetapowej metody adnotacji w celu znacznej poprawy wyników na ograniczonym zbiorze danych.

Co było inspiracją do uruchomienia DeepScribe?

Wszystko zaczęło się od mojego ojca, który był onkologiem medycznym. Zanim systemy elektronicznej dokumentacji medycznej przejęły opiekę zdrowotną, lekarze zapisywali wszystko na papierze i spędzali bardzo mało czasu na notatkach. Jednak gdy EHR zaczęły zyskiwać na popularności w ramach ustawy HITECH Act z 2009 r., zacząłem zauważać, że mój tata spędzał coraz więcej czasu przy komputerze. Zaczął wracać do domu później. W weekendy siedział na kanapie i dyktował notatki. Proste rzeczy, takie jak odbieranie mnie ze szkoły czy trening koszykówki, stały się przeszłością, ponieważ większość wieczornych godzin spędzał na nadrabianiu zaległości w dokumentacji.

Jako dorastający kujon próbowałem znaleźć dla niego rozwiązania, przeszukując Internet i prosząc go o ich wypróbowanie. Niestety, nic nie działało na tyle dobrze, aby uchronić go przed długimi godzinami dokumentacji.

Przejdźmy kilka lat do lata 2017 r. — jestem badaczem pracującym w Berkeley AI Research Lab i pracuję nad projektami z zakresu podsumowań dokumentów. Któregoś lata, kiedy wracam do domu, zauważam, że mój tata nadal spędza mnóstwo czasu na dokumentowaniu. Pytam: „Co nowego w świecie dokumentacji? Alexa jest wszędzie, Asystent Google jest teraz taki dobry. Powiedz mi, co nowego w przestrzeni medycznej?” A jego odpowiedź brzmiała: „Nic się nie zmieniło”. Myślałem, że to tylko on, ale kiedy poszedłem i przeprowadziłem ankietę u kilku jego kolegów, pojawił się ten sam problem: nie to, co jest najnowsze w leczeniu raka, czy nowe problemy, jakie mają ich pacjenci – była to dokumentacja. „Jak pozbyć się dokumentacji? Jak zaoszczędzić czas na dokumentacji? Zajmuje mi to mnóstwo czasu.”

Zauważyłem również kilka firm, które pojawiły się, aby spróbować rozwiązać dokumentację. Jednak albo były za drogie (tysiące dolarów miesięcznie), albo były zbyt minimalistyczne pod względem technologicznym. Lekarze w tamtym czasie nie mieli zbyt wielu możliwości. Wtedy właśnie otworzyła się szansa, że jeśli uda nam się stworzyć sztucznie inteligentnego pisarza medycznego, technologię, która będzie w stanie śledzić wizyty pacjentów lekarzy i podsumowywać je, a także zaoferować ją po cenie, która sprawi, że będzie dostępna dla każdego, może to naprawdę przynieść radość z opieki, powrót do medycyny.

Kiedy uruchomiłeś DeepScribe, miałeś zaledwie 22 lata. Czy możesz opisać swoją drogę jako przedsiębiorcy?

Mój pierwszy kontakt z przedsiębiorczością miał miejsce już w szkole średniej. Zaczęło się, gdy ja i mój przyjaciel, znający podstawy JavaScriptu, spotkaliśmy się z dyrektorem ośrodka dla dzieci z trudnościami w uczeniu się. Powiedzieli nam, jak najprostsze narzędzia mogą bardzo pomóc dzieciom z dysleksją. Skończyło się na tym, że wspólnie zhakowaliśmy rozszerzenie Chrome dla czytnika dysleksji. To było naprawdę proste – po prostu dostosowało czcionkę, aby spełniała naukowe wytyczne dotyczące łatwości czytania przez osoby z dysleksją. Choć koncepcja była prosta, w ciągu kilku miesięcy udało nam się pozyskać ponad 5000 aktywnych użytkowników. Byłem pod wrażeniem tego, jak podstawowa technologia może mieć tak głęboki wpływ na ludzi.

W Berkeley w dalszym ciągu maksymalnie zagłębiałem się w świat przedsiębiorczości, przede wszystkim dzięki szerokiej ofercie zajęć. Moimi ulubionymi były:

Seria wykładów Newtona — osoby takie jak Jessica Mah z InDinero czy Diane Greene z VMWare, które były absolwentkami Cal, wygłaszały bardzo przydatne rozmowy na temat czasu spędzonego w Berkeley i tego, jak zakładały własne firmy
Challenge Lab — podczas tych zajęć poznałem mojego współzałożyciela Matta Ko. Podzielono nas na grupy i przeszliśmy trwającą semestr podróż polegającą na tworzeniu produktu i otrzymywaniu wskazówek na temat tego, co jest potrzebne na wczesnych etapach, aby pomysł mógł zostać zrealizowany.
Lean Launchpad — zdecydowanie mój ulubiony z całej trójki; był to wyczerpujący i rygorystyczny proces, podczas którego Steve Blank (uznany miliarder i twórca ruchu Lean Startup) prowadził nas, aby przyjąć pomysł, zweryfikować go w 100 wywiadach z klientami, zbudować model finansowy i nie tylko. To był ten rodzaj zajęć, podczas których przedstawialiśmy nasz „startup” tylko po to, by zostać zatrzymanym na slajdzie 1 lub 2 i zostać zmiażdżonym. Jakby to nie było wystarczająco trudne, mieliśmy także przeprowadzać wywiady z 10 klientami tygodniowo. Nasz pomysł polegał wówczas na stworzeniu wyszukiwarki patentów, która dawałaby wyniki podobne do kosztownych poszukiwań ze stanu techniki, co oznaczało, że tygodniowo przedstawialiśmy oferty 10 klientom korporacyjnym. To było wspaniałe, ponieważ nauczyło nas szybkiego myślenia i dużej zaradności.

Działalność DeepScribe rozpoczęła się, gdy grupa inwestorów o nazwie The House Fund wypisywała czeki dla studentów, którzy chcieli zrezygnować z letnich staży i spędzić lato na budowaniu swojej firmy. Właśnie zamknęliśmy Delphi (wyszukiwarkę patentów), a Matt i ja ciągle rozmawialiśmy o dokumentacji medycznej i wszystko się ułożyło, ponieważ był to idealny moment, aby spróbować.

Dzięki DeepScribe mieliśmy szczęście, że właśnie wyszliśmy z Lean Launchpad, ponieważ jednym z najważniejszych czynników podczas tworzenia produktu dla lekarzy było powtarzanie i udoskonalanie produktu w oparciu o opinie klientów. Historycznym problemem branży medycznej był fakt, że w oprogramowaniu rzadko uczestniczyli lekarze, w związku z czym oprogramowanie nie było zoptymalizowane pod kątem użytkownika końcowego.

Ponieważ akcja DeepScribe odbywała się w tym samym czasie, co mój ostatni rok w Berkeley, było to dla mnie trudne zadanie. Na zajęcia przychodziłem w garniturze, żeby zaraz potem zdążyć na pokaz dla klienta. Wykorzystałbym wszystkie udogodnienia i profesorów EE nie do celów związanych z zajęciami, ale w 100 procentach dla DeepScribe. Moje spotkania z moim mentorem badawczym zamieniły się nawet w burze mózgów w DeepScribe.

Patrząc wstecz, gdybym miał zmienić jedną rzecz w mojej podróży, byłoby to odłożenie studiów, aby móc spędzić 150 procent czasu w DeepScribe.

Czy możesz opisać lekarzowi, jakie są zalety korzystania z DeepScribe w porównaniu z bardziej tradycyjną metodą dyktowania głosu lub nawet robienia notatek?

Korzystanie z DeepScribe ma być bardzo podobne do korzystania z prawdziwego ludzkiego skryby. Kiedy będziesz naturalnie rozmawiać ze swoim pacjentem, DeepScribe będzie Cię przysłuchiwać i wychwycić istotne z medycznego punktu widzenia przemówienie, które zwykle znajduje się w Twoich notatkach, i umieści je tam za Ciebie, używając tego samego języka medycznego, którego sam używasz. Lubimy myśleć o tym jak o nowym członku personelu medycznego wykorzystującym sztuczną inteligencję, którego możesz przeszkolić według własnego uznania i pomóc w zakresie dokumentacji w systemie elektronicznej dokumentacji zdrowotnej. Różni się to bardzo od korzystania z usługi dyktowania głosu, ponieważ eliminuje cały etap konieczności cofania się i dokumentowania. Podczas gdy typowe usługi dyktowania zamieniają 10 minut dokumentacji w 7–8 minut, DeepScribe zamienia to w kilka sekund. Nasi lekarze zgłaszają, że zaoszczędzili od 1.5 do 3 godzin dziennie, w zależności od liczby przyjętych pacjentów.

Funkcja DeepScribe jest niezależna od urządzenia i można ją obsługiwać za pomocą iPhone'a, Apple Watch, przeglądarki (do telemedycyny) lub urządzenia sprzętowego.

Jakie wyzwania związane z rozpoznawaniem mowy lub NLP mogą napotkać DeepScribe ze względu na złożoną terminologię medyczną?

Wbrew powszechnej opinii złożona terminologia medyczna jest w rzeczywistości najłatwiejszą do zrozumienia przez DeepScribe. Najtrudniejszą częścią DeepScribe jest wychwytywanie unikalnych stwierdzeń kontekstowych, które pacjent może przekazać lekarzowi. Im bardziej odbiegają od typowej rozmowy, tym częściej widzimy potknięcia AI. Jednak w miarę jak gromadzimy więcej danych dotyczących konwersacji, z każdym dniem zauważamy znaczną poprawę tej sytuacji.

Jakie inne technologie uczenia maszynowego są używane w DeepScribe?

Szerokie spektrum rozpoznawania mowy i NLP zwykle obejmuje większość uczenia maszynowego, którym zajmujemy się w DeepScribe.

Czy możesz wymienić niektóre szpitale, organizacje non-profit lub instytucje akademickie korzystające z DeepScribe?

Rozwiązanie DeepScribe rozpoczęło się od programu pilotażowego prowadzonego z Centrum Zdrowia Uniwersytetu Kalifornijskiego w Berkeley. Hartford Healthcare, Texas Medical Center i Cedar Valley Medical Specialists to tylko niektóre z większych systemów, z którymi współpracuje DeepScribe.

Jednak większy odsetek użytkowników DeepScribe to 50 prywatnych praktyk od Alaski po Florydę. Nasze najpopularniejsze specjalizacje to podstawowa opieka zdrowotna, ortopedia, gastroenterologia, kardiologia, psychiatria i onkologia, ale wspieramy także kilka innych specjalizacji.

DeepScribe uruchomiło niedawno program mający na celu pomoc w walce z Covid-19. Czy mógłbyś przeprowadzić nas przez ten program?

Covid-19 mocno uderzył w naszych lekarzy. Przychodnie przyjmują jedynie 30–40 procent liczby pacjentów, zmniejsza się personel lekarzy, a świadczeniodawcy zmuszeni są szybko przestawić wszystkich swoich pacjentów na telemedycynę. Wszystko to prowadzi do zwiększenia pracy biurowej dla usługodawców — w DeepScribe mocno wierzymy, że aby zatrzymać pandemię, lekarze muszą poświęcić 100 procent swojej uwagi i czasu opiece nad pacjentami.

Aby pomóc w tej sprawie, z dumą udostępniamy bezpłatne rozwiązanie telemedyczne dla pracowników służby zdrowia walczących z tą pandemią. Nasze rozwiązanie telemedyczne jest w pełni zintegrowane z rozwiązaniem medycznym opartym na sztucznej inteligencji, co eliminuje potrzebę dokumentacji klinicznej w przypadku spotkań odbywanych na naszej platformie.

W czasie pandemii oferujemy również bezpłatną usługę skryby. Oznacza to, że każdy lekarz może bezpłatnie uzyskać dostęp do lekarza, który zajmie się jego dokumentacją. Mamy nadzieję, że dzięki temu lekarze będą mogli skupić większą uwagę na swoich pacjentach i spędzać mniej czasu na myśleniu o dokumentacji, co doprowadzi do szybszego zatrzymania epidemii COVID-19.

Dziękuję za wspaniały wywiad. Bardzo miło było mi poznać DeepScribe i Twoją podróż w biznesie. Każdy, kto chce dowiedzieć się więcej, powinien odwiedzić DeepScribe.

W przyszłym

Model AI może pozwolić twórcom gier generować realistyczne animacje

Nie przegap

Stefano Pacifico i David Heeger, współzałożyciele Epistemic AI – seria wywiadów

Antoniego Tardif

Partner-założyciel unite.AI i członek Rada Technologiczna Forbesa, Antoine jest futurysta który jest pasjonatem przyszłości sztucznej inteligencji i robotyki.

Jest także Założycielem Securities.io, witryna internetowa skupiająca się na inwestowaniu w przełomowe technologie.