Інтерв’ю

Матthew Crowson, MD, Директор зі штучного інтелекту/генеративного штучного інтелекту управління продуктами в Wolters Kluwer Health – Серія інтерв’ю

mm

Доктор Метт Кроусон – лідер у сфері охорони здоров’я та практикуючий хірург, який зосереджується на застосуванні штучного інтелекту в клінічній практиці. Він є директором зі штучного інтелекту/генеративного штучного інтелекту управління продуктами в Wolters Kluwer Health, де він очолює ініціативи з покращення синтезу доказів та аналізу реальних даних. Раніше він очолював практику штучного інтелекту для постачальників медичних послуг Deloitte, розробляючи рішення з генеративного штучного інтелекту для поліпшення документації, циклів доходів та досліджень. Він також є асистентом професора в Гарвардській медичній школі та є автором понад 90 рецензованих публікацій.

Wolters Kluwer – глобальний постачальник професійної інформації, програмного забезпечення та послуг, який підтримує клієнтів у сфері охорони здоров’я, оподаткування та бухгалтерського обліку, права та регулювання, фінансової відповідності та ESG. Головний офіс компанії розташовується в Нідерландах, компанія використовує глибокі знання галузі та передові технології для створення інструментів, які оптимізують робочі процеси, забезпечують дотримання вимог законодавства та підтримують критичне прийняття рішень. Операції компанії охоплюють понад 180 країн, а її пропозиції організовані за такими напрямами, як Охорона здоров’я, Оподаткування та бухгалтерський облік, Право та регулювання, Фінансова та корпоративна відповідність, а також Корпоративна продуктивність та ESG.

Розпочнімо з особистого питання – як ви балансуєте свої подвійні ролі як практикуючого хірурга та лідера зі штучного інтелекту?

Чесно кажучи, це починається з безжалісного розподілу часу та промислової міцності кавомашини. Клінічні ранкові години зберігають мої навички догляду за пацієнтами, а решта дня присвячена перетворенню передових болів у специфікації продукту. Ці дві ролі взаємодоповнюють одна одну: бачити, як резидент клікає через десять екранів, щоб замовити Тайленол, – це все дослідження ринку, яке мені потрібно.

Проекти зі штучного інтелекту зазнають невдачі, коли ніхто в кімнаті не відчув того болю. Наш опитування Future Ready Healthcare показує, що 80% лідерів вважають оптимізацію робочих процесів одним з найвищих пріоритетів. Однак лише 63% вважають, що вони готові зробити це за допомогою генеративного штучного інтелекту (GenAI). Це класичний розрив між стратегією та виконанням, який можуть закрити експерти галузі, запитуючи правильне клінічне “чому” до написання однієї лінії коду.

Моя клінічна лінза також тримає місію практичною. Передові працівники сказали нам, що їхні основні завдання – це виправлення нестачі персоналу (82%), скорочення адміністративних витрат (77%) та подолання виховання (76%). Якщо алгоритм не рухає жоден з цих показників, це просто театр. Клініцисти швидко втрачають інтерес.

Ця лінза також робить мене обережним щодо того, де штучний інтелект не повинен рухатися. Насправді, 57% професіоналів бояться, що надмірна залежність від GenAI може підірвати клінічне судження, однак лише 18% кажуть, що їхні організації мають опубліковані правила. До тих пір, поки управління не покращиться, мандат ясний: автоматизувати паперові роботи, а не мислення.

Отже, для мене баланс не полягає в каві проти календаря. Це питання про те, щоб тримати одну ногу в клініці – щоб ніколи не забувати, кому штучний інтелект повинен служити – і одну ногу в продукті, щоб знання відправлялися. Зробіть це добре, і кава буде просто приємним бонусом.

Опитування Future Ready Healthcare Survey Report від Wolters Kluwer підкреслює великий розрив між ентузіазмом щодо GenAI та виконанням. Чи були ви здивовані якимись результатами? Що найбільш впало вам в око?

Мене не здивувало нічого. Я ще не зустрів клініциста, який був би проти автоматизації. Що сповільнює впровадження, це не страх якогось “Скайнета в халаті” сценарію, а скоріше щоденна робота охорони здоров’я. Опитування кристалізує цю реальність. Вісім із десяти лідерів ставлять оптимізацію робочих процесів у верхню частину пріоритетів, однак лише трохи більше шести з десяти кажуть, що вони готові дозволити GenAI зайнятися цим. Цей розрив саме те, що я бачу: юридичні міни, дані, які виглядають більше як шухляда, ніж дані, та фінансові стимули, які все ще винагороджують обсяг над ефективністю. Є інші перешкоди, включаючи вакуум навчання, втому від тіньового ІТ, та регулювання туману.

Що найбільш впало мені в око, це те, наскільки ці перешкоди є буденними. Нестача персоналу, адміністративна тягарність та виховання домінують у списку турбот, однак лише 18% організацій мають формальні політики щодо GenAI. Якщо ви не знаєте, хто підписує модель чи як її виводи аналізуються, ентузіазм гасне в офісі з відповідності вимогам законодавства. Крім того, 68% респондентів кажуть, що витрати на працю є їх найбільшим фінансовим тиском, і не дивно, що виконавці хочуть побачити докази повернення інвестицій, перш ніж підписати ще один рахунок за програмне забезпечення. Заголовок не “Паніка від штучного інтелекту”, а “Хороша ідея – покажіть мені робочий процес та бізнес-кейс”.

Більше половини опитаних фахівців охорони здоров’я турбуються, що GenAI може підірвати клінічне судження. Чи вважаєте ви, що цей страх є дійсним, або він відображає глибші турботи щодо довіри та прозорості в системах штучного інтелекту?

Деяка частина тривоги є реальною, однак вона має менше стосунку до страхів про сценарій “HAL-9000” та більше до звичайної відповідальності. Коли інструмент пропонує диференціальні діагнози за секунди, вам потрібно кристально чиста походження: Відкуди прийшла рекомендація, хто підписується, і як вона аналізується? Сьогодні лише мала частина організацій має формальні правила щодо GenAI, тому клініцисти звертаються до обережності. Це видно в наших даних як 57% кажуть “надмірна залежність може підірвати судження”. Для мене це сигнал, що вони не хочуть, щоб чорна скринька втрутилася в їх ліцензію на практику.

Я бачу цю проблему через історичний призму. Коли електронні таблиці з’явилися в фінансових відділах, деякі бухгалтери турбувалися, що їх аналітичні м’язи атрофуються. Замість цього програмне забезпечення для електронних таблиць стало новою базовою лінією, підвищивши рівень точності. Охорона здоров’я запізнилася з таким стрибком. Ми втрачаємо занадто багато пацієнтів через варіації у догляді; медична помилка залишається однією з основних причин травм та смерті. Суперсила GenAI полягає в тому, щоб звузити ці похибки, висвітивши рекомендації, протипоказання та відхилення швидше, ніж будь-яка людина може розібрати карту. Однак це повинно залишатися помічником, а не автономним прийняттям рішень, особливо протягом наступних трьох-п’яти років.

Отже, так, страх є дійсним, однак його можна вирішити. Прозорі дані, аудиторські сліди та перевірки людини в циклі перетворюють “ерозію штучного інтелекту” на “доповнення штучного інтелекту”. Надайте клініцистам слідові рекомендації та ясні лінії відповідальності, і той 57% зникне. Це не про заміну експертизи; це про доповнення її кращими інструментами.

Лише 18% респондентів кажуть, що вони знають про ясні політики щодо GenAI в своїх організаціях. Які потенційні ризики впровадження інструментів GenAI без таких правил?

Подумайте про це як про запуск нового лікарського засобу без маркування дозування. Дані охорони здоров’я є дуже чутливими, а моделі GenAI стають розумнішими лише тоді, коли вони поглинають цей контекст, багатий на інформацію про охорону здоров’я (PHI). Без суворих правил щодо управління даними, які регулюють, хто може завантажувати інформацію, як ці дані реєструються та де вони розташовуються, організація знаходиться всього в одному кліку від порушення конфіденційності, яке може стати заголовками.

Відповідальність є наступною міною. Коли алгоритм пропонує протипоказану дозу, хто підписується під позовом про професійну недбалість? Виробник, лікарня чи клініцист, який натиснув кнопку “прийняти”? Наразі ця відповідь є нечіткою, оскільки менше однієї п’яти організацій мають кодифіковані “правила дороги” для GenAI. У вакуумі юристи часто звертаються до глибоких кишень, і ця невизначеність сама по собі може зупинити інновації.

Управління також захищає від більш тонких ризиків, таких як дрейф моделі та приховане упередження. Бот з онкології, навчений на основі останніх рекомендацій, може тихо вийти з ладу, штовхаючи догляд з рейок, заснованих на доказах. Політики, які вимагають контролю версій, моніторингу результатів та спускових механізмів, утримують алгоритми від старіння в безпекових ризиків.

Нарешті, довіра знаходиться на кону. Клініцисти турбуються, що надмірна залежність від GenAI може притупити їх клінічне судження; впровадження не прозорих інструментів лише підтверджує ці страхи. Ясне управління, прозорість ліній даних, протоколи валідації та перевірки людини в циклі перетворюють тривогу “чорної скриньки” на впевненість, що штучний інтелект є допоміжним партнером, а не злим резидентом.

На основі вашої роботи в Wolters Kluwer та в операційній, яке є найбільш реальним近期ним випадком використання GenAI в охороні здоров’я?

Забудьте про роботизовані хірурги. За найближчі три роки найкраща можливість для GenAI – це адміністративне знищення. Два напрямки вже доводять себе:

  1. Фронтальна робота з записуванням нотаток. Інструменти для прослуховування现在 можуть створити проект нотатки, поки лікар розмовляє з пацієнтом, а потім помістити її прямо в електронну медичну карту (ЕМК). Наше опитування показує, що 41% респондентів ставлять це в свій список бажань GenAI, а технологія вже діє в ранніх системах охорони здоров’я. Деякі дослідження показали, що системи для диктування в режимі реального часу можуть скоротити когнітивне навантаження на 51% та післягодинне “піжамне” час на більш ніж 60%. Це є реальний повернення інвестицій; ви можете відчувати це швидко.
  2. Задня робота з захистом доходів. Наступний доміно – пакети попередньої авторизації, листи з апеляціями щодо відмов та інші адміністративні витрати. Для порівняння, 67% лідерів кажуть, що попередня авторизація сама по собі душить продуктивність, а 62% вказують на адміністративну тягарність ЕМК. Великі мови моделей, які читають карту та автоматично заповнюють ці форми, вже скорочують дні з вимог та звільняють персонал для більш важливої роботи.

Чому ці два? Вони влучають у трійку низького клінічного ризику, високого полегшення персоналу та ясного доларового виправдання. На ринку, де 68% виконавців називають витрати на працю своїм найбільшим фінансовим тиском, інструменти, які повертають години без зміни плану догляду, є найлегшим “так”. Автономний діагноз прийде пізніше; зараз GenAI заробляє свої гроші, роблячи кліпборд невидимим.

Опитування вказує, що дані не є найбільшим ризиком, названим респондентами – що є дивним, враховуючи, наскільки часто конфіденційність даних домінує в заголовках. Які ризики клініцисти та адміністратори бачать як більш важливі?

Мене також здивувало. Заголовки мали б нас переконати, що порушення конфіденційності даних тримає кожного керівника інформаційних технологій лікарні в нічній тривозі. Однак наші дані показують, що лише 56% фахівців називають конфіденційність найбільшим ризиком GenAI, тоді як ще більший шматок (57%!) турбуються про “затуплення” клінічного судження. Це говорить мені, що передова лінія не страхується перед хакерами, а відповідальність.

Ось, чого клініцисти та адміністратори бояться:

  • Рулетка відповідальності. Якщо алгоритм штовхає догляд з курсу, хто підписується під позовом про професійну недбалість? Недостатність чітких правил та стандартів займає місце поряд з прозорістю на рівні 55%, сигналізуючи про реальну тривогу щодо юридичної зони ураження.
  • Регуляторна розгонка. 76% лідерів вже відчувають розгонку від зміщування правил Medicare та Medicaid; накладення не прозорого GenAI на це є важким продажем, поки правила не зміцніють.
  • Дрейф моделі та упередження. 55% прапорців виділяють упередження з недообучених моделей як критичний ризик, нагадуючи, що застарілі дані можуть бути такими ж небезпечними, як і відсутність даних.

Коротко кажучи, більшість організацій припускають, що їх брандмауери є прийнятними; вони не мають ясної ланцюга відповідальності, коли вивід великої мови моделі (LLM) потрапляє до плану догляду. До тих пір, поки правила управління не визначать володіння, аудиторські сліди та каденції оновлення, впровадження GenAI будуть продовжувати зупинятися, незалежно від того, наскільки міцний є стек безпеки.

Чи вважаєте ви, що інструменти GenAI в кінцевому підсумку покращать або розбавлять автономію клініциста? Як ми можемо розробити системи, які підтримують прийняття рішень без перевищення меж?

GenAI готовий розширити, а не звузити, клінічну автономію. Правильно зараз, значна частина цієї автономії гальмується інбокс-триажем, паперовими роботами з попередньою авторизацією та акробатикою з ЕМК. Не дивно, що клініцисти ставлять “оптимізацію робочих процесів” у верхню частину списку завдань для GenAI (80% пріоритету), хоча лише 63% вважають, що вони технічні готові до виконання. Фармацевти та медичні працівники вже ставлять на це: 41% і 47% очікують, що GenAI викреслить достатньо адміністративного жиру, щоб скоротити потребу в допоміжному персоналі. Звільнення клініцистів від вводу даних означає більше часу, проведеного з пацієнтами. Це та автономія, якої хочуть усі.

Все ж таки, опитування нагадує нам, що автономія розрізняється з двох сторін: 57% респондентів турбуються, що надмірна залежність від GenAI може притупити клінічне судження. Антидотом є вдумлива розробка, а не гальмування. Системи повинні показувати свою роботу з походженням, цитатами та оцінками впевненості, щоб люди залишилися остаточними арбітрами. Контроль версій та моніторинг після впровадження ловлять тихий дрейф моделі, перш ніж він отруює шляхи догляду, тоді як “завжди видимі кнопки перевищення” роблять ясним, що алгоритм є помічником, а не головним лікарем.

Управління є останнім етапом. Лише 18% фахівців кажуть, що їх організація має опубліковану політику щодо GenAI. Без прозорого ланцюга відповідальності навіть найкращий досвід користувача зупиниться в юридичній лімбі. Робочі політики повинні визначити управління даними, аудиторські сліди та ролеву диференціацію, яка соціалізується по всім лікарям, медсестрам та лікарському помічнику, який натискає кнопку. Коли ми поєднуємо ці правила з розробкою, рідною для робочих процесів, GenAI перестає відчуватися як загроза автономії та починає діяти як копілот, якого клініцисти давно просять.

Що найбільш гальмує прийняття – технологічні обмеження, регуляторна невизначеність, тертя робочих процесів або щось глибше, наприклад культурний опір?

Це дефіцит виконання, обернений у спадність інерції. Більшість лідерів охорони здоров’я можуть викласти чітку бачення GenAI, однак їх операційна мускулатура не встигає за цим. Наше опитування показує розрив в одному рядку: 80% респондентів ставлять “оптимізацію робочих процесів” у верхню частину пріоритетів, однак лише 63% вважають, що вони готові зробити це. Візія дешева; інженери з інтеграції, книги з управління змінами, бюджети на графічні процесори (GPU) – все це не дешево.

Управління є наступною дірою. Лише 18% фахівців навіть знають про опубліковану політику щодо GenAI в своїй лікарні. Без ясних правил щодо використання даних, валідації та відповідальності кожна перспективна пілотна програма ризикує стати гранатою відповідності вимогам законодавства. Ця юридична туманність посилюється макро-невизначеністю. Насправді, 75% лідерів турбуються, що швидкозмінні державні та федеральні правила зруйнують будь-яке рішення, яке вони впровадять.

Потім йде тертя на рівні траншей: майже половина виконавців вказують на брудні дані та кошмари з інтеграцією ЕМК як основні бар’єри, і лише 42% кажуть, що вони мають процес для прикріплення інструментів GenAI до існуючих робочих процесів. Якщо модель не бачить карту або додає кліки, клініцисти покинуть її до обіду.

Нарешті, є “пілотна ліміна”. Багато зовнішніх досліджень оцінюють успішність пілотних проектів зі штучного інтелекту на рівні приблизно одного з десяти. Ради святкують демоверсію, видають прес-реліз та переходять до іншого. Тому що ніхто не фінансує наступну безгламурну роботу з пломбування. GenAI залишиться обіцянкою PowerPoint, поки лікарні не наймуть власників продукту, які раніше відправляли програмне забезпечення.

Коротко кажучи, технологія та культура не є окремими блокаторами. Вони сплавлені. Рішення для підзвітності, реальної інтеграції, явних правил та апетиту до GenAI будуть збігатися. Вирішіть для підзвітності, реальної інтеграції, явних правил та апетиту до GenAI, і апетит до нього буде відповідати гіпу.

Що ви порадите лідерам охорони здоров’я, які намагаються орієнтуватися в гіпі та ідентифікувати真正ньо цінні інвестиції в штучний інтелект?

Розпочніть з діагнозу, а не з демоверсії. Перед тим, як дозволити блискучому молотку шукати цвяхи, кільцевий цвях: Чи знижується використання операційної кімнати на 8% два квартали поспіль? Чи затримуються апеляції щодо відмов та втрачаються доходи? Чи медсестринський відділ три проводить два години на зміну на “тоглі-час” ЕМК (час, проведений на переключенні між екранами та завданнями)? Як тільки біль буде явним, правильний інструмент з’явиться. Як сер Вільям Ослер колись нагадував медичній спільноті, “Прослуховуйте пацієнта; [він] скаже вам діагноз”.

З проблемою,固定, розпитайте бізнес-кейс, як це робить фінансовий директор: вимагайте твердих цифр, базових метрик, проєктованих дельт та термінів повернення інвестицій, які витримують перевірку ради. Пам’ятайте, що лише близько одного з десяти пілотних проектів зі штучного інтелекту переходять на підприємницький рівень; якщо виробник не може показати живого клієнта, який змінив показник продуктивності, який вас турбує, продовжуйте рух.

Далі вирішіть, купувати, будувати чи партнерувати. Купівля може прискорити час повернення інвестицій, але будьте обережні з парою, одягненою в бренд. Будівництво дає вам контроль, але тільки якщо у вас є тигрова команда власників продукту, яка раніше відправляла програмне забезпечення з машинним навчанням у виробництво. Гібридні партнерства часто знаходять баланс: ваші дані, їх модель, спільний виїгріш та спільний ризик.

Нарешті, поставте на перше місце малі, міжфункціональні команди з ясною підзвітністю. Підумайте про команду з двох піц, яка включає в себе головного медичного директора, головного інформаційного директора, голову інженерії даних та клінічного чемпіона, а не великі комісії з управління. Вирівняйте їхні стимули з багатолітніми цілями результатів, а не короткостроковими метриками, та дайте їм окремий бюджет інфраструктури – графічні процесори, інженерія даних, операції з машинним навчанням (MLOps) – щоб проєкт перейшов за стадію пілотної програми.

Нарешті, дивлячись вперед: як виглядатиме відповідальне, повністю інтегроване середовище GenAI в лікарняному середовищі за п’ять років? Які етапи нам потрібно подолати, щоб туди дістатися?

Представьте собі клініку, де лікар ніколи не повертається до клавіатури. Розмова тече, а невидимий агент для прослуховування навколишнього середовища захоплює діалог, створює проект нотатки, сигналізує рекомендації на основі рекомендацій та генерує пакет попередньої авторизації, перш ніж рука лікаря торкнеться дверної ручки. Ранні пілотні програми вже доводять цю концепцію, а 41% клініцистів у нашому опитуванні кажуть, що це саме той функціонал GenAI, який вони хочуть наступним.

Що робить цю сцену можливою, не є наукова фантастика з роботизованими хірургами; це невидима архітектура, яка сплавляє чисті, міжопераційні дані з реальною оркестровкою та “управління як код”. Ми все ще маємо домашнє завдання. Щоб закрити пробіли, подумайте про пломбування даних спочатку, а потім впровадіть правила (а не прикріпіть їх) для перетворення гіпу на звичку.

Етапи природно виходять, коли основа закладена. У перший рік я рекомендую лікарням та системам охорони здоров’я підключити тканину даних, опублікувати підприємства з правилами GenAI та створити трубопровід MLOps. У другому році реалізації важливо масштабувати амб’єнтну документацію по всіх амбулаторних клініках, вимірювати час документації та післягодинне “піжамне” час. У третьому році важливо дозволити GenAI створити апеляції щодо відмов та пакети попередньої авторизації (67% лідерів кажуть, що це тягар готовий до ліквідації). У четвертому та п’ятому роках еволюціонуйте до реального клінічного підтримання рішень з походженням та, в кінцевому підсумку, розмовним плануванням догляду, де система виконує накази в момент їх вимови.

Дякуємо за велике інтерв’ю. Читачам, які хочуть дізнатися більше, рекомендуємо відвідати Wolters Kluwer або прочитати Опитування Future Ready Healthcare Survey Звіт.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.