Interviews
Dr. Musheer Ahmed, PhD, grundlægger og administrerende direktør for Codoxo – Interviewserie

Dr. Musheer Ahmed, PhD, grundlægger og administrerende direktør for Codoxo er en teknolog og iværksætter, der fokuserer på at anvende kunstig intelligens til at løse systemiske ineffektiviteter i sundhedssektoren. Han grundlagde Codoxo på baggrund af forskning, han udviklede under sin PhD på Georgia Institute of Technology, hvor han opbyggede grundlaget for en patenteret AI-tilgang til at opdage svindel, spild og misbrug i sundhedsydelser. Under hans ledelse er virksomheden vokset til at blive en leverandør af AI-drevne betalingsintegritetsløsninger, der hjælper sundhedsorganisationer med at identificere risici tidligere og skifte fra reaktive revisioner til proaktive omkostningsbesparelser. Hans tidligere erfaring med sikkerhedsintelligens på VeriSign, hvor han arbejdede med at identificere nye cybertrusler og sårbarheder, formede hans fokus på at bruge avanceret analyse og maskinlæring til at afsløre skjulte mønstre i komplekse dataomgivelser.
Codoxo er et sundheds-IT-virksomhed, der fokuserer på at reducere ineffektiviteter og unødvendige omkostninger i sundhedssystemet gennem sin Forensic AI-platform. Platformen bruger patenterede algoritmer og maskinlæring til at analysere enorme mængder af ydelsesdata, identificere mistænkeligt adfærd, fakturingsafvigelser og nye svindelsskemaer tidligere end traditionelle systemer. Ved at enable sundhedsyder, offentlige myndigheder og apoteksadministratorer til at gribe ind før eller under ydelsesprocessen, skifter Codoxo branchen mod proaktiv betalingsintegritet i stedet for retrospektiv gendannelse. Dens bredere, samlede platform til omkostningsbesparelse integrerer dataudvinding, udbyderuddannelse, revisionsarbejdsgange og sagshåndtering, hvilket hjælper organisationer med at forbedre nøjagtigheden, reducere overbetalinger og strømlinje operationer, samtidig med at de håndterer hundredvis af milliarder dollars tabt årligt på grund af svindel, spild og misbrug.
De grundlagde Codoxo efter at have forsket i sundheds-svindeldetektion under sin PhD på Georgia Tech. Hvad overbeviste Dem først om, at AI kunne fundamentalt ændre, hvordan svindel, spild og misbrug detekteres i sundhedssystemer?
Jeg blev overbevist ikke af et enkelt øjeblik, men af at konfrontere, hvor dårligt den eksisterende tilgang fungerede. Sundheds-svindel i USA repræsenterer ca. 330 milliarder dollars tabt årligt. Det er mere end enhver anden form for forsikringssvindel i landet kombineret, og alligevel kunne de dominerende detektionsmetoder kun fange, hvad de allerede var trænet til at se efter. Selv da AI kom ind i billedet, var de fleste tilgange reaktive, mønster-matching mod kendte svindelskemaer i stedet for at afsløre de ukendte. Øjeblikket, der krystalliserede det for mig, var at realisere, at svindel ikke er et statisk problem. Dårlige aktører tilpasser sig. De lærer, hvad der udløser en flag, og routerer rundt om det. Et system bygget på faste regler er, per definition, altid bagud.
Hvad AI tilbyder, er evnen til at afsløre mønstre, som ingen havde tænkt på at programmere på forhånd. Under min afhandling på Georgia Tech byggede jeg modeller, der kunne se på en udbyders fulde ydelseshistorik, identificere adfærdsmæssige afvigelser og forbinde signaler, som en menneskelig analytiker eller en regel-motor aldrig ville have forbundet sammen. JASON-rådgivergruppen, der rådgiver den amerikanske regering om videnskab og teknologi, anerkendte dette arbejde som en løsning på reelle strukturelle huller i, hvordan sundhedsdata blev brugt til betalingsintegritet. Den anerkendelse fortalte mig, at problemet var alvorligt nok til at bygge en virksomhed omkring.
Den kerneoverbevisning, der drev mig dengang, er den samme, der driver, hvad vi bygger i Codoxo nu: Sundhedsydelsernes data indeholder signalerne, du behøver for at fange svindel, men du kan kun udtrække dem med AI, der kan se på det fulde billede, hurtigt og nøjagtigt, i stedet for at tjekke afkrydsningsfelter.
Sundheds-svindel har længe været et milliard-dollar-problem, men generativ AI synes at accelerere det dramatisk. Hvordan har opkomsten af værktøjer, der kan producere overbevisende klinisk dokumentation og diagnostiske billeder, ændret trusselslandskabet for sundhedsforsikrings- og betalingsintegritets-hold?
Det har ændret det på en fundamental måde, og branchen har endnu ikke fuldt ud absorberet, hvor betydelig den ændring er. Den gamle model for dokumentations-svindel krævede manuelt arbejde. En dårlig aktør, der begår svindel, skulle fabrikere noter én ad gangen, ændre billeder individuelt og oprette optegnelser, der var troværdige nok til at overleve gennemgang. Den friktion skabte en naturlig loft på svindelskabets omfang.
Generativ AI fjernede det loft. I dag kan enhver bede en stor sprogmodel om at producere 50 terapisessions-noter for angstbehandling og modtage dem på under fem minutter. Disse noter vil bruge passende klinisk terminologi, følge en troværdig narrativ struktur og se internt konsistente ud. De fleste svindeldetektionssystemer var aldrig designet til at evaluere, om en dokument er ægte eller syntetisk. De var designet til at tjekke, om faktureringskoder var anvendt korrekt, flagre kendte mønstre og matche mod eksisterende svindelsignaturer. Så den syntetiske dokumentation passer lige igennem, selv forbi nogle systemer, der påstår at have en AI-komponent.
Vi har også set dette med diagnostisk billedanalyse. Et enkelt legitimitets-X-ray kan bruges som frø til dusinvis af AI-genererede variationer, hver indsendt under en anden fabrikeret patient. Et system med ingen billedkomparationsfunktion ser 50 unikke billeder, men virkeligheden er ét ægte scan og 49 syntetiske kopier. Trusselslandskabet er skiftet fra isolerede dårlige aktører til personer, der kan køre skalerbare, gentagne skemaer med næsten ingen teknisk ekspertise krævet.
Mange traditionelle svindeldetektionssystemer afhænger af regelbaserede modeller og manuel gennemgang. Hvorfor er disse tilgange mere og mere ineffektive, når det handler om AI-genererede medicinske optegnelser eller manipulerede diagnostiske billeder?
De fleste svindeldetektionsmetoder, enten regelbaserede eller tidligere generationers AI, opererer på en fundamentalt fejlbehæftet antagelse lige nu: at alle dokumentationer, der kommer ind i systemet, er blevet oprettet af en menneske, der følger normale kliniske processer. Når den antagelse bryder sammen, bryder hele detektionsmetoden sammen med det.
En regel-motor kan flagre en umulig kombination af koder, en udbyder, der fakturerer for mere timer, end der findes i en dag, eller en procedure, der udføres på en afdød patient. Disse er alle virkelige og nyttige fange. Men regelbaseret logik kan ikke se på en fremgangsnot og bestemme, om den er skrevet af en kliniker, der faktisk så en patient, eller genereret af en AI-model, der aldrig har praktiseret medicin. De to outputs kan være strukturmæssigt identiske.
Manuel gennemgang har det samme loft. Studier viser, at kun omkring 34% af mennesker kan identificere en deepfake, selv når de er blevet fortalt, at en er til stede, og aktivt søger efter det. En SIU-undersøger, der gennemgår en bunke fremgangsnoter, har ingen specialiseret forensisk træning til at detektere syntetisk tekst, ingen billedkomparationsværktøjer til at spotte klonede scanninger, og ikke nok timer i dagen til at udføre den niveau af gennemgang på hver ydelse. Volumproblemet alene gør komplet manuel gennemgang umulig, og det var sandt, før generativ AI begyndte at accelerere volumen og sofistikation af svindeldokumentation.
Der er også en opstående trussel, som jeg tror er underanskrevet: hvad forskere kalder trojan deepfake-motorer. Disse er virus-lignende agenter, der er designet specifikt til at neutralisere detektionssoftware, arbejdende gennem taktikker som billedanalyse-afsporing eller ondsindet prompt-omkonfiguration. Så den adversarielle dynamik ikke kun er svindlere, der genererer bedre fup, men i nogle tilfælde også aktivt forsøger at bryde værktøjerne, der bygges til at fange dem. Denne kapløb-dynamik er en del af, hvorfor statiske detektionsmetoder, enten regelbaserede eller en fast AI-model, altid vil falde bagud. Forsvaret må være lige så adaptivt som offensiven.
Codoxo lancerede for nylig Deepfake Detection for at imødegå denne opstående risiko. På et højt niveau, hvordan analyserer teknologien medicinsk dokumentation og billeder for at bestemme, om indhold kan være genereret eller manipuleret af AI?
Det kerne-designprincip er, at vi byggede Deepfake Detection specifikt til sundhedsdokumentation og ikke til generel formål AI-detektionsværktøj til klinisk kontekst. Det betyder, at modellerne er trænet på sundheds-specifikke signaler, ikke tilpasset fra værktøjer bygget til andre industrier eller andre brugsområder. Denne forskel er vigtig, fordi signalerne, der indikerer syntetisk indhold i en sundhedsjournal eller et diagnostisk billede, er forskellige fra signalerne, der er relevante i andre domæner.
På et højt niveau analyserer systemet medicinsk dokumentation og billeder sammen med den fulde ydelseskontekst, og det gør det på sekunder. Når en SIU-undersøger uploader mistænkelig dokumentation, kører AI-analysen på tværs af multiple dimensioner samtidigt. Det søger efter indikatorer for syntetisk eller manipuleret indhold, tjekker for kloning og duplikationsmønstre på tværs af betalers bredere ydelseshistorik og evaluerer adfærdsmæssig konsistens mellem dokumentationen og udbyderens historiske mønstre.
En ting, der er værd at bemærke, er, at systemet kan arbejde på tværs af en bred vifte af formater. Det håndterer tekstdokumenter i PDF, Word og XML, regneark, medicinske billeder og endda håndskrevne noter. Det betyder i praksis, at svindeldokumentation ikke ankommer i en enkelt pæn format, og et detektionssystem, der kun dækker en del af, hvad SIU-hold modtager, efterlader huller, som sofistikerede svindlere vil finde.
Fra hele denne analyse genererer systemet en risikoscore på en skala fra 0 til 100 med detaljerede forklaringer, så undersøgeren forstår nøjagtig, hvilke signaler drev scoren. Målet på hvert trin er at producere handlebare output i stedet for blot alerts, og at gøre det hurtigere og med større nøjagtighed end et mere generelt system. Hastighed betyder, fordi det eneste interventionspunkt, der ændrer svindelsøkonomi betydeligt, er før betaling er foretaget.
Deres platform fremhæver funktioner som kloning-detektion, delvis AI-genereringsidentifikation og adfærdsmæssig krydsreferencing mod ydelseshistorik. Kunne De gå igennem, hvordan disse signaler kombinerer for at producere en meningsfuld risikoscore for undersøgere?
Hver af disse funktioner målretter et andet svindelsmønster, og risikoscoren reflekterer, hvordan de interagerer i et bestemt tilfælde.
Kloning og duplikationsdetektion adresserer scenariet, hvor en enkelt ægte optegnelse replikeres på tværs af multiple fabrikerede patienter. Det, der gør det svært at fange uden AI, er, at variationerne kan være så subtile, at ingen enkelt dokument ser mistænkeligt ud i isolation. Mønstret bliver kun synligt, når du sammenligner på tværs af den fulde ydelsesbefolkning. Vores system kan overflade en samling af optegnelser, der ser unikke ud på overfladen, men i virkeligheden er afledninger af en fælles kilde.
Delvis AI-genereringsdetektion er vigtig, fordi sofistikerede svindlere ikke altid fabrikerer hele optegnelser fra scratch. Et mere almindeligt og svært at fange mønster er blanding, der indebærer at tage en ægte patientoptegnelse og bruge AI til at tilføje fabrikerede ekstra services eller procedurer. De ægte sektioner gør dokumentet troværdigt, men de tilføjede sektioner repræsenterer krav om ydelser, der aldrig blev leveret. Vores system er specifikt tilrettelagt til at finde disse tilfælde.
Adfærdsmæssig krydsreferencing forbinder dokumentationen, der gennemgås, til udbyderens fulde ydelseshistorik. Hvis dokumentationen præsenterer kliniske narrativer, der er inkonsistente med, hvordan udbyderen har dokumenteret lignende tilfælde historisk, eller hvis volumen og mønster af støttende optegnelser pludselig afviger fra baseline, er disse inkonsistenser signaler. På sig selv er ingen af dem konklusiv. Sammen, vægtet og forklaret i risikoscore-output, giver de undersøgeren en meningsfuld start, der ville tage timer eller dage at udvikle manuelt. Det, der gør dette forskelligt fra et system, der blot flagrer AI-genereret indhold, er kombinationen af signaler. Indholdsanalyse alene kan misse blandede dokumenter. Adfærdsmæssig analyse alene kan misse en første-gangs-svindler med ingen tidligere mønster. Det er intersectionen af alle tre lag samtidigt, behandlet på sekunder, der fanger, hvad andre AI-systemer ikke kan.
Set fra Deres perspektiv, hvad er nogle af de mest bekymringsvækkende deepfake-aktiverede sundheds-svindelskemaer, som forsikrings- og tilsynsmyndigheder bør være opmærksomme på i de næste par år?
Scenarierne, der bekymrer mig mest, er dem, der kombinerer skala med troværdighed på måder, der er svære at spore, selv med stærk detektion.
Adfærdssundhed er en reel sårbarhed. Dokumentationen for terapiydelser er overvejende narrativ, herunder sessionsnoter, behandlingsplaner og fremgangssummer. Der er ingen laboratorieværdier at krydsreferere, ingen billedanalyse at udføre. En svindler med adgang til en generalistisk sprogmodel kan generere klinisk troværdige adfærdssundhedsdokumentation i ekstraordinær volumen, og den eneste praktiske måde at detektere det på er at bruge AI, der kan evaluere, om dokumentationen viser de lingvistiske og strukturelle signaturer af syntetisk generering.
Diagnostisk billedsvindel er det andet område, jeg overvåger nøje. Frie og tilgængelige AI-værktøjer kan nu generere realistiske medicinske billedvariationer fra et enkelt seedbillede. Da disse værktøjer forbedres, vil de syntetiske outputs blive sværere at skelne fra ægte scanninger uden formål-bygget detektion. Betalere, hvis arbejdsgange ikke har nogen billedforensisk kapacitet, opererer på tillid til, at billederne, de modtager, er ægte.
Der er også en opstående bekymring omkring identitets- og autorisations-svindel, hvor AI-genereret dokumentation støtter svindelfuld udbyderenrolering eller forudgående autorisation for ydelser, der aldrig var medicinsk nødvendige. Disse skemaer er sværere at detektere, fordi svindelen er indlejret i optagelsesprocessen i stedet for i selv ydelsen, og ved den tid, det kommer frem i faktureringsdata, er skaden allerede sket.
Sundhedsydelser involverer ofte store mængder af dokumentation og støttende beviser. Hvordan kan et AI-system evaluere denne information hurtigt nok til at stoppe svindel-ydelser, før betaling er foretaget?
Hastighed er faktisk en kerne-designkrav, ikke et nice-to-have. Den eneste måde, Deepfake Detection er nyttig i praksis, er, hvis det opererer på samme hastighed som ydelses-pipeline. Hvis analyse tager timer eller kræver, at en menneske initierer en gennemgangskø, har du allerede overskredet forud-betalings-vinduet, og du er tilbage til at udføre recovery-arbejde efter, at pengene har forladt systemet.
Vores system er designet til at fuldføre analysen på sekunder. Når dokumentation indsendes til gennemgang, kører AI-analysen i parallel i stedet for sekventielt. Syntetisk indholdsanalyse, duplikationskontrol og adfærdsmæssig krydsreferencing sker samtidigt i stedet for i en kæde. Outputtet er en risikoscore med detaljerede forklaringer, så undersøgeren ikke behøver at fortolke rå signaler. De får en prioriteret, handlebar result. Den parallelle arkitektur er en del af, hvad der giver os mulighed for at gøre det hurtigere og med større nøjagtighed. At køre alle tre signal-lag samtidigt betyder, at risikoscoren reflekterer det fulde billede af et tilfælde, ikke kun det første flag, der overflader.
Det bredere punkt her er, at skiftet, vi forsøger at skabe på tværs af hele Codoxos arbejde, det, vi kalder Point Zero, er at flytte betalingsintegritets-intervention så langt opstrøms som muligt. At fange en svindel-ydelse, før betaling er foretaget, er dramatisk mere effektivt end at gendanne en overbetaling efter faktisk. Gendannelse er dyrt, langsomt og ofte ufuldstændigt. Forebyggelse på dokumentations- og bevisvaliderings-stadiet ændrer økonomien i hele problemet.
Fra Deres perspektiv, hvordan sikrer De, at AI-genererede risikoscores kan forstås og tillides af Special Investigation Units og betalingsintegritets-hold?
Fortolkelighed er ikke valgfri i denne domæne. Hvis en SIU-undersøger skal handle på en risikoscore, enten det indebærer at holde en ydelse, åbne en sag eller bygge en henvisning til strafforfølgelse, har de brug for at kunne articulere, hvad systemet fandt, og hvorfor. En sort-kasse-output, der siger “høj risiko”, er ikke et nyttigt værktøj i en arbejdsgang, der har juridisk og regulativ ansvarlighed knyttet til det.
Hver risikoscore, vores system genererer, inkluderer specifikke svindelindikatorer, der kan inkludere signalerne, der drev scoren, mønstrene, der blev identificeret, og inkonsistenserne, der blev overflader. Undersøgeren kan følge fornuftningen fra scoren tilbage til beviset. Denne niveau af specifikation er kun mulig, fordi den underliggende detektion er tilrettelagt specifikt til sundhedsdokumentation.
Vi byggede også en tilpasset prompt-funktion, der giver undersøgere mulighed for at tilpasse analysen til specifikke undersøgelsesscenarioer og unikke svindelsmønstre. Det er vigtigt for fortolkelighed i praksis, fordi det betyder, at systemet ikke kører en one-size-fits-all-analyse og beder undersøgere om at fortolke generiske output. De kan forme udfordringen baseret på, hvad de faktisk søger efter i et bestemt tilfælde, hvilket gør resultaterne mere brugbare og lettere at forklare til revisorer eller i retslige foranstaltninger.
På den regulative side er OIG, CMS og statsmyndighederne øger overvågningen af, hvordan organisationer bruger AI i svindelforebyggelse. At kunne demonstrere, at deres detektionsmetodologi er fortolkelig og gennemgangsbar, er ikke kun god praksis, men en komponent af ansvarlig implementering, der reducerer overholdelses-risiko.
Da generativ AI fortsætter med at forbedre sig, vil svindlere sandsynligvis blive mere sofistikerede. Hvordan designer Codoxo sine modeller til kontinuerligt at tilpasse sig, når nye former for syntetisk medicinsk dokumentation opstår?
Udfordringen er, at svindel er en adversativ natur. Da detektion forbedres, tilpasser taktikkerne på den anden side sig. Ethvert system, der trænes én gang og deployes uden opdatering, vil forringe over tid, da svindlere lærer, hvad der udløser det, og tilpasser sig. Det er det samme grundlæggende problem, der gør enhver statisk detektionsmetode utilstrækkelig, enten det er regelbaseret eller en fast AI-model, der ikke er designet til at opdatere. Sofistikationen af værktøjet betyder ikke noget, hvis den underliggende arkitektur ikke kan holde trit med truslen.
Vores tilgang er at behandle detektion som en kontinuerligt opdateret kapacitet i stedet for en fast produkt. Da nye svindelsmønstre overflader i systemet, og da AI-genererings-teknikker udvikler sig, føder disse mønstre tilbage til model-forbedring. Systemet er designet til at blive bedre til at identificere den opstående trussel, ikke kun truslerne, der eksisterede ved deployment. Dette er vigtigt, given hastigheden, hvormed generativ AI udvikler sig, og hastigheden, hvormed svindlere eksperimenterer med nye tilgange, herunder nogle adversative teknikker som trojan deepfake-motorer, der er designet til at underminere detektion.
Dette vil være en kontinuerlig kamp. Der er ingen endelig, løst tilstand. Forpligtelsen, vi har gjort, er at holde detektionskapaciteterne aktuelle med truslen, og vores agente-arkitektur er, hvad der giver os mulighed for at gøre det på skala.
Set fremad, tror De, at deepfake-detektion vil blive en standard-komponent i sundheds-infrastruktur, lignende hvordan anti-pengevask-systemer opererer i finans, eller vil branchen have brug for helt nye tilgange til tillid og validering af medicinske data?
Jeg tror, at Deepfake Detection vil blive standard-infrastruktur, og tidsrammen for det er kortere, end de fleste mennesker i branchen forventer. Før AML-rammer blev standard i finansielle tjenester, afhængte branchen tungt af regelbaseret detektion og manuel gennemgang. Skiftet skete, da truslen nåede en skala, der gjorde reaktiv detektion åbenbart utilstrækkelig, og da den regulative omgangsmåde kodificerede forventningen om, at finansielle institutioner ville have systematiske, kontinuerligt opdaterede kontroller på plads. Sundhedssektoren nærmer sig et lignende vendepunkt.
Hvad der allerede sker, er, at betalere, der deployer deepfake-detektion nu, gør det, fordi truslen er reel og nuværende, ikke fordi reguleringen kræver det. Da disse tidlige deploymenter genererer bevis for tab, der forhindres, og da AI-genererede svindelskemaer bliver mere synlige i gennemførelsesaktioner og offentlig rapportering, vil forventningen bredes ud over branchen.
Set fremad, da generativ AI fortsætter med at forbedre sig, kan branchen måske have brug for at omdefinere, hvordan dokumentationsægthed etableres på dokumentationsniveau i stedet for at validere efterfaktisk. Det kunne indebære kryptografisk bekræftelse af kliniske optegnelser på EHR-niveau, udbyder-identitetsvalidering integreret i dokumentationsarbejdsgangen eller andre mekanismer, der gør dokumentets oprindelse sporbart på måder, det ikke er nu. Detektion på ydelsesniveau er en nødvendig respons på den nuværende trussel. Men den varige løsning kan kræve at bygge validering dybere ind i infrastrukturen for, hvordan medicinske optegnelser oprettes og transmitteres. Tak for det gode interview, læsere, der ønsker at lære mere, skal besøge Codoxo.












