Kunstig intelligens
Alexander Hudek, Co-Founder & CTO of Kira Systems – Interview Serie

Alex Hudek er Co-Founder & CTO of Kira Systems. Han har Ph.D og M.Math grader i datalogi fra University of Waterloo, og en B.Sc. fra University of Toronto i fysik og datalogi.
Hans tidligere forskning på bioinformatikområdet fokuserede på at finde ligheder mellem DNA-sekvenser. Han har også arbejdet med bevis-systemer og databaseforespørgselskompilation.
Hvornår blev du først interesseret i maskinlæring og AI?
Jeg har altid været interesseret i datalogi. På universitetet tog jeg kurser i algoritmer for planlægning og logik, maskinlæring og AI, numerisk beregning og andre emner. Min interesse for maskinlæring voksede mere specifikt under min ph.d. på University of Waterloo. Der brugte jeg maskinlæring til at studere DNA. Bagefter dykkede jeg dybere ned i formelle logikker som en del af min postdoc-forskning. Logik og resonnering er på en måde den “anden side” af mønten i tilgange til AI, og jeg følte, det var vigtigt at vide mere om det.
Noget af din tidligere forskning på bioinformatikområdet fokuserede på at finde ligheder mellem DNA-sekvenser. Kan du diskutere noget af dette arbejde?
Hovedparten af min afhandling bestod i at bygge en mere realistisk model for DNA-mutation ved hjælp af Hidden Markov Models. Jeg brugte denne mere komplekse model i en ny algoritme designet til at finde regioner af DNA, der deler fælles oprindelse med andre arter. I særdeleshed kan denne nye algoritme finde meget svagere relaterede sekvensområder end tidligere algoritmer til opgaven.
Før min ph.d. arbejdede jeg i et forskningslaboratorium, der var en del af det humane genomprojekt. Et af de mest bemærkelsesværdige projekter, jeg hjalp med at fuldføre, var den første komplette udraft af det humane kromosom 7.
Hvad var den oprindelige inspiration bag lanceringen af Kira?
Ideén til Kira kom fra min medstifter, Noah Waisberg. Han havde brugt timer i sin karriere som advokat på den slags arbejde, vi nu har bygget AI til at gøre. Det var en interessant idé for mig, fordi det involverede naturligt sprog og problemet var veldefineret, og jeg kunne se forretningspotentialet. Der er noget tiltrækkende ved at bygge AI, der kan forstå menneskesprog, fordi sprog er så tæt knyttet til menneskelig kognition.
Kan du beskrive, hvad Contract Analysis Software er, og hvordan det gavner juridiske fagfolk?
Kira bruger overvåget maskinlæring, hvilket betyder, at en erfaren advokat føder bestemmelser fra virkelige kontrakter ind i et system designet til at lære af disse eksempler. Systemet studerer disse data, lærer, hvad sprog er relevant, og bygger probabilistiske bestemmelsesmodeller. Modellerne testes derefter mod en sæt af annoterede aftaler, som systemet ikke kender, for at bestemme dets klarhed. Denne meget præcise maskinlæringsteknologi kan identificere og analysere næsten enhver bestemmelse i enhver kontrakt, hvilket resulterer i kunderrapporteret tidsbesparelse på 20-90%. Denne øgede produktivitet hjælper advokatfirmaer med at øge deres realisationsrater, giver dem mere mulighed for at øge deres omsætning og bevare deres eksisterende kunder. For virksomheder driver det bedre produktivitet internt og reducerer mængden af eksternt juridisk udgift, der kræves.
Naturlig sprogbehandling (NLP) er svært for de fleste virksomheder. Kan du diskutere nogle af de ekstra udfordringer, der står over for bearbejdning af juridisk terminologi og andre nuancer, der er unikke for den juridiske profession?
For mange mennesker kan juridisk sprog synes meget fremmed, men det viser sig, at det fra et maskinlæringssynspunkt ikke er så forskelligt. Der er nogle få mere unikke ting; kapitalisering er mere vigtig, og sætninger kan være meget længere end normalt, men samlet set har vi ikke behøvet væsentligt forskellige NLP-tilgange end i andre domæner.
En aspekt, der er væsentligt forskellig, er behovet for databeskyttelse og tilpasning. Juridiske fagfolk er forpligtede til at holde kundedata fortroligt, og brug af det i et maskinlæringprodukt, der samler eller deler træningsdata, er i modstrid med disse krav. Faktisk er det ofte ikke muligt at beholde træningsdata, da de har forpligtelser til at slette kundedata efter afslutning af et projekt. Derfor er det kritisk at kunne træne modeller uden udbydere i løkken, samt maskinlæringsteknikker, der gør det svært eller umuligt at genskabe nogen del af træningsdata ved at inspicere lærede modeller. Teknikker, der tillader dig at tage en eksisterende model og opdatere den med nye træningsdata uden at skulle træne fra scratch, er også en nødvendighed.
På tilpasningssiden er der behov for, at kunder kan bygge deres egne modeller. Dette skyldes, at for mere komplekse juridiske begreber kan der være rimelige uenigheder mellem fagfolk, og firmaer ønsker ofte at justere eller bygge modeller til at matche deres egne unikke positioner.
Kan du beskrive, hvordan dyb læring bruges til at kategorisere data i Kira-softwaren?
Vi bruger ikke meget dyb læring i vores produkt, selvom vores interne forskningsteam tilbringer en masse tid på at evaluere og udforske dyb læringssolutioner. Indtil videre har dyb læringsteknikker på de slags problemer, vi står over for, kun matchet ikke-dyb læringstilgange eller fået en meget lille øgning. Givet den enorme beregningsoverhead af dyb læringsmetodologier samt udfordringer i at holde træningsdata privat, har de ikke været tillokkende nok til at antage indtil videre.
Det sagde, finder vi dyb læringstilgange meget tillokkende og tror, de har potentiale til at blive store i NLP en dag. Derfor vurderer og udforsker vi kontinuerligt dyb læring NLP-tilgange, så vi kan være klar til at antage, når fordelene begynder at overveje ulemperne.
Hvad er nogle af de indbyggede bestemmelsesmodeller, som Kira tilbyder?
For tiden kan Kira identificere og trække over 1.000 indbyggede bestemmelser, klausuler og datafelter (smart felter). De relaterer til en mængde forskellige emner, fra M&A Due Diligence – som Kira oprindeligt var koncepteret til at hjælpe med – til Brexit; til Ejendom. De smarte felter er bygget af vores team af fagfolk, der inkluderer erfarne advokater og revisorer. Med vores maskinlæringsteknologi kræver Kira’s standarder, at næsten hver smart felt opnår en minimum på 90% genkald, hvilket betyder, at vores software vil finde 90% eller mere af den bestemmelse, klausul eller datafelt, du specifikt søger efter i dine kontrakter eller dokumenter, hvilket reducerer risici og fejl i kontraktgennemgangsprocessen. Derudover kan et ubegrænset antal brugerdefinerede felter oprettes/læres af et firma for at automatisk identificere og trække relevante indsigt ved hjælp af vores Quick Study-værktøj.
Den juridiske verden er ofte kendt for at være langsom til at antage nye teknologier. Finder du, at der er en uddannelseshindring, når det kommer til at uddanne advokatfirmaer?
Advokater kan lide at vide, hvordan ting fungerer, så uddannelse er vigtig. Det er ikke sværere at undervise advokater om maskinlæring og AI end andre fagfolk, men det er bestemt påkrævet at have træningsmateriale klar. Mange af antagelseshindringene er sociale; mennesker spørger ofte om bedste praksis i tilpasning af deres interne processer til at bruge AI eller er interesseret i, hvordan de kan bruge AI til at ændre deres forretningsudbud på en måde, der giver dem fordele ud over blot effektivitetsforbedringer.
I forhold til, da vi startede Kira Systems i 2011, er advokatfirmaer i dag meget mere kyndige om AI og teknologi. Mange har innovationshold, der er opgaver med at undersøge nye teknologier og opmuntre til antagelse af nye løsninger.
Er der noget andet, du gerne vil dele om Kira?
Akademisk litteratur og åbne kilde maskinlæring biblioteker var afgørende for at hjælpe os med at starte virksomheden. Vi tror, at åben information og software er en enorm fordel for verden. I lyset heraf er jeg særligt glad for, at vores forskningsteam offentliggør resultaterne af mange af vores forskningsindsats i akademiske tidsskrifter og konferencer. Ud over at demonstrere, at vi presser grænserne for den aktuelle tilstand, tillader dette os at give tilbage til de samfund, der hjalp os med at starte, og som vi fortsat får en masse værdi fra. Du kan finde vores papirer på https://kirasystems.com/science/.
For at lære mere besøg Kira Systems.












