Kunstig intelligens
Alexander Hudek, medgrunnlegger og CTO av Kira Systems – Intervju-serie

Alex Hudek er medgrunnlegger og CTO av Kira Systems. Han har Ph.D og M.Math grader i datavitenskap fra University of Waterloo, og en B.Sc. fra University of Toronto i fysikk og datavitenskap.
Hans tidligere forskning innen bioinformatikk fokuserte på å finne likheter mellom DNA-sekvenser. Han har også arbeidet innen områdene bevis-systemer og database-spørring-kompilering.
Når ble du først interessert i maskinlæring og AI?
Jeg har alltid vært interessert i datavitenskap. I undergraduate tok jeg kurs i algoritmer for planlegging og logikk, maskinlæring og AI, numerisk beregning og andre emner. Min interesse for maskinlæring økte mer spesifikt under min PhD ved University of Waterloo. Der brukte jeg maskinlæring-metoder til å studere DNA. Etterpå dykket jeg dyptere inn i formelle logikker som en del av min postdoktorale forskning. Logikk og resonnering er på noen måter “den andre siden” av mynten i tilnærminger til AI, og jeg følte det var viktig å vite mer om det.
Noen av din tidligere forskning innen bioinformatikk fokuserte på å finne likheter mellom DNA-sekvenser. Kan du diskutere noe av dette arbeidet?
Hoveddelen av min avhandling bestod i å bygge en mer realistisk modell for DNA-mutasjon ved hjelp av Hidden Markov Models. Jeg brukte denne mer komplekse modellen i en ny algoritme designet til å finne regioner av DNA som deler felles opphav med andre arter. Spesifikt kan denne nye algoritmen finne mye svakere relaterte sekvensområder enn tidligere algoritmer for oppgaven.
Før min PhD arbeidet jeg i en forskningslaboratorium som var en del av det humane genoom-prosjektet. En av de mest bemerkelsesverdige prosjektene jeg hjalp til å fullføre, var den første komplette utkastet til det humane kromosom 7.
Hva var den innledende inspirasjonen bak lanseringen av Kira?
Ideén til Kira kom fra min medgrunnlegger, Noah Waisberg. Han hadde brukt timer i sin karriere som advokat på å gjøre den type arbeid vi nå har bygget AI til å gjøre. Det var en interessant idé for meg, fordi det involverte naturlig språk, og problemet var godt avgrenset, og jeg kunne se forretningspotensialet. Det er noe tiltrekkende ved å bygge AI som kan forstå menneskelig språk, fordi språk er så nært knyttet til menneskelig kognisjon.
Kan du beskrive hva kontraktanalyse-programvare er, og hvordan det fordeler seg til juridiske fagfolk?
Kira bruker overvåket maskinlæring, det vil si at en erfaren advokat matet inn bestemmelser fra virkelige kontrakter inn i et system designet til å lære fra disse eksemplene. Systemet studerer disse dataene, lærer hva språk som er relevant, og bygger probabilistiske modeller for bestemmelser. Modellene testes deretter mot en sett med annoterte avtaler som systemet ikke er kjent med, for å bestemme dets beredskap. Denne høyt nøyaktige maskinlæringsteknologien kan identifisere og analysere nesten alle bestemmelser i en kontrakt, resulterende i kundeanmeldte tidsbesparelser på 20-90%. Denne økte produktiviteten hjelper advokatfirmaer ved å øke deres realiseringsrater, gir dem mer mulighet til å øke inntektene og bevare eksisterende kunder. For korporasjoner driver det bedre produktivitet internt, og reduserer mengden eksterne juridiske utgifter som kreves.
Naturlig språkbehandling (NLP) er vanskelig for de fleste selskaper. Kan du diskutere noen av de ekstra utfordringene som møtes når det gjelder å prosessere juridisk terminologi og andre nyanser som er unike for den juridiske profesjonen?
For mange mennesker kan juridisk språk virke svært fremmed, men det viser seg at det fra et maskinlæring-perspektiv ikke er så forskjellig. Det er noen få unike ting; stor skrift er viktigere, og setninger kan være mye lengre enn normalt, men ellers har vi ikke behøvd vesentlig forskjellige NLP-tilnærminger enn i andre domener.
En aspekt som er vesentlig forskjellig er behovet for data-privatitet og tilpasning. Juridiske fagfolk er pålagt å holde klientdata konfidensielt, og å bruke det i et maskinlæring-produkt som samler eller deler trening-data, er i strid med disse kravene. Faktisk er det ofte ikke mulig å beholde trening-data, da de har plikter til å slette klient-data etter at et prosjekt er avsluttet. Derfor er det kritisk å kunne trene modeller uten at leverandører er involvert, samt maskinlæring-teknikker som gjør det vanskelig eller umulig å gjenvinne noen del av trening-data ved å inspisere lært modeller. Teknikker som lar deg ta en eksisterende modell og oppdatere den med nye trening-data uten å måtte trene fra scratch, er også et måtte-ha.
På tilpasning-siden er det et behov for kunder å kunne bygge sine egne modeller. Dette er fordi for mer komplekse juridiske konsepter kan det være rimelige uenigheter blant fagfolk, og firmaer ofte ønsker å justere eller bygge modeller for å matche deres egne unike posisjoner.
Kan du beskrive hvordan dypt læring brukes til å kategorisere data innen Kira-programvaren?
Vi bruker ikke mye dypt læring i vårt produkt, selv om vårt interne forskningsteam tilbringer mye tid på å evaluere og utforske dypt læring-løsninger. Så langt, på de typene problemer vi møter, matcher dypt læring-teknikker bare ikke-dypt læring-tilnærminger, eller får på beste vis en svært liten økning. Gitt den enorme beregnings-overhodet til dypt læring-metodologier, samt utfordringer i å holde trening-data privat, har de ikke vært overbevisende nok til å adoptere så langt.
Hva er noen av de innebygde bestemmelsesmodellene som Kira tilbyr?
For øyeblikket kan Kira identifisere og trekke ut over 1.000 innebygde bestemmelser, klausuler og data-punkter (smart-felt). De relatere til en mengde forskjellige emner, fra M&A Due Diligence – som Kira opprinnelig var konseptualisert til å assistere med – til Brexit; til eiendom. Smart-feltene er bygget av vårt team av fagfolk som inkluderer erfaren advokater og regnskapsførere. Med vår maskinlæring-teknologi, krever Kira-standarden at nesten hver smart-felt oppnår en minimum av 90% gjentakelse, det vil si at vårt programvare vil finne 90% eller mer av bestemmelsen, klausulen eller data-punktet du spesifikt søker etter i dine kontrakter eller dokumenter, og reduserer risiko og feil i kontrakt-gjennomgangs-prosessen. I tillegg kan et ubegrenset antall tilpassede felter skapes/læres av et firma for å automatisk identifisere og trekke ut relevante innsikter ved hjelp av vårt Quick Study-verktøy.
Den juridiske verden er ofte kjent for å være seig til å adoptere ny teknologi. Finner du at det finnes en utdannings-hindringsverdi når det gjelder å utdanne advokatfirmaer?
Advokater liker virkelig å vite hvordan ting fungerer, så utdanning er viktig. Det er ikke harder å undervise advokater om maskinlæring og AI enn andre fagfolk, men det er definitivt påkrevd å ha treningsmateriell klart. Mange av adopterings-hindringsverdiene er sosiale også; folk spør ofte om beste praksis i tilpasning av interne prosesser til å bruke AI, eller er interessert i hvordan de kan bruke AI til å endre sine forretnings-tilbud på en måte som gir dem fordeler utover bare effektivitets-forbedringer.
I sammenligning med da vi startet Kira Systems i 2011, er advokatfirmaer i dag mye mer kyndige om AI og teknologi. Mange har innovasjons-team som er oppnevnt til å undersøke ny teknologi og oppmuntre til adoptering av nye løsninger.
Er det noe annet du ønsker å dele om Kira?
Akademisk litteratur og åpne kilde-maskinlæring-biblioteker var instrumental i å hjelpe oss å starte selskapet. Vi tror at åpen informasjon og programvare er en enorm fordel for verden. I lys av dette, er jeg spesielt glad for at vårt forskningsteam publiserer resultater fra mange av våre forsknings-innsatsene i akademiske tidsskrifter og konferanser. Bortsett fra å demonstrere at vi presser grensene for nåværende kunnskap, lar dette oss gi tilbake til samfunnene som hjalp oss å starte, og som vi fortsatt får en mengde verdi fra. Du kan finne våre papirer på https://kirasystems.com/science/.
For å lære mer, besøk Kira Systems.












