Intervjuer
Carl Rost, Principal Consultant i Patsnap – Intervju-serie

Carl Rost er hjernen bak AI-drevne patentsøk-verktøyene i Patsnap.
Patsnap står i forkant av innovasjonsintelligens, og utnytter kraften fra AI og maskinlæring til å gå gjennom milliarder av datasett, og muliggjør at innovatører kan etablere viktige forbindelser. Deres banebrytende LLM-teknologi, tilpasset for R&D og IP-proff, navigerer lett gjennom milliarder av sider med patenter daglig. Patsnaps AI-assistent deltar i samtale-svar på nyhets-spørsmål og kan peke på spesifikke svar innen omfattende tekster. For eksempel kan den nøyaktig bestemme om en bestemt type widget allerede er patentert.
Kan du gi en oversikt over hvordan Patsnaps AI-assistent fungerer og dens primære funksjoner?
Ja! Det er en AI-assistent som heter Hiro som lar deg stille spørsmål om et bestemt patent eller selv et resultatsett eller vår hele database! Det er blitt trent til å forstå innovasjon og patent-relaterte spørsmål og svare på en måte som tilfredsstiller tekniske fagfolk og IP-proff. En ny utvikling er at Hiro også kan hjelpe deg med å løse tekniske problemer og foreslå nye retninger for nye oppfinnelser ved å anvende oppfinnelsesprinsipper til tekniske løsninger og problemer som er funnet i vår patent- og litteraturdatabase. Hiro fungerer litt annerledes avhengig av om du bruker det i våre produkter som er for R&D eller for IP-proff.
Jeg tror det som gjør Hiro unikt er at det er drevet av Patsnaps proprietære LLM, og svarene linker også referanser og kilder fra Patsnaps bibliotek på 200 millioner patenter, 190 millioner litteraturstykker, 254 millioner kjemiske strukturer, 879 millioner biologiske sekvenser og 2 milliarder nyhetsartikler.
Hvilke problemer løser denne applikasjonen for bedrifter?
Store innovatører bør bruke tiden sin på å innovere, ikke på å bestemme nyskapning av produkter eller gjøre forhåndssøk i markedet. Patentdata er en av våre rikeste kilder til teknisk informasjon, likeverdig med tidsskriftdata, spesielt i visse teknologifelter. For R&D har tiden det tar å finne og avhøre denne typen data vært en massiv blokkering for å utnytte dette, men verktøy som Hiro kan virkelig demokratisere denne typen informasjon for første gang.
For juridiske proff er det vanlig å bruke timer, dager, uker, på å kjøre prior art og frihet til å operere-søk. Med AI-verktøy kan dette gjøres raskere og med mer nøyaktighet, og frigjøre kapasitet for mer strategisk arbeid.
Eksisterende AI-verktøy er enten for generelle og derfor ikke egnet for det intellektuelle eiendomsrommet, eller de er black boxes, uten gjennomsiktighet når det gjelder ressurser, og reduserer tillit og hindrer beslutningstaking. Med Hiro linker vi tilbake til kilder og sikrer full synlighet på alle stadier av utviklingsprosessen.
Hva var de største utfordringene din gruppe møtte mens de utviklet AI-funksjonene for Patsnap, og hvordan overvant de dem?
Vi vet at personer som bygger nye oppfinnelser ønsker å holde dem beskyttet, så sikkerhet var topprioritet når vi bygget Hiro. Ettersom modellen som driver Hiro er lokal og bygget inn i vår app, forlater ingen data miljøet til tredjeparter som er vanskelige å stole på. Våre konkurrenter gjorde ikke grunnarbeidet og festet på tredjepartsmodeller som ikke holder mål når det gjelder skruppel. Når vi sier at vi ikke trener modeller på kundedata, vet vi at det er sant og kan vise våre kunder det og hva vi gjør i stedet. I motsetning til våre konkurrenters løsninger, som utsetter deg for risiko gjennom tredjeparter som har en mindre enn strålende rykte når det gjelder gjennomsiktighet og håndtering av data.
Kunne du utdype hvordan Hiro svarer på spesifikke nyskapningsspørsmål og hvilken innvirkning dette har på R&D og IP-arbeidsflyter?
Med Hiro kan brukerne stille spørsmål som “Hva aspekter av denne oppfinnelsen gjør den nyskapende?” eller “Hvordan kan dette patentet holde seg i forskjellige rettssystemer?” eller selv “hvordan bygge en bærbart jetpack” og få svar som taler til hver fase av oppfinnelsesprosessen. I sammenligning med generalistmodeller, forstår Hiro virkelig hva som gjør et patent spesielt. Brukerne trenger ikke å være patent-ekspert for å komme til bunns i hva som er eller ikke er nyskapende innenfor deres oppfinnelse, og kan forstå på sekunder hvilken del av deres produkt eller verktøy som må beskyttes.
Hvordan håndterer Hiro den enorme mengden data fra patenter og ikke-patentlitteratur for å gi presise og relevante svar?
Vi gjorde omfattende trening på den datasetten, og vurderte svarene med eksperter. Vi trente så AI på ekspertsvarene, lot AI vurdere utgangen, og lot eksperter gjennomgå det. Alt i alt har vi vurdert millioner av datapunkter på denne måten for å sikre at svarene er meningsfulle for tekniske eksperter og patentproff.
Hvordan utnytter Hiro store språkmodeller (LLM) for å forbedre effektiviteten i patentsøk og IP-analyse? Hvilke typer data ble brukt til å trene Patsnaps proprietære LLM, og hvordan sikrer du dens nøyaktighet og pålitelighet?
Patsnap bygget en bransjespesifikk LLM for å drive Hiro. LLM er trent på patentopptak, akademiske papirer og andre innovasjonsdata, som hjelper det til å forstå og fortelle informasjon på en måte som er mer nyttig for proff enn generalistmodeller. For å sikre nøyaktighet og pålitelighet, anvendte vi strenge datapreprosesseringsmetoder, inkludert filtrering ut av lavkvalitetsdata, duplikasjon og omskrivning. Vi syntetiserte også nye data ved å kombinere forskjellige kilder for å forbedre modellens forståelse av IP-spesifikke nuanser. Vi overvåket finjustering og forsterkingslæring fra menneskelig tilbakemelding for å kontinuerlig forbedre dens ytelse.
PatsnapGPT har blitt testet omfattende og har overgått GPT-4 i IP-spesifikke oppgaver, og demonstrert overlegne evner i utkast, klassifisering, sammenfatting og resonnering innenfor patentdomenet.
Den proprietære LLM er gjennomsiktig, linker kilder og referanser, og er ikke trent på kundedata. Det er den eneste bransjespilleren som bruker en innbygd justert LLM, i en bransje som er spesielt avhengig av datavern og konfidensialitet.
Hvordan sammenligner Patsnaps proprietære LLM med andre generelle LLM som GPT-4 når det gjelder ytelse og nøyaktighet for IP-relaterte oppgaver?
Patsnaps proprietære LLM overgår GPT-4 når det gjelder intellektuelt eiendoms-spørsmål. Ved å bruke USPTO Patent Bar Exam, utførte PatsnapGPT-1.0 på samme nivå som en IP-ekspert, mens generelle LLM ikke nådde grensen for patentadvokater som tok eksamen.
PatsnapGPT skiller seg virkelig ut når du ser på hvordan det utfører seg i IP-spesifikke benchmark. Hiro scorer konsekvent høyere enn generelle modeller som GPT-4 på USPTO Patent Bar Exam. Generelle LLM feiler i å nå 70-poeng-grensen på eksamen, mens PatsnapGPT 1.0 scoret på samme nivå som en IP-ekspert. Dette viser at det har en bedre forståelse av IP-grunnleggende prinsipper. I tillegg, i PatentBench, som er en omfattende benchmark for IP-oppaver, utmerket PatsnapGPT seg i flere områder. Det produserte mer nøyaktige og relevante tekster for patent-skriving, scoret høyere i klassifisering av patenter ifølge den internasjonale patent-klassifiseringssystemet, og sammenfatninger av tekniske effekter, problemer, metoder og abstrakter ble konsekvent bedømt høyere av evaluatorene. Det viser også raskere hastigheter og lavere minnebruk sammenlignet med GPT-4 for lange patentdokumenter.
Hvordan ser du for deg rollen til AI utvikle seg i feltet intellektuell eiendom og forskning og utvikling over de neste ti årene?
Jeg ser AI spille en stadig mer sentral rolle i intellektuell eiendom og forskning og utvikling over de neste ti årene. For det første vil AI øke effektiviteten og nøyaktigheten i patentsøk og -analyse. Avanserte AI-modeller som PatsnapGPT vil bli enda bedre til å forstå og kategorisere komplekse tekniske dokumenter, utkast av høykvalitetspatentspesifikasjoner og identifisere potensielle overtredelser eller overlapp i eksisterende patenter. Dette vil spare en enorm mengde tid og redusere marginen for menneskelig feil.
I tillegg vil AI revolusjonere hvordan vi håndterer og tolker enorme mengder IP-data. Med evnen til å prosessere og analysere store datasett raskt, kan AI avdekke trender og innsikter som ellers ville gå ubemerket. Dette kan informere bedre beslutningstaking og strategi i IP-håndtering og R&D, som å identifisere nye teknologier, potensielle områder for innovasjon og strategiske partnerskap.
I R&D vil AI drive innovasjon ved å hjelpe i oppdagelsesprosessen. Maskinlæringsalgoritmer kan analysere tidligere forskning, forutsi resultater og selv foreslå nye retninger for undersøkelse, og akselerere tempoet i oppdagelse og utvikling. AI kan også simulere eksperimenter og modellere komplekse systemer, og redusere behovet for kostbare og tidskrevende fysiske forsøk.
Ettersom AI-teknologien fortsetter å utvikle seg, vil dens integrasjon i IP og R&D forbedre kreativitet, effektivitet og strategisk planlegging.
Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Patsnap.












