Connect with us

Carl Rost, Principal Consultant på Patsnap – Intervjuserie

Intervjuer

Carl Rost, Principal Consultant på Patsnap – Intervjuserie

mm

Carl Rost är hjärnan bakom de AI-drivna patent sökverktygen på Patsnap.

Patsnap står i framkanten av innovationsintelligens, och utnyttjar kraften från AI och maskinlärning för att gå igenom miljarder dataset, vilket möjliggör för innovatörer att göra viktiga kopplingar. Deras banbrytande LLM-teknik, anpassad för R&D- och IP-proffs, navigerar lätt genom miljarder sidor av patent varje dag. Patsnaps AI-assistent engagerar sig i konversationsliknande svar på nyhetsfrågor och kan peka ut specifika svar inom omfattande texter. Till exempel kan den med stor noggrannhet avgöra om en viss widgettyp redan är patenterad.

Kan du ge en översikt av hur Patsnaps AI-assistent fungerar och dess primära funktioner?

Självklart! Det är en AI-assistent som heter Hiro som låter dig ställa frågor om ett specifikt patent eller till och med ett resultatuppsättning eller vår hela databas! Den har tränats för att förstå innovations- och patentrelaterade frågor och svara på ett sätt som tillfredsställer tekniska ämnesexperter och IP-proffs. En nylig utveckling är att Hiro även kan hjälpa dig att lösa tekniska problem och föreslå nya riktningar för nya uppfinningar genom att tillämpa uppfinningsprinciper på tekniska lösningar och problem som har hittats i vår patent- och litteraturdatabas. Hiro fungerar lite annorlunda beroende på om du använder den i våra produkter som är för R&D eller för IP-proffs.

Jag tycker att det som gör Hiro unik är att den är driven av Patsnaps egna LLM, och svaren länkar referenser och källor från Patsnaps bibliotek på 200 miljoner patent, 190 miljoner stycken litteratur, 254 miljoner kemiska strukturer, 879 miljoner biologiska sekvenser och 2 miljarder nyhetsartiklar.

Vilka problem löser denna tillämpning för företag?

Stora innovatörer bör lägga sin tid på att innovativa, inte bestämma nyhetens förekomst av produkter eller göra förberedande forskning av marknaden. Patentdata är en av våra rikaste källor till teknisk information, som kan jämföras med journaldata, särskilt inom vissa tekniska områden. För R&D har tiden det tar att hitta och förhöra denna typ av data varit en enorm blockerare för att utnyttja detta, men verktyg som Hiro kan verkligen demokratisera denna typ av information för första gången.

För juridiska proffs är det vanligt att lägga timmar, dagar, veckor, på att köra prior art och frihet att operera sökningar. Med AI-verktyg kan detta göras snabbare och med större noggrannhet, vilket frigör bandbredd för mer strategiskt arbete.

Existerande AI-verktyg är antingen för allmänt och därmed inte lämpliga för immaterialrättens område, eller så är de svarta lådor, med ingen transparens vad gäller resurser, vilket reducerar förtroendet och hindrar beslutsfattandet. Med Hiro länkar vi tillbaka till källor och säkerställer full synlighet under alla utvecklingsskeden.

Vilka var de största utmaningarna ditt team stod inför medan de utvecklade AI-funktionerna för Patsnap, och hur övervann ni dem?

Vi vet att individer som bygger nya uppfinningar vill skydda dem, så säkerhet var topprioritet när vi byggde Hiro. Eftersom modellen som driver Hiro är lokal och inbyggd i vår app, lämnar ingen data miljön till tredje parter som är svåra att lita på. Våra konkurrenter gjorde inte grundarbetet och monterade på tredjepartsmodeller som inte står upp till granskning. När vi säger att vi inte tränar modeller på kunddata, vet vi att det är sant och kan visa våra kunder det och vad vi gör istället. I kontrast, våra konkurrenters lösningar utsätter dig för risk genom tredje parter som har ett mindre än strålande rykte när det gäller transparens och hantering av data.

Kunde du förklara hur Hiro svarar på specifika nyhetsfrågor och vilken påverkan detta har på R&D- och IP-arbetsflöden?

Med Hiro kan användare ställa frågor som “Vilka aspekter av denna uppfinning gör den ny?” eller “Hur skulle detta patent hålla i olika rättssystem?” eller till och med “hur man bygger en bärbar jetpack” och få svar som talar till varje steg i uppfinningsprocessen. Jämfört med allmänna modeller, förstår Hiro verkligen vad som gör ett patent speciellt. Användare behöver inte vara patentexperter för att komma till botten med vad som är eller inte är nytt inom sin uppfinning, och kan förstå på sekunder vilken del av deras produkt eller verktyg som behöver skyddas.

Hur hanterar Hiro den enorma mängden data från patent och icke-patentlitteratur för att ge precisa och relevanta svar?

Vi gjorde omfattande utbildning på den här dataseten, och betygsatte svaren med experter. Vi tränade sedan AI på expertsvaren, hade AI betygsätta utdata, och hade experter granska det. Allt som allt har vi betygsatt miljontals datapunkter på det här sättet för att säkerställa att svaren är meningsfulla för tekniska experter och patentproffs.

Hur använder Hiro stora språkmodeller (LLM) för att förbättra effektiviteten i patentsökningar och IP-analys? Vilka typer av data användes för att träna Patsnaps egna LLM, och hur säkerställer ni dess noggrannhet och tillförlitlighet?

Patsnap byggde en branschspecifik LLM för att driva Hiro. LLM har tränats på patentregister, akademiska artiklar och annan innovationsdata, vilket hjälper den att förstå och återberätta information på ett sätt som är mer hjälpsamt för proffs än allmänna modeller. För att säkerställa noggrannhet och tillförlitlighet använde vi rigorösa datormetoder för förbehandling, inklusive filtrering av lågkvalitetsdata, deduplicering och omformulering. Vi syntetiserade även ny data genom att kombinera olika källor för att förbättra modellens förståelse av IP-specifika nyanser. Vi övervakade finjustering och förstärkt inlärning från mänsklig feedback för att kontinuerligt förbättra dess prestanda.

PatsnapGPT har testats omfattande och har överträffat GPT-4 i IP-specifika uppgifter, vilket visar på överlägsna förmågor i utkast, klassificering, sammanfattning och resonemang inom patentdomänen.

Den egna LLM är transparent, länkar källor och referenser, och den är inte tränad på kunddata. Det är den enda branschaktören som använder en inbyggd LLM, i en bransch som är särskilt beroende av datasekretess och konfidentialitet.

Hur jämför Patsnaps egna LLM med andra allmänna LLM som GPT-4 när det gäller prestanda och noggrannhet för IP-relaterade uppgifter?

Patsnaps egna LLM överträffar GPT-4 när det gäller immaterialrättsfrågor. Med hjälp av den amerikanska patent- och varumärkesbyråns patentexamen, presterade PatsnapGPT-1.0 på en nivå som en IP-expert, medan allmänna LLM inte nådde upp till gränsen för patentadvokater som skriver examen.

PatsnapGPT sticker verkligen ut när man tittar på hur den presterar i IP-specifika benchmark. Hiro presterar konsekvent högre än allmänna modeller som GPT-4 på den amerikanska patent- och varumärkesbyråns patentexamen. Allmänna LLM klarar inte av att nå gränsen på 70 poäng på examen, medan PatsnapGPT 1.0 presterade på en nivå som en IP-expert. Detta visar att den har en bättre förståelse av IP-grunderna. Dessutom, i PatentBench, som är en omfattande benchmark för IP-uppgifter, presterade PatsnapGPT utmärkt i flera områden. Den producerade mer precisa och relevanta texter för patentförfattning, presterade högre i klassificering av patent enligt den internationella patentklassificeringssystemet, och dess sammanfattningar av tekniska effekter, problem, metoder och abstrakt var konsekvent högre betygsatta av utvärderare. Den visar också snabbare hastigheter och lägre minnesanvändning jämfört med GPT-4 för långa patentdokument.

Hur ser du på AI:s roll utvecklas inom immaterialrätt och forskning och utveckling under de kommande tio åren?

Jag ser AI spela en alltmer central roll inom immaterialrätt och forskning och utveckling under de kommande tio åren. För det första kommer AI att förbättra effektiviteten och noggrannheten i patentsökningar och analys. Avancerade AI-modeller som PatsnapGPT kommer att bli ännu bättre på att förstå och kategorisera komplexa tekniska dokument, utkast av högkvalitativa patentspecifikationer och identifiera potentiella intrång eller överlappningar i existerande patent. Detta kommer att spara en enorm mängd tid och reducera marginalen för mänskliga fel.

Dessutom kommer AI att revolutionera hur vi hanterar och tolkar stora mängder IP-data. Med förmågan att bearbeta och analysera stora dataset snabbt, kan AI avslöja trender och insikter som annars skulle gå obemärkt förbi. Detta kan informera bättre beslutsfattande och strategi inom IP-hantering och R&D, såsom att identifiera nya teknologier, potentiella områden för innovation och strategiska partnerskap.

Inom R&D kommer AI att driva innovation genom att hjälpa till i upptäcktsprocessen. Maskinlärningsalgoritmer kan analysera tidigare forskning, förutsäga resultat och till och med föreslå nya forskningsområden, vilket accelererar upptäckts- och utvecklingstakten. AI kan också simulera experiment och modellera komplexa system, vilket reducerar behovet av dyra och tidskrävande fysiska tester.

När AI-tekniken fortsätter att utvecklas, kommer dess integration i IP och R&D att förbättra kreativitet, effektivitet och strategisk planering.

Tack för den utmärkta intervjun, läsare som vill lära sig mer bör besöka Patsnap

Antoine är en visionär ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och främja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhället som elektricitet, och fångas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, är han dedikerad till att utforska hur dessa innovationer kommer att forma vår värld. Dessutom är han grundare av Securities.io, en plattform som fokuserar på att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.