Interviews
Carl Rost, Principal Consultant at Patsnap – Interview Series

Carl Rost ist der Kopf hinter den künstlichen Intelligenz-gesteuerten Patent-Suchwerkzeugen bei Patsnap.
Patsnap steht an der Spitze der Innovationsintelligenz und nutzt die Kraft der künstlichen Intelligenz und des maschinellen Lernens, um durch Milliarden von Datensätzen zu filtern und es Innovatoren ermöglicht, wichtige Verbindungen herzustellen. Ihre bahnbrechende LLM-Technologie, die speziell für R&D- und IP-Professionals entwickelt wurde, navigiert mühelos durch Milliarden von Seiten mit Patenten täglich. Der AI-Assistent von Patsnap gibt konversationale Antworten auf Neuheitsfragen und kann spezifische Antworten innerhalb umfangreicher Texte finden. Zum Beispiel kann er genau bestimmen, ob ein bestimmter Widget-Typ bereits patentiert ist.
Können Sie einen Überblick darüber geben, wie der AI-Assistent von Patsnap funktioniert und welche seine Hauptfunktionen sind?
Ja! Es handelt sich um einen AI-Assistenten namens Hiro, der es Ihnen ermöglicht, Fragen zu einem bestimmten Patent oder sogar einem Ergebnissatz oder unserer gesamten Datenbank zu stellen! Er wurde trainiert, um Innovations- und patentbezogene Fragen zu verstehen und auf eine Weise zu antworten, die technische Fachleute und IP-Professionals zufriedenstellt. Eine kürzliche Weiterentwicklung ist, dass Hiro sogar dabei helfen kann, technische Probleme zu lösen und neue Richtungen für Erfindungen vorzuschlagen, indem er erfinderische Prinzipien auf technische Lösungen und Probleme anwendet, die in unserer Patent- und Literaturdatenbank gefunden wurden. Hiro funktioniert ein bisschen anders, je nachdem, ob Sie ihn in unseren Produkten für R&D oder für IP-Professionals verwenden.
Ich denke, was Hiro einzigartig macht, ist, dass er von der proprietären LLM von Patsnap angetrieben wird, und die Antworten verlinken Referenzen und Quellen aus der Bibliothek von Patsnap mit 200 Millionen Patents, 190 Millionen Literaturstücken, 254 Millionen chemischen Strukturen, 879 Millionen biologischen Sequenzen und 2 Milliarden Nachrichtenartikeln.
Welche Probleme löst diese Anwendung für Unternehmen?
Große Innovatoren sollten ihre Zeit mit Innovieren verbringen, nicht mit der Bestimmung der Neuheit von Produkten oder der Durchführung von Voruntersuchungen des Marktes. Patentdaten sind eine unserer reichsten Quellen technischer Informationen, die mit Journal-Daten vergleichbar sind, insbesondere in bestimmten Technologiefeldern. Für R&D war die Zeit, die es braucht, um diese Art von Daten zu finden und zu befragen, ein massiver Blockierer, um diese zu nutzen, aber Tools wie Hiro können diese Art von Informationen zum ersten Mal wirklich demokratisieren.
Für juristische Fachleute ist es üblich, Stunden, Tage, Wochen damit zu verbringen, Prior-Art- und Freedom-to-Operate-Suchen durchzuführen. Mit AI-Tools kann dies schneller und genauer durchgeführt werden, wodurch mehr Bandbreite für strategischere Arbeiten frei wird.
Bestehende AI-Tools sind entweder zu sehr verallgemeinert und daher nicht geeignet für den geistigen Eigentumsbereich oder sie sind Black-Boxen, mit keiner Transparenz hinsichtlich der Ressourcen, was das Vertrauen reduziert und Entscheidungen behindert. Mit Hiro verlinken wir Quellen und stellen sicher, dass die gesamte Sichtbarkeit während des gesamten Entwicklungsprozesses gewährleistet ist.
Welche waren die Hauptprobleme, mit denen Ihr Team während der Entwicklung der AI-Funktionen für Patsnap konfrontiert war, und wie haben Sie diese überwunden?
Wir wissen, dass Personen, die neue Erfindungen bauen, diese schützen möchten, daher stand die Sicherheit an erster Stelle, als wir Hiro entwickelten. Da das Modell, das Hiro antreibt, lokal ist und in unsere App integriert ist, verlässt keine Daten die Umgebung, um Drittanbieter zu vertrauen, die schwer zu vertrauen sind. Unsere Wettbewerber haben die Grundarbeit nicht geleistet und haben Drittanbieter-Modelle angebaut, die der Prüfung nicht standhalten. Wenn wir sagen, dass wir Modelle nicht auf Kundendaten trainieren, wissen wir, dass dies der Fall ist und können unseren Kunden zeigen, dass und was wir stattdessen tun. Im Gegensatz dazu setzen die Lösungen unserer Wettbewerber Sie durch Drittanbieter einem Risiko aus, die einen weniger als vorbildlichen Ruf in puncto Transparenz und Umgang mit Daten haben.
Können Sie erläutern, wie Hiro spezifische Neuheitsfragen beantwortet und welche Auswirkungen dies auf R&D- und IP-Workflows hat?
Mit Hiro können Benutzer Fragen wie “Was macht diese Erfindung neu?” oder “Wie würde sich dieses Patent in verschiedenen Rechtssystemen behaupten?” oder sogar “Wie baue ich einen tragbaren Jetpack” stellen und erhalten Antworten, die auf jeden Schritt des Erfindungsprozesses eingehen. Im Vergleich zu allgemeinen Modellen versteht Hiro wirklich, was ein Patent besonders macht. Benutzer müssen keine Patentexperten sein, um herauszufinden, was in ihrer Erfindung neu ist oder nicht, und können verstehen, welche Teile ihres Produkts oder Tools geschützt werden müssen.
Wie bewältigt Hiro die riesige Menge an Daten aus Patents und nicht-patentbezogener Literatur, um präzise und relevante Antworten zu liefern?
Wir haben umfangreiche Trainings auf diesem Datensatz durchgeführt und die Antworten mit Experten bewertet. Wir haben dann AI auf den Expertenantworten trainiert, die AI-Ausgaben bewertet und Experten die Ausgaben überprüfen lassen. Insgesamt haben wir Millionen von Datenpunkten auf diese Weise bewertet, um sicherzustellen, dass die Antworten für technische Fachleute und Patentexperten sinnvoll sind.
Wie nutzt Hiro große Sprachmodelle (LLMs), um die Effizienz von Patent-Suchen und IP-Analysen zu verbessern? Welche Arten von Daten wurden verwendet, um die proprietäre LLM von Patsnap zu trainieren, und wie stellen Sie ihre Genauigkeit und Zuverlässigkeit sicher?
Patsnap hat ein branchenspezifisches LLM entwickelt, um Hiro zu betreiben. Das LLM wurde auf Patentakten, akademischen Papieren und anderen Innovationsdaten trainiert, was ihm hilft, Informationen zu verstehen und auf eine Weise wiederzugeben, die für Fachleute hilfreicher ist als allgemeine Modelle. Um Genauigkeit und Zuverlässigkeit zu gewährleisten, haben wir strenge Methoden der Datenvorverarbeitung eingesetzt, einschließlich der Filterung von niedrigwertigen Daten, der Entduplizierung und der Neuschreibung. Wir haben auch neue Daten durch die Kombination verschiedener Quellen synthetisiert, um das Verständnis des Modells für IP-spezifische Nuancen zu verbessern. Wir haben das Feintuning und das Verstärkungslernen durch menschliches Feedback überwacht, um seine Leistung kontinuierlich zu verbessern.
PatsnapGPT wurde umfangreich getestet und hat GPT-4 in IP-spezifischen Aufgaben überboten, wodurch seine überlegenen Fähigkeiten bei der Erstellung, Klassifizierung, Zusammenfassung und Begründung im Patentrecht unter Beweis gestellt wurden.
Die proprietäre LLM ist transparent, verlinkt Quellen und Referenzen und wird nicht auf Kundendaten trainiert. Es ist der einzige Industrieteilnehmer, der ein in-house abgestimmtes LLM verwendet, in einer Branche, die besonders auf Datenprivatsphäre und Vertraulichkeit angewiesen ist.
Wie vergleicht sich die proprietäre LLM von Patsnap mit anderen allgemeinen LLMs wie GPT-4 in Bezug auf Leistung und Genauigkeit für IP-bezogene Aufgaben?
Die proprietäre LLM von Patsnap übertrifft GPT-4, wenn es um geistige Eigentumsabfragen geht. Mit dem USPTO-Patent-Prüfungsexamen erreichte PatsnapGPT-1.0 das Niveau eines IP-Experten, während allgemeine LLMs den Cut-off für Patentanwälte, die die Prüfung ablegen, nicht erreichten.
PatsnapGPT ragt wirklich heraus, wenn man sich ansieht, wie es in IP-spezifischen Benchmarks abschneidet. Hiro erzielt konsistent höhere Punktzahlen als allgemeine Modelle wie GPT-4 im USPTO-Patent-Prüfungsexamen. Allgemeine LLMs erreichen den 70-Punkte-Cut-off der Prüfung nicht, während PatsnapGPT 1.0 auf dem Niveau eines IP-Experten abschloss. Dies zeigt, dass es ein besseres Verständnis für IP-Grundlagen hat. Zusätzlich hat PatsnapGPT im PatentBench, einem umfassenden Benchmark für IP-Aufgaben, in mehreren Bereichen ausgezeichnet abgeschnitten. Es produzierte genauere und relevantere Texte für die Patentverfassung, erzielte höhere Punktzahlen bei der Klassifizierung von Patents nach dem Internationalen Patentsystem und seine Zusammenfassungen von technischen Effekten, Problemen, Methoden und Abstracts wurden von Evaluatoren konsistent höher bewertet. Es zeigt auch schnellere Geschwindigkeiten und geringeren Speicherbedarf im Vergleich zu GPT-4 für lange Patentsdokumente.
Wie sehen Sie die Rolle der künstlichen Intelligenz in der Zukunft im Bereich des geistigen Eigentums und der Forschung und Entwicklung über das nächste Jahrzehnt?
Ich sehe die künstliche Intelligenz in den nächsten zehn Jahren in der geistigen Eigentums- und Forschungs- und Entwicklungsbereiche eine immer zentralere Rolle spielen. Einerseits wird die künstliche Intelligenz die Effizienz und Genauigkeit von Patent-Suchen und -Analysen enorm verbessern. Fortgeschrittene AI-Modelle wie PatsnapGPT werden noch besser darin sein, komplexe technische Dokumente zu verstehen und zu kategorisieren, hochwertige Patentspezifikationen zu erstellen und potenzielle Verletzungen oder Überschneidungen in bestehenden Patents zu identifizieren. Dies wird eine enorme Menge an Zeit sparen und den Spielraum für menschliche Fehler reduzieren.
Darüber hinaus wird die künstliche Intelligenz die Art und Weise revolutionieren, wie wir mit großen Mengen an IP-Daten umgehen und diese interpretieren. Durch die Fähigkeit, große Datensätze schnell zu verarbeiten und zu analysieren, kann die künstliche Intelligenz Trends und Erkenntnisse aufdecken, die sonst möglicherweise unbemerkt bleiben. Dies kann zu besseren Entscheidungen und Strategien in der IP-Verwaltung und der Forschung und Entwicklung führen, wie z.B. die Identifizierung von aufkommenden Technologien, potenziellen Bereichen für Innovationen und strategischen Partnerschaften.
In der Forschung und Entwicklung wird die künstliche Intelligenz die Innovation vorantreiben, indem sie bei der Entdeckung hilft. Maschinelle Lernalgorithmen können vorherige Forschungsergebnisse analysieren, Ergebnisse vorhersagen und sogar neue Forschungsansätze vorschlagen, wodurch die Entdeckung und Entwicklung beschleunigt wird. Die künstliche Intelligenz kann auch Experimente simulieren und komplexe Systeme modellieren, wodurch der Bedarf an teuren und zeitaufwändigen physischen Tests reduziert wird.
Wenn die künstliche Intelligenz weiterentwickelt wird, wird ihre Integration in die IP- und R&D-Bereiche Kreativität, Effizienz und strategische Planung verbessern.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Patsnap besuchen.












