Connect with us

Alexander Hudek, Co-Fondateur & CTO de Kira Systems – Série d’entretiens

Intelligence artificielle

Alexander Hudek, Co-Fondateur & CTO de Kira Systems – Série d’entretiens

mm

Alex Hudek est le Co-Fondateur & CTO de Kira Systems. Il détient des diplômes de Ph.D et M.Math en informatique de l’Université de Waterloo, ainsi qu’un B.Sc. de l’Université de Toronto en physique et en informatique.

Ses recherches passées dans le domaine de la bioinformatique se sont concentrées sur la recherche de similarités entre les séquences d’ADN. Il a également travaillé dans les domaines des systèmes de preuve et de la compilation de requêtes de base de données.

Quand avez-vous initialement développé un intérêt pour l’apprentissage automatique et l’IA ?

J’ai toujours été intéressé par l’informatique. En licence, j’ai suivi des cours sur les algorithmes de planification et de logique, l’apprentissage automatique et l’IA, l’informatique numérique et d’autres sujets. Mon intérêt pour l’apprentissage automatique a grandi plus spécifiquement pendant mon doctorat à l’Université de Waterloo. Là, j’ai utilisé des méthodes d’apprentissage automatique pour étudier l’ADN. Par la suite, j’ai plongé plus profondément dans les logiques formelles dans le cadre de mes recherches postdoctorales. La logique et le raisonnement sont en quelque sorte l'”autre côté” de la pièce dans les approches de l’IA et je pensais qu’il était important d’en savoir plus à ce sujet.

Certaines de vos recherches passées dans le domaine de la bioinformatique se sont concentrées sur la recherche de similarités entre les séquences d’ADN. Pouvez-vous discuter de certains de ces travaux ?

La principale partie de ma thèse consistait à élaborer un modèle d’mutation d’ADN plus réaliste à l’aide de modèles de Markov cachés. J’ai utilisé ce modèle plus complexe dans un nouvel algorithme conçu pour trouver des régions d’ADN qui partagent une ascendance commune avec d’autres espèces. En particulier, cet nouvel algorithme peut trouver des régions de séquences plus faiblement liées que les algorithmes précédents pour cette tâche.

Avant mon doctorat, j’ai travaillé dans un laboratoire de recherche qui faisait partie du projet génome humain. L’un des projets les plus notables que j’ai aidé à terminer était le premier projet complet du chromosome 7 humain.

Quelle a été l’inspiration initiale derrière le lancement de Kira ?

L’idée de Kira est venue de mon co-fondateur, Noah Waisberg. Il avait passé des heures dans sa carrière d’avocat à faire le type de travail que nous avons maintenant construit l’IA pour faire. C’était une idée intéressante pour moi car elle impliquait le langage naturel et le problème était bien défini, et je pouvais voir le potentiel commercial. Il y a quelque chose d’attirant dans la construction d’une IA qui peut comprendre le langage humain car le langage est si étroitement lié à la cognition humaine.

Pouvez-vous décrire ce qu’est le logiciel d’analyse de contrats et comment il bénéficie aux professionnels du droit ?

Kira utilise l’apprentissage automatique supervisé, ce qui signifie qu’un avocat expérimenté alimente des dispositions de contrats réels dans un système conçu pour apprendre à partir de ces exemples. Le système étudie ces données, apprend quel langage est pertinent et construit des modèles de dispositions probabilistes. Les modèles sont ensuite testés contre un ensemble d’accords annotés que le système ne connaît pas pour déterminer sa préparation. Cette technologie d’apprentissage automatique très précise peut identifier et analyser virtuellement toute disposition dans tout contrat, ce qui entraîne des économies de temps signalées par les clients de 20 à 90 %. Cette augmentation de la productivité aide les cabinets d’avocats en augmentant leurs taux de réalisation, leur donne plus d’opportunités pour augmenter leurs revenus et préserver leurs clients existants. Pour les entreprises, cela améliore la productivité interne, réduisant ainsi le montant des dépenses juridiques externes requises.

Le traitement du langage naturel (NLP) est difficile pour la plupart des entreprises. Pouvez-vous discuter de certains des défis supplémentaires auxquels vous êtes confrontés lors du traitement de la terminologie juridique et d’autres nuances qui sont uniques à la profession juridique ?

Pour de nombreuses personnes, le langage juridique peut sembler très étranger, mais il s’avère que du point de vue de l’apprentissage automatique, ce n’est pas vraiment différent. Il y a quelques choses uniques ; la capitalisation est plus importante et les phrases peuvent être beaucoup plus longues que la normale, mais dans l’ensemble, nous n’avons pas besoin d’approches de NLP significativement différentes de celles des autres domaines.

Un aspect qui est significativement différent est le besoin de confidentialité des données et de personnalisation. Les professionnels du droit sont tenus de garder les données des clients confidentielles et d’utiliser ces données dans un produit d’apprentissage automatique qui regroupe ou partage des données de formation est en contradiction avec ces exigences. En fait, conserver même les données de formation est souvent impossible car ils ont des obligations de supprimer les données des clients après la conclusion d’un projet. Ainsi, être en mesure de former des modèles sans que les fournisseurs soient impliqués devient critique, ainsi que des techniques d’apprentissage automatique qui rendent difficile ou impossible de récupérer toute partie des données de formation en inspectant les modèles appris. Les techniques qui permettent de prendre un modèle existant et de le mettre à jour avec de nouvelles données de formation sans avoir à réentraîner à partir de zéro sont également essentielles.

Sur le plan de la personnalisation, il y a un besoin pour les clients de pouvoir construire leurs propres modèles. C’est parce que pour des concepts juridiques plus complexes, il peut y avoir un désaccord raisonnable entre les professionnels et les cabinets d’avocats qui souhaitent souvent ajuster ou construire des modèles pour correspondre à leurs propres positions uniques.

Pouvez-vous décrire comment l’apprentissage profond est utilisé pour catégoriser les données dans le logiciel Kira ?

Nous n’utilisons pas beaucoup d’apprentissage profond dans notre produit, bien que notre équipe de recherche interne passe beaucoup de temps à évaluer et à explorer les solutions d’apprentissage profond. Jusqu’à présent, pour les types de problèmes que nous rencontrons, les techniques d’apprentissage profond ne correspondent qu’aux approches non d’apprentissage profond, ou au mieux, obtiennent une très petite augmentation. Compte tenu de la charge de calcul énorme des méthodologies d’apprentissage profond, ainsi que des défis pour conserver la confidentialité des données de formation, ils n’ont pas été suffisamment convaincants pour être adoptés jusqu’à présent.

Ceci étant dit, nous trouvons les approches d’apprentissage profond très convaincantes et nous pensons qu’elles ont le potentiel de devenir importantes dans le NLP un jour. À cette fin, nous évaluons continuellement et explorons les approches de NLP d’apprentissage profond afin que nous puissions être prêts à adopter lorsque les avantages commenceront à l’emporter sur les inconvénients.

Quels sont certains des modèles de dispositions intégrés que Kira propose ?
Actuellement, Kira peut identifier et extraire plus de 1 000 dispositions, clauses et données intégrées (champs intelligents). Ils sont liés à une multitude de sujets différents, de la due diligence des fusions et acquisitions – que Kira a été initialement conçu pour aider – au Brexit ; à l’immobilier. Les champs intelligents sont construits par notre équipe d’experts en la matière, qui comprennent des avocats et des comptables expérimentés. Avec notre technologie d’apprentissage automatique, les normes de Kira exigent virtuellement que chaque champ intelligent atteigne un rappel minimum de 90 %, ce qui signifie que notre logiciel trouvera 90 % ou plus de la disposition, de la clause ou du point de données que vous recherchez spécifiquement dans vos contrats ou documents, réduisant ainsi les risques et les erreurs dans le processus d’examen des contrats. En outre, un nombre illimité de champs personnalisés peut être créé / enseigné par un cabinet pour identifier et extraire automatiquement des informations pertinentes à l’aide de notre outil d’étude rapide.

Le monde juridique est souvent connu pour être lent à adopter de nouvelles technologies. Trouvez-vous qu’il y a un obstacle d’éducation lorsqu’il s’agit d’éduquer les cabinets d’avocats ?

Les avocats aiment vraiment savoir comment les choses fonctionnent, l’éducation est donc importante. Il n’est pas plus difficile d’enseigner aux avocats sur l’apprentissage automatique et l’IA que d’autres professionnels, mais il est définitivement nécessaire d’avoir des matériaux de formation prêts. Beaucoup de obstacles à l’adoption sont également sociaux ; les gens demandent souvent des meilleures pratiques pour adapter leurs processus internes à l’utilisation de l’IA, ou sont intéressés par la façon dont ils peuvent utiliser l’IA pour modifier leurs offres commerciales d’une manière qui leur donne des avantages au-delà de la simple amélioration de l’efficacité.

Par rapport à quando nous avons lancé Kira Systems en 2011, les cabinets d’avocats d’aujourd’hui sont beaucoup plus avisés sur l’IA et la technologie. Beaucoup ont des équipes d’innovation chargées d’examiner de nouvelles technologies et d’encourager l’adoption de nouvelles solutions.

Y a-t-il autre chose que vous aimeriez partager sur Kira ?

La littérature universitaire et les bibliothèques de logiciels d’apprentissage automatique open source ont été instrumentales pour nous aider à lancer l’entreprise. Nous croyons que l’information ouverte et les logiciels sont un énorme avantage pour le monde. À la lumière de cela, je suis particulièrement heureux que notre équipe de recherche publie les résultats de nombreuses de nos recherches dans des revues universitaires et des conférences. Outre le fait de démontrer que nous repoussons les limites de l’état de l’art, cela nous permet de donner en retour aux communautés qui nous ont aidés à démarrer et dont nous continuons à tirer énormément de valeur. Vous pouvez trouver nos documents à https://kirasystems.com/science/.

Pour en savoir plus, visitez Kira Systems.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.