Interviews
Razi Raziuddin, co-fondateur et PDG de FeatureByte - Série d'interviews

Razi Raziuddin est le co-fondateur et PDG de Octet de fonctionnalité, sa vision est de débloquer le dernier obstacle majeur à la mise à l'échelle de l'IA dans l'entreprise. L'expérience d'analyse et de croissance de Razi couvre l'équipe de direction de deux startups licornes. Razi a aidé à faire passer DataRobot de 10 à 850 employés en moins de six ans. Il a été le pionnier d'une stratégie de mise sur le marché axée sur les services qui est devenue la marque de la croissance rapide de DataRobot.
FeatureByte a pour mission de faire évoluer l'IA d'entreprise, en simplifiant et en industrialisant radicalement les données d'IA. La plate-forme d'ingénierie et de gestion des fonctionnalités (FEM) permet aux scientifiques des données de créer et de partager des fonctionnalités de pointe et des pipelines de données prêts pour la production en quelques minutes, au lieu de plusieurs semaines ou mois.
Qu'est-ce qui vous a initialement attiré vers l'informatique et l'apprentissage automatique ?
En tant que personne qui a commencé à coder au lycée, j'étais fasciné par une machine à laquelle je pouvais «parler» et contrôler par le biais du code. J'ai été immédiatement accro aux possibilités infinies des nouvelles applications. L'apprentissage automatique a représenté un changement de paradigme dans la programmation, permettant aux machines d'apprendre et d'effectuer des tâches sans même spécifier les étapes du code. Le potentiel infini des applications ML est ce qui m'excite chaque jour.
Vous avez été la première entreprise à être embauchée chez DataRobot, une plateforme d'apprentissage automatique qui permet aux organisations de devenir axées sur l'IA. Vous avez ensuite contribué à faire passer l'entreprise de 10 à 1,000 6 employés en moins de XNUMX ans. Quels ont été les principaux enseignements de cette expérience ?
Passer de zéro à un est difficile, mais incroyablement excitant et gratifiant. Chaque étape de l'évolution de l'entreprise présente un ensemble de défis différents, mais voir l'entreprise grandir et réussir est un sentiment incroyable.
Mon expérience avec AutoML m'a ouvert les yeux sur le potentiel illimité de l'IA. Il est fascinant de voir comment cette technologie peut être utilisée dans tant d'industries et d'applications différentes. En fin de compte, créer une nouvelle catégorie est un exploit rare, mais incroyablement gratifiant. Mes principaux enseignements de l'expérience :
- Construisez un produit incroyable et évitez de courir après les modes
- N'ayez pas peur d'ĂŞtre Ă contre-courant
- Concentrez-vous sur la résolution des problèmes des clients et la création de valeur
- Soyez toujours ouvert Ă l'innovation et essayez de nouvelles choses
- Créer et inculquer la bonne culture d'entreprise dès le début
Pourriez-vous partager l'histoire de la genèse de FeatureByte ?
C'est un fait bien connu dans le monde de l'IA/ML : une excellente IA commence par d'excellentes données. Mais la préparation, le déploiement et la gestion des données (ou fonctionnalités) de l'IA sont complexes et chronophages. Mon co-fondateur, Xavier Conort, et moi avons vu ce problème de première main chez DataRobot. Alors que la modélisation s'est considérablement simplifiée grâce aux outils AutoML, l'ingénierie et la gestion des fonctionnalités restent un défi de taille. Sur la base de notre expérience et de notre expertise combinées, Xavier et moi avons estimé que nous pouvions vraiment aider les organisations à relever ce défi et à tenir la promesse de l'IA partout.
L'ingénierie des fonctionnalités est au cœur de FeatureByte, pourriez-vous expliquer ce que c'est pour nos lecteurs ?
En fin de compte, la qualité des données détermine la qualité et les performances des modèles d'IA. Les données qui sont introduites dans les modèles pour les former et prédire les résultats futurs sont appelées caractéristiques. Les caractéristiques représentent des informations sur les entités et les événements, telles que les données démographiques ou psychographiques des consommateurs, ou la distance entre un titulaire de carte et le commerçant pour une transaction par carte de crédit ou le nombre d'articles de différentes catégories d'un achat en magasin.
Le processus de transformation des données brutes en fonctionnalités - pour former des modèles ML et prédire les résultats futurs - est appelé ingénierie des fonctionnalités.
Pourquoi l'ingénierie des fonctionnalités est-elle l'un des aspects les plus compliqués des projets d'apprentissage automatique ?
L'ingénierie des fonctionnalités est extrêmement importante car le processus est directement responsable des performances des modèles ML. Une bonne ingénierie des fonctionnalités nécessite la réunion de trois compétences assez indépendantes : la connaissance du domaine, la science des données et l'ingénierie des données. La connaissance du domaine aide les data scientists à déterminer les signaux à extraire des données pour un problème ou un cas d'utilisation particulier. Vous avez besoin de compétences en science des données pour extraire ces signaux. Enfin, l'ingénierie des données vous aide à déployer des pipelines et à effectuer toutes ces opérations à grande échelle sur de gros volumes de données.
Dans la grande majorité des organisations, ces compétences vivent dans différentes équipes. Ces équipes utilisent des outils différents et ne communiquent pas bien entre elles. Cela entraîne beaucoup de frictions dans le processus et le ralentit jusqu'à un arrêt brutal.
Pourriez-vous expliquer pourquoi l'ingénierie des fonctionnalités est le maillon le plus faible de la mise à l'échelle de l'IA ?
Selon Andrew Ng, expert renommé en IA, "l'apprentissage automatique appliqué est essentiellement de l'ingénierie des fonctionnalités". Malgré son importance pour le cycle de vie de l'apprentissage automatique, l'ingénierie des fonctionnalités reste complexe, chronophage et dépendante des connaissances d'experts. Il y a une grave pénurie d'outils pour rendre le processus plus facile, plus rapide et plus industrialisé. L'effort et l'expertise requis empêchent les entreprises de déployer l'IA à grande échelle.
Pourriez-vous partager certains des défis liés à la création d'une solution d'IA centrée sur les données qui simplifie radicalement l'ingénierie des fonctionnalités pour les scientifiques des données ?
Construire un produit qui a un avantage 10X sur le statu quo est super difficile. Heureusement, Xavier possède une expertise approfondie en science des données qu'il utilise pour repenser l'ensemble du flux de travail des fonctionnalités à partir des premiers principes. Nous avons une équipe de classe mondiale de scientifiques et d'ingénieurs de données complets qui peuvent transformer notre vision en réalité. Et les utilisateurs et partenaires de développement de nous conseiller sur la rationalisation de l'UX pour résoudre au mieux leurs enjeux.
Comment la plate-forme FeatureByte accélérera-t-elle la préparation des données pour les applications d'apprentissage automatique ?
La préparation des données pour le ML est un processus itératif qui repose sur une expérimentation rapide. Le SDK FeatureByte open source est un framework déclaratif permettant de créer des fonctionnalités de pointe avec seulement quelques lignes de code et de déployer des pipelines de données en quelques minutes au lieu de semaines ou de mois. Cela permet aux scientifiques des données de se concentrer sur la résolution créative de problèmes et d'itérer rapidement sur des données en direct, plutôt que de se soucier de la plomberie.
Le résultat est non seulement une préparation des données et un service en production plus rapides, mais également une amélioration des performances du modèle grâce à des fonctionnalités puissantes.
Pouvez-vous expliquer comment la plate-forme FeatureByte offrira en outre la possibilité de rationaliser diverses tâches de gestion en cours ?
La plate-forme FeatureByte est conçue pour gérer le cycle de vie des fonctionnalités ML de bout en bout. Le cadre déclaratif permet à FeatureByte de déployer automatiquement des pipelines de données, tout en extrayant des métadonnées pertinentes pour la gestion de l'environnement global. Les utilisateurs peuvent surveiller la santé et les coûts du pipeline, et gérer la lignée, la version et l'exactitude des fonctionnalités à partir de la même interface graphique. Les workflows d'accès et d'approbation basés sur les rôles de niveau entreprise garantissent la confidentialité et la sécurité des données, tout en évitant la prolifération des fonctionnalités.
Y a-t-il autre chose que vous aimeriez partager Ă propos de FeatureByte ?
La plupart des outils d'IA d'entreprise se concentrent sur l'amélioration des modèles d'apprentissage automatique. Nous nous sommes donné pour mission d'aider les entreprises à faire évoluer leur IA, en simplifiant et en industrialisant les données d'IA. Chez FeatureByte, nous relevons le plus grand défi pour les praticiens de l'IA : fournir un moyen cohérent et évolutif de préparer, servir et gérer les données tout au long du cycle de vie d'un modèle, tout en simplifiant radicalement l'ensemble du processus.
Si vous êtes un scientifique des données ou un ingénieur souhaitant rester à la pointe de la science des données, je vous encourage à découvrir la puissance de FeatureByte gratuitement.
Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Octet de fonctionnalité.