Entrevistas
Yashar Behzadi, el CEO de Synthesis AI – Serie de entrevistas

Yashar Behzadi PhD es el CEO y fundador de Synthesis AI. Es un emprendedor experimentado que ha construido empresas transformadoras en AI, tecnología médica y mercados de IoT. Ha pasado los últimos 14 años en Silicon Valley construyendo y escalando empresas de tecnología centradas en datos. Yashar tiene más de 30 patentes y patentes pendientes y un PhD de UCSD con un enfoque en modelado espacial-temporal de imágenes de resonancia magnética funcional.
Synthesis AI es una startup en la intersección del aprendizaje profundo y la CGI, creando un nuevo paradigma para el desarrollo de modelos de visión por computadora. Permiten a los clientes desarrollar mejores modelos en una fracción del tiempo y el costo de los enfoques tradicionales basados en la annotación humana.
¿Cómo se involucró inicialmente en ciencias de la computación y AI?
Obtuve un PhD de UCSD en 2006 centrado en visión por computadora y modelado espacial y temporal de datos de imágenes de resonancia magnética funcional del cerebro. Luego trabajé en Silicon Valley en la intersección de sensores, datos y aprendizaje automático en various industrias durante los siguientes 16 años. Me siento muy afortunado de haber tenido la oportunidad de trabajar en algunas tecnologías destacadas, y tengo más de 30 patentes emitidas o presentadas centradas en procesamiento de señales, aprendizaje automático y ciencia de datos.
¿Podría compartir la historia de génesis de Synthesis AI?
Antes de fundar Synthesis AI en 2019, lideré una empresa global de servicios de AI centrada en el desarrollo de modelos de visión por computadora para empresas de tecnología líderes. No importa el tamaño de la empresa, encontré que estábamos extremadamente limitados por la calidad y la cantidad de datos de entrenamiento etiquetados. A medida que las empresas se expandían geográficamente, crecían su base de clientes o desarrollaban nuevos modelos y hardware, se requerían nuevos datos de entrenamiento para garantizar que los modelos funcionaran adecuadamente. También se hizo evidente que el futuro de la visión por computadora no sería exitoso con el paradigma actual de annotación humana en el bucle. Las aplicaciones de visión por computadora emergentes en autonomía, robótica y aplicaciones de AR/VR/metaverso requieren un conjunto rico de etiquetas 3D, información de profundidad, propiedades de materiales, segmentación detallada, etc., que los humanos no pueden etiquetar. Se necesitaba un nuevo paradigma para proporcionar el conjunto necesario de etiquetas para entrenar estos nuevos modelos. Además de los impulsores técnicos, vimos una creciente escrutinio del consumidor y la regulación en torno a cuestiones éticas relacionadas con el sesgo del modelo y la privacidad del consumidor.
Establecí Synthesis AI con el objetivo de transformar el paradigma de la visión por computadora. La plataforma de generación de datos sintéticos de la empresa permite la generación bajo demanda de datos de imagen fotorealistas con un conjunto expandido de etiquetas de píxeles perfectos 3D. Nuestra misión es pionera en tecnologías de datos sintéticos para permitir el desarrollo ético de modelos más capaces.
Para los lectores que no estén familiarizados con este término, ¿podría definir qué es el dato sintético?
El dato sintético es un dato generado por computadora que sirve como alternativa a los datos del mundo real. El dato sintético se crea en mundos digitales simulados en lugar de recopilarse o medirse en el mundo real. Combinando herramientas del mundo de los efectos visuales y la CGI con modelos de AI generativos, Synthesis AI permite a las empresas crear vastas cantidades de datos diversificados y fotorealistas bajo demanda para entrenar modelos de visión por computadora. La plataforma de generación de datos de la empresa reduce el costo y la velocidad para obtener datos de imagen de alta calidad por varios órdenes de magnitud mientras preserva la privacidad.
¿Podría discutir cómo se genera el dato sintético?
Un conjunto de datos sintéticos se crea artificialmente en lugar de a través de datos del mundo real. Las tecnologías de la industria de los efectos visuales se combinan con redes neuronales generativas para crear vastos, diversificados y fotorealistas datos de imagen etiquetados. El dato sintético permite crear datos de entrenamiento a una fracción del costo y el tiempo de los enfoques actuales.
¿Cómo aprovechar el dato sintético crea una ventaja competitiva?
Actualmente, la mayoría de los sistemas de AI utilizan el ‘aprendizaje supervisado’ donde los humanos etiquetan atributos clave en las imágenes y luego entrenan a los algoritmos de AI para interpretar las imágenes. Este es un proceso intensivo en recursos y tiempo y está limitado por lo que los humanos pueden etiquetar con precisión. Además, las preocupaciones sobre el sesgo demográfico de la IA y la privacidad del consumidor han aumentado, lo que hace que sea cada vez más difícil obtener datos humanos representativos.
Nuestro enfoque es crear mundos digitales fotorealistas que sinteticen datos de imagen complejos. Dado que generamos los datos, sabemos todo sobre las escenas, incluida la información nunca antes disponible sobre la ubicación 3D de los objetos y sus interacciones complejas entre sí y con el entorno. Adquirir y etiquetar esta cantidad de datos utilizando enfoques actuales tomaría meses, si no años. Este nuevo paradigma permitirá una mejora de 100 veces en la eficiencia y el costo y impulsará una nueva clase de modelos más capaces.
Dado que el dato sintético se genera artificialmente, esto elimina muchos sesgos y preocupaciones de privacidad con la recopilación tradicional de conjuntos de datos del mundo real.
¿Cómo la generación de datos bajo demanda permite una escalada acelerada?
Capturar y preparar datos del mundo real para el entrenamiento de modelos es un proceso largo y tedioso. Desplegar el hardware necesario puede ser prohibitivamente costoso para sistemas de visión por computadora complicados como vehículos autónomos, robótica o imágenes de satélite. Una vez que se capturan los datos, los humanos etiquetan y anotan características esenciales. Este proceso es propenso a errores, y los humanos están limitados en su capacidad para etiquetar información clave como la posición 3D requerida para muchas aplicaciones.
El dato sintético es mucho más rápido y barato que los enfoques tradicionales de datos reales etiquetados por humanos y acelerará el despliegue de nuevos y más capaces modelos en various industrias.
¿Cómo el dato sintético permite una reducción o prevención del sesgo de la IA?
Los sistemas de IA están omnipresentes pero pueden contener sesgos inherentes que pueden afectar a grupos de personas. Los conjuntos de datos pueden ser desequilibrados con ciertas clases de datos y grupos de personas subrepresentados o sobrerrepresentados. Construir sistemas centrados en humanos puede llevar a sesgos de género, etnia y edad. En contraste, los datos de entrenamiento generados por diseño están equilibrados y carecen de sesgos humanos.
El dato sintético podría convertirse en una solución robusta para resolver el problema del sesgo de la IA. El dato sintético se genera parcial o completamente de forma artificial en lugar de medirse o extraerse de eventos o fenómenos del mundo real. Si el conjunto de datos no es lo suficientemente diverso o grande, los datos generados por la IA pueden llenar los vacíos y formar un conjunto de datos sin sesgos. Lo mejor es que crear estos conjuntos de datos manualmente puede tomar a los equipos varios meses o años para completar. Cuando se diseña con datos sintéticos, se puede hacer en una noche.
¿Fuera de la visión por computadora, qué son algunos posibles usos futuros del dato sintético?
Además de la multitud de casos de uso de visión por computadora relacionados con productos de consumo, autonomía, robótica, AR/VR/metaverso y más, el dato sintético también impactará otras modalidades de datos. Ya estamos viendo que las empresas aprovechan enfoques de datos sintéticos para datos tabulares estructurados, procesamiento de lenguaje natural y voz. Las tecnologías y pipelines de generación subyacentes difieren para cada modalidad, y en el futuro próximo, esperamos ver sistemas multi-modales (por ejemplo, video + voz).
¿Hay algo más que le gustaría compartir sobre Synthesis AI?
A fines del año pasado, lanzamos HumanAPI, una expansión significativa de las capacidades de datos sintéticos de Synthesis AI que permite la generación programática de millones de humanos digitales 3D únicos y de alta calidad. Este anuncio llega meses después del lanzamiento del producto de datos sintéticos como servicio FaceAPI, que ha entregado más de 10 millones de imágenes faciales etiquetadas para empresas líderes de teléfonos inteligentes, teleconferencia, automóviles y tecnología. HumanAPI es el siguiente paso en el viaje de la empresa para apoyar aplicaciones de IA avanzadas.
HumanAPI también permite una multitud de nuevas oportunidades para nuestros clientes, incluyendo asistentes de IA inteligentes, entrenadores de fitness virtuales y, por supuesto, el mundo de aplicaciones de metaverso.
Al crear un doble digital del mundo real, el metaverso permitirá nuevas aplicaciones que van desde redes sociales reinventadas, experiencias de entretenimiento, teleconferencia, juegos y más. La IA de visión por computadora será fundamental para cómo se captura y recrea el mundo real con alta fidelidad en el reino digital. Los humanos fotorealistas, expresivos y comportamentalmente precisos serán un componente esencial del futuro de las aplicaciones de visión por computadora. HumanAPI es el primer producto que permite a las empresas crear vastas cantidades de datos de cuerpo completo perfectamente etiquetados bajo demanda para construir modelos de IA más capaces, incluyendo estimación de postura, reconocimiento de emociones, caracterización de actividad y comportamiento, reconstrucción facial y más.
Gracias por la gran entrevista, los lectores que deseen aprender más deben visitar Synthesis AI.












