talón La tecnología de conducción autónoma de Waymo se vuelve más inteligente y reconoce miles de millones de objetos gracias a la búsqueda de contenido - Unite.AI
Contáctanos

Inversiones

La tecnología de conducción autónoma de Waymo se vuelve más inteligente y reconoce miles de millones de objetos gracias a la búsqueda de contenido

mm
Actualizado on

Los vehículos autónomos desarrollados por Waymo utilizan técnicas de visión por computadora e inteligencia artificial para percibir el entorno circundante y tomar decisiones en tiempo real sobre cómo debe reaccionar y moverse el vehículo. Cuando la cámara y los sensores del interior del vehículo perciben objetos, se comparan con una gran base de datos compilada por Alphabet para poder reconocerlos.

Los conjuntos de datos masivos son de gran importancia para el entrenamiento de vehículos autónomos, ya que permiten que la IA dentro de los vehículos mejore y mejore su rendimiento. Sin embargo, los ingenieros necesitan alguna forma de hacer coincidir de manera eficiente los elementos dentro del conjunto de datos con las consultas para que puedan investigar cómo se desempeña la IA en tipos específicos de imágenes. Para resolver este problema, como informa VentureBeat, Waymo recientemente desarrolló una herramienta denominada "Búsqueda de contenido", que funciona de manera similar a cómo funcionan Google Image Search y Google Photos. Estos sistemas hacen coincidir las consultas con el contenido semántico dentro de las imágenes, generando representaciones de los objetos que facilitan la recuperación de imágenes basadas en consultas de lenguaje natural.

Antes de la llegada de la búsqueda de contenido, si los investigadores de Waymo querían recuperar ciertas muestras de los registros, tenían que describir el objeto mediante heurística. Los registros de Waymo tenían que buscarse usando comandos que buscaban objetos basados ​​en reglas, lo que significaba ejecutar búsquedas de objetos que estaban "por debajo de X altura" u objetos que "viajaban a y millas por hora". Los resultados de estas búsquedas basadas en reglas a menudo podrían ser bastante amplios y los investigadores tendrían que revisar los resultados devueltos manualmente.

Content Search resuelve este problema creando catálogos de datos y realizando búsquedas de similitud en los diferentes catálogos para encontrar las categorías más similares cuando se les presenta un objeto. Si la Búsqueda de contenido se presenta con un camión o un árbol, devolverá otros camiones o árboles que hayan encontrado los vehículos autónomos de Waymo. A medida que un vehículo de Waymo circula, registra imágenes de objetos a su alrededor y luego almacena estos objetos como incrustaciones/representaciones matemáticas. Esto significa que la herramienta puede hacer una comparación entre categorías de objetos y clasificar las respuestas según la similitud de las imágenes del objeto almacenado con el objeto proporcionado. Esto es similar a cómo el incrustación del servicio de comparación de similitudes operado por Google funciona.

Los objetos que encuentran los vehículos de Waymo pueden tener diferentes formas y tamaños, pero todos deben desglosarse en sus componentes esenciales y categorizarse para que la búsqueda de contenido funcione. Para que esto suceda, Waymo utiliza múltiples modelos de IA que se entrenan en una amplia variedad de objetos. Los diversos modelos aprenden a reconocer una variedad de objetos y son compatibles con la búsqueda de contenido, que permite a los modelos comprender si los elementos que pertenecen a una categoría específica se encuentran o no dentro de una imagen determinada. Se utiliza un modelo adicional de reconocimiento óptico de caracteres junto con el modelo principal, lo que permite que los vehículos Waymo agreguen información de identificación adicional a los objetos en las imágenes, en función de cualquier texto que se encuentre en la imagen. Por ejemplo, un camión equipado con letreros tendría el texto del letrero incluido en su descripción de búsqueda de contenido.

Gracias al trabajo conjunto de los modelos anteriores, los investigadores e ingenieros de Waymo son capaces de buscar en los registros de datos de imágenes objetos muy específicos, como especies específicas de árboles y marcas de automóviles.

Según Waymo, citado por VentureBeat:

“Con Content Search, podemos anotar automáticamente... objetos en nuestro historial de conducción, lo que a su vez ha aumentado exponencialmente la velocidad y la calidad de los datos que enviamos para su etiquetado. La capacidad de acelerar el etiquetado ha contribuido a muchas mejoras en nuestro sistema, desde la detección de autobuses escolares con niños a punto de pisar la acera o personas en patinetas eléctricas hasta un gato o un perro cruzando la calle. A medida que Waymo se expanda a más ciudades, continuaremos encontrando nuevos objetos y escenarios”.

Esta no es la primera vez que Waymo utiliza múltiples modelos de aprendizaje automático para mejorar la confiabilidad y precisión de sus vehículos. Waymo ha colaborado con Alphabet/Google en el pasado, ayudando a desarrollar una técnica de IA junto con DeepMind. El sistema de IA se inspira en la biología evolutiva. Para empezar, se crea una variedad de modelos de aprendizaje automático y, después de que se entrenan, los modelos que tuvieron un rendimiento inferior se descartan y se reemplazan con modelos descendientes. Según se informa, esta técnica logró reducir drásticamente los falsos positivos al mismo tiempo que redujo los recursos computacionales requeridos y el tiempo de capacitación.

La herramienta de búsqueda de contenido de IA de Waymo permite a los ingenieros encontrar rápidamente objetos en los registros de manejo