sơ khai Công nghệ tự lái của Waymo trở nên thông minh hơn, nhận dạng hàng tỷ vật thể nhờ tìm kiếm nội dung - Unite.AI
Kết nối với chúng tôi

Đầu Tư

Công nghệ tự lái của Waymo trở nên thông minh hơn, nhận dạng hàng tỷ đối tượng nhờ tìm kiếm nội dung

mm
cập nhật on

Các phương tiện tự hành do Waymo phát triển sử dụng kỹ thuật thị giác máy tính và trí tuệ nhân tạo để nhận biết môi trường xung quanh và đưa ra quyết định theo thời gian thực về cách phương tiện phản ứng và di chuyển. Khi các vật thể được camera và cảm biến bên trong xe nhận biết, chúng sẽ được đối chiếu với cơ sở dữ liệu lớn do Alphabet biên soạn để nhận dạng.

Các bộ dữ liệu khổng lồ có tầm quan trọng rất lớn đối với việc đào tạo các phương tiện tự hành, vì chúng cho phép AI trong các phương tiện trở nên tốt hơn và cải thiện hiệu suất của chúng. Tuy nhiên, các kỹ sư cần một số cách kết hợp hiệu quả các mục trong tập dữ liệu với các truy vấn để họ có thể điều tra cách AI hoạt động trên các loại hình ảnh cụ thể. Để giải quyết vấn đề này, như báo cáo của VentureBeat, Waymo gần đây đã phát triển một công cụ có tên là “Tìm kiếm nội dung”, có chức năng tương tự như cách Google Image Search và Google Photos hoạt động. Các hệ thống này khớp các truy vấn với nội dung ngữ nghĩa trong hình ảnh, tạo ra các biểu diễn của các đối tượng giúp cho việc truy xuất hình ảnh dựa trên các truy vấn ngôn ngữ tự nhiên dễ dàng hơn.

Trước khi Tìm kiếm Nội dung ra đời, nếu các nhà nghiên cứu của Waymo muốn truy xuất một số mẫu nhất định từ nhật ký, họ phải mô tả đối tượng bằng cách sử dụng phương pháp phỏng đoán. Nhật ký của Waymo phải được tìm kiếm bằng cách sử dụng các lệnh tìm kiếm đối tượng dựa trên quy tắc, có nghĩa là chạy tìm kiếm các đối tượng có “độ cao dưới X” hoặc các đối tượng “di chuyển với tốc độ y dặm một giờ”. Kết quả của các tìm kiếm dựa trên quy tắc này thường có thể khá rộng và sau đó các nhà nghiên cứu sẽ cần phải rà soát các kết quả được trả về theo cách thủ công.

Tìm kiếm Nội dung giải quyết vấn đề này bằng cách tạo các danh mục dữ liệu và tiến hành tìm kiếm sự tương đồng trên các danh mục khác nhau để tìm các danh mục giống nhau nhất khi được trình bày với một đối tượng. Nếu Tìm kiếm nội dung hiển thị một chiếc xe tải hoặc cây cối, nó sẽ trả về những chiếc xe tải hoặc cây cối khác mà xe tự hành của Waymo đã gặp phải. Khi một phương tiện Waymo di chuyển xung quanh, nó ghi lại hình ảnh của các đối tượng xung quanh nó, sau đó nó lưu trữ các đối tượng này dưới dạng nhúng/biểu diễn toán học. Điều này có nghĩa là công cụ có thể so sánh giữa các danh mục đối tượng và xếp hạng phản hồi bằng mức độ tương tự với đối tượng được cung cấp đối với hình ảnh đối tượng được lưu trữ. Điều này tương tự như cách các nhúng dịch vụ kết hợp tương tự do Google điều hành hoạt động.

Các đối tượng mà phương tiện của Waymo gặp phải có thể có đủ hình dạng và kích cỡ khác nhau, nhưng tất cả chúng đều cần được chắt lọc thành các thành phần thiết yếu và được phân loại để Tìm kiếm Nội dung hoạt động. Để điều này xảy ra, Waymo sử dụng nhiều mô hình AI được đào tạo trên nhiều đối tượng khác nhau. Các mô hình khác nhau học cách nhận dạng nhiều đối tượng và chúng được hỗ trợ bởi Tìm kiếm nội dung, cho phép các mô hình hiểu liệu các mục thuộc một danh mục cụ thể có được tìm thấy trong một hình ảnh nhất định hay không. Một mô hình nhận dạng ký tự quang học bổ sung được sử dụng cùng với mô hình chính, cho phép các phương tiện Waymo thêm thông tin nhận dạng bổ sung vào các đối tượng trong hình ảnh, dựa trên bất kỳ văn bản nào được tìm thấy trong hình ảnh. Ví dụ: một chiếc xe tải được trang bị biển báo sẽ có nội dung của biển báo trong phần mô tả Tìm kiếm Nội dung của nó.

Nhờ các mô hình trên hoạt động đồng bộ, các nhà nghiên cứu và kỹ sư của Waymo có khả năng tìm kiếm nhật ký dữ liệu hình ảnh cho các đối tượng rất cụ thể như các loài cây cụ thể và kiểu dáng ô tô.

Theo Waymo, được trích dẫn bởi VentureBeat:

“Với Tìm kiếm Nội dung, chúng tôi có thể tự động chú thích … các đối tượng trong lịch sử lái xe của mình, điều này đã làm tăng tốc độ và chất lượng dữ liệu mà chúng tôi gửi để gắn nhãn theo cấp số nhân. Khả năng tăng tốc độ ghi nhãn đã góp phần mang lại nhiều cải tiến trên toàn hệ thống của chúng tôi, từ việc phát hiện xe buýt trường học có trẻ em sắp bước lên vỉa hè hoặc người đi xe máy điện đến mèo hoặc chó băng qua đường. Khi Waymo mở rộng ra nhiều thành phố hơn, chúng tôi sẽ tiếp tục gặp các đối tượng và kịch bản mới.”

Đây không phải là lần đầu tiên Waymo sử dụng nhiều mô hình học máy để nâng cao độ tin cậy và độ chính xác cho phương tiện của họ. Waymo đã cộng tác với Alphabet/Google trong quá khứ, giúp phát triển một kỹ thuật AI cùng với DeepMind. Hệ thống AI lấy cảm hứng từ sinh học tiến hóa. Để bắt đầu, một loạt các mô hình học máy được tạo ra và sau khi chúng được đào tạo, các mô hình hoạt động kém sẽ bị loại bỏ và thay thế bằng các mô hình con. Kỹ thuật này được cho là đã quản lý để giảm đáng kể các kết quả dương tính giả đồng thời giảm các tài nguyên tính toán cần thiết và thời gian đào tạo.

Công cụ Tìm kiếm Nội dung AI của Waymo cho phép các kỹ sư nhanh chóng tìm thấy các đối tượng trong hồ sơ lái xe