sơ khai Yashar Behzadi, CEO của Synthesis AI - Chuỗi phỏng vấn - Unite.AI
Kết nối với chúng tôi

Phỏng vấn

Yashar Behzadi, CEO của Synthesis AI – Loạt bài phỏng vấn

mm

Được phát hành

 on

Tiến sĩ Yashar Behzadi là Giám đốc điều hành và Người sáng lập của Tổng hợp AI. Anh ấy là một doanh nhân giàu kinh nghiệm, người đã xây dựng các doanh nghiệp biến đổi trong thị trường AI, công nghệ y tế và IoT. Ông đã dành 14 năm qua tại Thung lũng Silicon để xây dựng và mở rộng quy mô các công ty công nghệ tập trung vào dữ liệu. Yashar có hơn 30 bằng sáng chế và bằng sáng chế đang chờ xử lý và bằng tiến sĩ. từ UCSD, tập trung vào mô hình không gian-thời gian của hình ảnh chức năng não.

Tổng hợp AI là một công ty khởi nghiệp giao thoa giữa deep learning và CGI, tạo ra một mô hình mới cho việc phát triển mô hình thị giác máy tính. Chúng cho phép khách hàng phát triển các mô hình tốt hơn với một phần nhỏ thời gian và chi phí so với các phương pháp tiếp cận dựa trên chú thích truyền thống của con người.

Ban đầu bạn tham gia vào khoa học máy tính và AI như thế nào?

Tôi đã lấy được bằng tiến sĩ. từ UCSD năm 2006 tập trung vào thị giác máy tính và mô hình hóa không gian & thời gian của dữ liệu hình ảnh não. Sau đó, tôi làm việc tại Thung lũng Silicon, nơi giao thoa giữa cảm biến, dữ liệu và máy học giữa các ngành trong 16 năm tiếp theo. Tôi cảm thấy rất may mắn khi có cơ hội làm việc trên một số công nghệ đáng chú ý và tôi đã có hơn 30 bằng sáng chế được cấp hoặc nộp tập trung vào xử lý tín hiệu, học máy và khoa học dữ liệu.

Bạn có thể chia sẻ câu chuyện về nguồn gốc của Synthesis AI không?

Trước khi thành lập Synthesis AI vào năm 2019, tôi đã lãnh đạo một công ty dịch vụ AI toàn cầu chuyên phát triển các mô hình thị giác máy tính cho các doanh nghiệp công nghệ hàng đầu. Bất kể quy mô của công ty, tôi thấy rằng chúng tôi bị giới hạn rất nhiều bởi chất lượng và số lượng dữ liệu đào tạo được dán nhãn. Khi các công ty mở rộng về mặt địa lý, phát triển cơ sở khách hàng hoặc phát triển các mô hình mới và phần cứng mới, dữ liệu đào tạo mới được yêu cầu để đảm bảo các mô hình hoạt động hiệu quả. Rõ ràng là tương lai của thị giác máy tính sẽ không thành công với mô hình chú thích con người trong vòng lặp ngày nay. Các ứng dụng thị giác máy tính mới nổi trong các ứng dụng tự chủ, rô-bốt và AR/VR/metaverse yêu cầu một bộ nhãn 3D phong phú, thông tin độ sâu, thuộc tính vật liệu, phân đoạn chi tiết, v.v. mà con người không thể gắn nhãn. Một mô hình mới là cần thiết để cung cấp tập nhãn phong phú cần thiết để đào tạo những mô hình mới này. Ngoài các trình điều khiển kỹ thuật, chúng tôi nhận thấy sự giám sát ngày càng tăng của người tiêu dùng và cơ quan quản lý đối với các vấn đề đạo đức liên quan đến xu hướng mô hình và quyền riêng tư của người tiêu dùng.

Tôi đã thành lập AI tổng hợp nhằm mục đích chuyển đổi mô hình thị giác máy tính. Nền tảng tạo dữ liệu tổng hợp của công ty cho phép tạo dữ liệu hình ảnh chân thực theo yêu cầu với bộ nhãn pixel 3D hoàn hảo mở rộng. Sứ mệnh của chúng tôi là đi tiên phong trong công nghệ dữ liệu tổng hợp để cho phép phát triển các mô hình có năng lực hơn về mặt đạo đức.

Đối với những độc giả không quen thuộc với thuật ngữ này, bạn có thể định nghĩa dữ liệu tổng hợp là gì không?

Dữ liệu tổng hợp là dữ liệu do máy tính tạo ra để thay thế cho dữ liệu trong thế giới thực. Dữ liệu tổng hợp được tạo ra trong thế giới kỹ thuật số mô phỏng thay vì được thu thập từ hoặc đo lường trong thế giới thực. Kết hợp các công cụ từ thế giới hiệu ứng hình ảnh và CGI với các mô hình AI tổng quát, AI tổng hợp cho phép các công ty tạo ra một lượng lớn dữ liệu đa dạng, chân thực theo yêu cầu để huấn luyện các mô hình thị giác máy tính. Nền tảng tạo dữ liệu của công ty đã giảm chi phí và tốc độ để có được dữ liệu hình ảnh chất lượng cao theo mức độ lớn trong khi vẫn bảo vệ quyền riêng tư.

Bạn có thể thảo luận về cách dữ liệu tổng hợp được tạo ra không?

Tập dữ liệu tổng hợp được tạo một cách nhân tạo thay vì thông qua dữ liệu trong thế giới thực. Các công nghệ từ ngành hiệu ứng hình ảnh được kết hợp với các mạng thần kinh tổng quát để tạo ra dữ liệu hình ảnh được dán nhãn rộng lớn, đa dạng và chân thực. Dữ liệu tổng hợp cho phép tạo dữ liệu đào tạo với một phần chi phí và thời gian của các phương pháp hiện tại.

Làm thế nào để tận dụng dữ liệu tổng hợp tạo ra lợi thế cạnh tranh?

Hiện tại, hầu hết các hệ thống AI đều tận dụng 'học tập có giám sát', trong đó con người gắn nhãn khóa được quy cho hình ảnh và sau đó huấn luyện các thuật toán AI để diễn giải hình ảnh. Đây là một quá trình tốn nhiều tài nguyên và thời gian và bị giới hạn bởi những gì con người có thể dán nhãn chính xác. Ngoài ra, những lo ngại về xu hướng nhân khẩu học AI và quyền riêng tư của người tiêu dùng đã được khuếch đại, khiến việc lấy dữ liệu đại diện của con người ngày càng khó khăn.

Cách tiếp cận của chúng tôi là tạo ra thế giới kỹ thuật số chân thực tổng hợp dữ liệu hình ảnh phức tạp. Vì chúng tôi tạo dữ liệu nên chúng tôi biết mọi thứ về các cảnh, bao gồm thông tin chưa từng có trước đây về vị trí 3D của các đối tượng và các tương tác phức tạp của chúng với nhau và với môi trường. Việc thu thập và dán nhãn lượng dữ liệu này bằng cách sử dụng các phương pháp hiện tại sẽ mất hàng tháng, nếu không muốn nói là hàng năm. Mô hình mới này sẽ cho phép cải thiện hiệu quả và chi phí gấp 100 lần, đồng thời thúc đẩy một loại mô hình mới có khả năng hơn.

Do dữ liệu tổng hợp được tạo một cách nhân tạo nên điều này giúp loại bỏ nhiều thành kiến ​​và mối lo ngại về quyền riêng tư với việc thu thập các tập dữ liệu từ thế giới thực theo cách truyền thống.

Làm cách nào để tạo dữ liệu theo yêu cầu cho phép mở rộng nhanh chóng?

Thu thập và chuẩn bị dữ liệu trong thế giới thực để đào tạo mô hình là một quá trình dài và tẻ nhạt. Việc triển khai phần cứng cần thiết có thể cực kỳ tốn kém đối với các hệ thống thị giác máy tính phức tạp như xe tự hành, người máy hoặc hình ảnh vệ tinh. Sau khi dữ liệu được thu thập, con người sẽ dán nhãn và chú thích các tính năng cần thiết. Quá trình này dễ xảy ra lỗi và con người bị hạn chế về khả năng gắn nhãn thông tin chính như vị trí 3D cần thiết cho nhiều ứng dụng.

Dữ liệu tổng hợp là các đơn đặt hàng có cường độ nhanh hơn và rẻ hơn so với các phương pháp tiếp cận dữ liệu thực do con người chú thích truyền thống và sẽ đẩy nhanh việc triển khai các mô hình mới và có khả năng hơn trong các ngành.

Làm thế nào để dữ liệu tổng hợp cho phép giảm thiểu hoặc ngăn chặn sự thiên vị của AI?

Các hệ thống AI có mặt khắp nơi nhưng có thể chứa đựng những thành kiến ​​cố hữu có thể tác động đến các nhóm người. Các bộ dữ liệu có thể không cân bằng với một số loại dữ liệu nhất định và các nhóm người được đại diện nhiều hơn hoặc ít hơn. Việc xây dựng các hệ thống lấy con người làm trung tâm thường có thể dẫn đến những thành kiến ​​về giới tính, dân tộc và tuổi tác. Ngược lại, dữ liệu đào tạo do thiết kế tạo ra được cân bằng hợp lý và không có thành kiến ​​của con người.

Dữ liệu tổng hợp có thể trở thành một giải pháp hiệu quả trong việc giải quyết vấn đề sai lệch của AI. Dữ liệu tổng hợp được tạo một phần hoặc hoàn toàn nhân tạo thay vì được đo lường hoặc trích xuất từ ​​các sự kiện hoặc hiện tượng trong thế giới thực. Nếu tập dữ liệu không đa dạng hoặc không đủ lớn, dữ liệu do AI tạo ra có thể lấp đầy các lỗ hổng và tạo thành một tập dữ liệu không thiên vị. Phần tốt nhất? Việc tạo các bộ dữ liệu này theo cách thủ công có thể khiến các nhóm mất vài tháng hoặc vài năm để hoàn thành. Khi được thiết kế với dữ liệu tổng hợp, nó có thể được thực hiện trong một sớm một chiều.

Ngoài tầm nhìn máy tính, một số trường hợp sử dụng tiềm năng khác trong tương lai cho dữ liệu tổng hợp là gì?

Ngoài vô số trường hợp sử dụng thị giác máy tính liên quan đến sản phẩm tiêu dùng, quyền tự chủ, robot, AR/VR/metaverse, v.v., dữ liệu tổng hợp cũng sẽ tác động đến các phương thức dữ liệu khác. Chúng tôi đã thấy các công ty tận dụng các phương pháp tiếp cận dữ liệu tổng hợp để xử lý dữ liệu dạng bảng, giọng nói và ngôn ngữ tự nhiên có cấu trúc. Các công nghệ cơ bản và quy trình sản xuất khác nhau đối với từng phương thức và trong tương lai gần, chúng tôi hy vọng sẽ thấy các hệ thống đa phương thức (ví dụ: video + giọng nói).

Có điều gì khác mà bạn muốn chia sẻ về Synthesis AI không?

Cuối năm ngoái, chúng tôi đã phát hành API con người, một sự mở rộng đáng kể khả năng dữ liệu tổng hợp của Synthesis AI cho phép tạo lập trình hàng triệu con người kỹ thuật số 3D độc đáo, chất lượng cao. Thông báo này được đưa ra vài tháng sau khi ra mắt sản phẩm dịch vụ dữ liệu tổng hợp FaceAPI, đã cung cấp hơn 10 triệu hình ảnh khuôn mặt được dán nhãn cho các công ty điện thoại thông minh, hội nghị từ xa, ô tô và công nghệ hàng đầu. HumanAPI là bước tiếp theo trong hành trình hỗ trợ các ứng dụng Trí tuệ nhân tạo (AI) thị giác máy tính tiên tiến của công ty.

HumanAPI cũng tạo ra vô số cơ hội mới cho khách hàng của chúng tôi, bao gồm trợ lý AI thông minh, huấn luyện viên thể dục ảo và tất nhiên, thế giới của các ứng dụng metaverse.

Bằng cách tạo ra một bản sao kỹ thuật số của thế giới thực, metaverse sẽ cho phép các ứng dụng mới từ các mạng xã hội được mô phỏng lại, trải nghiệm giải trí, hội nghị từ xa, trò chơi, v.v. Thị giác máy tính AI sẽ là nền tảng cho cách thế giới thực được ghi lại và tái tạo với độ trung thực cao trong lĩnh vực kỹ thuật số. Con người chân thực, biểu cảm và hành vi chính xác sẽ là một thành phần thiết yếu trong tương lai của các ứng dụng thị giác máy tính. HumanAPI là sản phẩm đầu tiên cho phép các công ty tạo ra một lượng lớn dữ liệu toàn bộ cơ thể được dán nhãn hoàn hảo theo yêu cầu để xây dựng các mô hình AI có khả năng hơn, bao gồm ước tính tư thế, nhận dạng cảm xúc, mô tả hoạt động và hành vi, tái tạo khuôn mặt, v.v.

Cảm ơn bạn về cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm hãy truy cập Tổng hợp AI.

Một đối tác sáng lập của unity.AI & một thành viên của Hội đồng Công nghệ Forbes, Antoine là một nhà tương lai học người đam mê tương lai của AI và robot.

Ông cũng là người sáng lập của Chứng khoán.io, một trang web tập trung vào đầu tư vào công nghệ đột phá.