Phỏng vấn

Yashar Behzadi, Giám đốc điều hành của Synthesis AI – Loạt phỏng vấn

Published February 7, 2022

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Yashar Behzadi PhD là Giám đốc điều hành và Người sáng lập của Synthesis AI. Ông là một doanh nhân có kinh nghiệm đã xây dựng các doanh nghiệp chuyển đổi trong lĩnh vực AI, công nghệ y tế và thị trường IoT. Ông đã dành 14 năm qua ở Thung lũng Silicon xây dựng và mở rộng các công ty công nghệ tập trung vào dữ liệu. Yashar có hơn 30 bằng sáng chế và bằng sáng chế đang chờ xử lý và một PhD từ UCSD với trọng tâm vào mô hình hóa không gian-thời gian của hình ảnh não chức năng.

Synthesis AI là một công ty khởi nghiệp tại giao điểm của học sâu và CGI, tạo ra một范式 mới cho việc phát triển mô hình tầm nhìn máy tính. Họ cho phép khách hàng phát triển các mô hình tốt hơn với một phần nhỏ thời gian và chi phí so với các phương pháp dựa trên chú thích của con người truyền thống.

Làm thế nào bạn ban đầu tham gia vào khoa học máy tính và AI?

Tôi đã nhận được PhD từ UCSD vào năm 2006 tập trung vào tầm nhìn máy tính và mô hình hóa không gian & thời gian của dữ liệu hình ảnh não. Sau đó, tôi làm việc ở Thung lũng Silicon tại giao điểm của cảm biến, dữ liệu và học máy trên các ngành công nghiệp trong 16 năm. Tôi cảm thấy rất may mắn khi có cơ hội làm việc trên một số công nghệ đáng chú ý, và tôi có hơn 30 bằng sáng chế được cấp hoặc nộp tập trung vào xử lý tín hiệu, học máy và khoa học dữ liệu.

Có thể bạn chia sẻ câu chuyện về sự ra đời của Synthesis AI?

Trước khi thành lập Synthesis AI vào năm 2019, tôi đã lãnh đạo một công ty dịch vụ AI toàn cầu tập trung vào việc phát triển các mô hình tầm nhìn máy tính cho các doanh nghiệp công nghệ hàng đầu. Dù cho công ty có quy mô nào, tôi thấy chúng tôi bị hạn chế nghiêm trọng bởi chất lượng và số lượng dữ liệu đào tạo được gắn nhãn. Khi các công ty mở rộng địa lý, tăng cơ sở khách hàng hoặc phát triển các mô hình và phần cứng mới, dữ liệu đào tạo mới được yêu cầu để đảm bảo các mô hình hoạt động tốt. Nó cũng trở nên rõ ràng rằng tương lai của tầm nhìn máy tính sẽ không thành công với mô hình chú thích của con người trong vòng lặp hiện tại. Các ứng dụng tầm nhìn máy tính mới nổi trong tự chủ, robot và ứng dụng AR/VR/metaverse yêu cầu một tập hợp phong phú các nhãn 3D, thông tin độ sâu, thuộc tính vật liệu, phân đoạn chi tiết, v.v., mà con người không thể gắn nhãn. Một范式 mới là cần thiết để cung cấp tập hợp phong phú các nhãn cần thiết để đào tạo các mô hình mới này. Ngoài các yếu tố kỹ thuật, chúng tôi cũng thấy sự giám sát ngày càng tăng của người tiêu dùng và quy định xung quanh các vấn đề về đạo đức liên quan đến thiên vị mô hình và quyền riêng tư của người tiêu dùng.

Tôi đã thành lập Synthesis AI với mục đích chuyển đổi范式 tầm nhìn máy tính. Nền tảng tạo dữ liệu tổng hợp của công ty cho phép tạo ra dữ liệu hình ảnh photorealistic trên nhu cầu với một tập hợp mở rộng các nhãn pixel-perfect 3D. Sứ mệnh của chúng tôi là tiên phong trong các công nghệ dữ liệu tổng hợp để cho phép phát triển các mô hình có khả năng hơn một cách đạo đức.

Đối với những người đọc không quen thuộc với thuật ngữ này, bạn có thể định nghĩa dữ liệu tổng hợp là gì?

Dữ liệu tổng hợp là dữ liệu được tạo ra bởi máy tính phục vụ như một sự thay thế cho dữ liệu thế giới thực. Dữ liệu tổng hợp được tạo ra trong các thế giới kỹ thuật số mô phỏng thay vì được thu thập từ hoặc đo lường trong thế giới thực. Kết hợp các công cụ từ thế giới của các hiệu ứng hình ảnh và CGI với các mô hình AI tạo ra, Synthesis AI cho phép các công ty tạo ra một lượng lớn dữ liệu đa dạng và photorealistic trên nhu cầu để đào tạo các mô hình tầm nhìn máy tính. Nền tảng tạo dữ liệu của công ty đã giảm chi phí và tốc độ để có được dữ liệu hình ảnh chất lượng cao theo cấp số nhân trong khi vẫn bảo tồn quyền riêng tư.

Có thể bạn thảo luận về cách dữ liệu tổng hợp được tạo ra?

Một tập dữ liệu tổng hợp được tạo ra một cách nhân tạo thay vì thông qua dữ liệu thế giới thực. Các công nghệ từ ngành công nghiệp hiệu ứng hình ảnh được kết hợp với các mạng nơ-ron tạo ra để tạo ra một lượng lớn dữ liệu hình ảnh đa dạng và photorealistic có nhãn. Dữ liệu tổng hợp cho phép tạo ra dữ liệu đào tạo với một phần nhỏ chi phí và thời gian so với các phương pháp hiện tại.

Làm thế nào tận dụng dữ liệu tổng hợp tạo ra một lợi thế cạnh tranh?

Hiện tại, hầu hết các hệ thống AI tận dụng ‘học tập có giám sát’ trong đó con người gắn nhãn các thuộc tính chính trong hình ảnh và sau đó đào tạo các thuật toán AI để diễn giải hình ảnh. Đây là một quá trình tốn nhiều tài nguyên và thời gian và bị giới hạn bởi những gì con người có thể gắn nhãn chính xác. Ngoài ra, các vấn đề về thiên vị dân tộc và quyền riêng tư của người tiêu dùng đã được khuếch đại, khiến cho việc thu thập dữ liệu đại diện của con người ngày càng khó khăn.

Cách tiếp cận của chúng tôi là tạo ra các thế giới kỹ thuật số photorealistic tổng hợp dữ liệu hình ảnh phức tạp. Vì chúng tôi tạo ra dữ liệu, chúng tôi biết mọi thứ về các cảnh, bao gồm cả thông tin chưa từng có trước đây về vị trí 3D của các vật thể và các tương tác phức tạp của chúng với nhau và với môi trường. Việc thu thập và gắn nhãn lượng dữ liệu này bằng các phương pháp hiện tại sẽ mất nhiều tháng, nếu không nói là nhiều năm.范式 mới này sẽ cho phép cải thiện hiệu suất và chi phí 100 lần và sẽ thúc đẩy một lớp mô hình mới có khả năng hơn.

Vì dữ liệu tổng hợp được tạo ra một cách nhân tạo, điều này loại bỏ nhiều thiên vị và lo ngại về quyền riêng tư khi thu thập dữ liệu từ thế giới thực.

Làm thế nào tạo dữ liệu trên nhu cầu cho phép mở rộng nhanh chóng?

Việc thu thập và chuẩn bị dữ liệu thế giới thực cho đào tạo mô hình là một quá trình dài và繁 tạp. Việc triển khai phần cứng cần thiết có thể rất tốn kém cho các hệ thống tầm nhìn máy tính phức tạp như xe tự hành, robot hoặc hình ảnh vệ tinh. Một khi dữ liệu được thu thập, con người sẽ gắn nhãn và chú thích các tính năng quan trọng. Quá trình này dễ bị lỗi và con người bị giới hạn trong khả năng gắn nhãn các thông tin quan trọng như vị trí 3D cần thiết cho nhiều ứng dụng.

Dữ liệu tổng hợp nhanh hơn và rẻ hơn nhiều so với các phương pháp dựa trên chú thích của con người truyền thống và sẽ giúp tăng tốc việc triển khai các mô hình mới và có khả năng hơn trên các ngành công nghiệp.

Làm thế nào dữ liệu tổng hợp cho phép giảm hoặc ngăn chặn thiên vị AI?

Các hệ thống AI hiện diện khắp nơi nhưng có thể chứa các thiên vị vốn có có thể ảnh hưởng đến các nhóm người. Các tập dữ liệu có thể không cân bằng với các lớp dữ liệu nhất định và có thể bị đại diện quá mức hoặc thiếu đại diện cho các nhóm người. Xây dựng các hệ thống lấy con người làm trung tâm có thể dẫn đến thiên vị về giới tính, chủng tộc và tuổi tác. Ngược lại, dữ liệu đào tạo được thiết kế là cân bằng và không có thiên vị của con người.

Dữ liệu tổng hợp có thể trở thành một giải pháp mạnh mẽ trong việc giải quyết vấn đề thiên vị của AI. Dữ liệu tổng hợp được tạo ra một phần hoặc hoàn toàn nhân tạo thay vì được đo lường hoặc trích xuất từ các sự kiện hoặc hiện tượng trong thế giới thực. Nếu tập dữ liệu không đa dạng hoặc đủ lớn, dữ liệu AI tạo ra có thể lấp đầy các khoảng trống và tạo thành một tập dữ liệu không thiên vị. Điều tốt nhất? Việc tạo ra các tập dữ liệu này bằng tay có thể mất nhiều tháng hoặc nhiều năm để hoàn thành. Khi được thiết kế với dữ liệu tổng hợp, điều này có thể được thực hiện chỉ trong một đêm.

Ngoài tầm nhìn máy tính, những trường hợp sử dụng tương lai nào khác cho dữ liệu tổng hợp?

Ngoài nhiều trường hợp sử dụng tầm nhìn máy tính liên quan đến sản phẩm tiêu dùng, tự chủ, robot, AR/VR/metaverse và nhiều hơn nữa, dữ liệu tổng hợp cũng sẽ ảnh hưởng đến các phương thức dữ liệu khác. Chúng tôi đã thấy các công ty tận dụng các phương pháp dữ liệu tổng hợp cho dữ liệu bảng cấu trúc, xử lý giọng nói và xử lý ngôn ngữ tự nhiên. Các công nghệ và đường ống tạo ra khác nhau cho mỗi phương thức, và trong tương lai gần, chúng tôi dự kiến sẽ thấy các hệ thống đa phương thức (ví dụ: video + giọng nói).

Có điều gì khác mà bạn muốn chia sẻ về Synthesis AI?

Vào cuối năm ngoái, chúng tôi đã phát hành HumanAPI, một sự mở rộng đáng kể của khả năng dữ liệu tổng hợp của Synthesis AI, cho phép tạo ra hàng triệu con người kỹ thuật số 3D độc đáo, chất lượng cao theo chương trình. Thông báo này đến vài tháng sau khi ra mắt sản phẩm dữ liệu tổng hợp như một dịch vụ FaceAPI, đã cung cấp hơn 10 triệu hình ảnh khuôn mặt được gắn nhãn cho các công ty hàng đầu về điện thoại thông minh, hội nghị truyền hình, ô tô và công nghệ. HumanAPI là bước tiếp theo trong hành trình của công ty để hỗ trợ các ứng dụng AI tiên tiến.

HumanAPI cũng cho phép nhiều cơ hội mới cho khách hàng của chúng tôi, bao gồm cả trợ lý AI thông minh, huấn luyện viên thể dục ảo và当然, thế giới của các ứng dụng metaverse.

Bằng cách tạo ra một bản sao kỹ thuật số của thế giới thực, metaverse sẽ cho phép các ứng dụng mới từ các mạng xã hội được tưởng tượng lại, trải nghiệm giải trí, hội nghị truyền hình, trò chơi và nhiều hơn nữa. Tầm nhìn máy tính AI sẽ là cơ bản cho cách thế giới thực được thu thập và tái tạo với độ trung thực cao trong lĩnh vực kỹ thuật số. Con người photorealistic, biểu cảm và chính xác về hành vi sẽ là một thành phần quan trọng của tương lai của các ứng dụng tầm nhìn máy tính. HumanAPI là sản phẩm đầu tiên cho phép các công ty tạo ra một lượng lớn dữ liệu toàn thân hoàn hảo có nhãn trên nhu cầu để xây dựng các mô hình AI có khả năng hơn, bao gồm cả ước tính tư thế, nhận dạng cảm xúc, đặc trưng hóa hoạt động và hành vi, tái tạo khuôn mặt và nhiều hơn nữa.

Cảm ơn vì cuộc phỏng vấn tuyệt vời, người đọc muốn tìm hiểu thêm nên truy cập Synthesis AI.

Antoine Tardif, CEO & Founder of Unite.AI

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.

Unite.AI

Yashar Behzadi, Giám đốc điều hành của Synthesis AI – Loạt phỏng vấn

You may like