wawancara

Yashar Behzadi, CEO Synthesis AI – Interview Series

Diterbitkan

tahun 2 lalu

Februari 7, 2022

Yashar Behzadi PhD adalah CEO dan Pendiri Sintesis AI. Dia adalah pengusaha berpengalaman yang telah membangun bisnis transformatif di pasar AI, teknologi medis, dan IoT. Dia telah menghabiskan 14 tahun terakhir di Silicon Valley membangun dan menskalakan perusahaan teknologi yang berpusat pada data. Yashar memiliki lebih dari 30 paten dan paten tertunda dan gelar Ph.D. dari UCSD dengan fokus pada pemodelan spasial-temporal pencitraan otak fungsional.

Sintesis AI adalah startup yang memadukan pembelajaran mendalam dan CGI, menciptakan paradigma baru untuk pengembangan model visi komputer. Mereka memungkinkan pelanggan untuk mengembangkan model yang lebih baik dengan waktu dan biaya yang lebih singkat dibandingkan pendekatan tradisional berbasis anotasi manusia.

Bagaimana awalnya Anda terlibat dalam ilmu komputer dan AI?

Saya memperoleh gelar Ph.D. dari UCSD pada tahun 2006 berfokus pada visi komputer dan pemodelan spasial & temporal dari data pencitraan otak. Saya kemudian bekerja di Silicon Valley di persimpangan sensor, data, dan pembelajaran mesin di berbagai industri selama 16 tahun ke depan. Saya merasa sangat beruntung mendapat kesempatan untuk mengerjakan beberapa teknologi luar biasa, dan saya memiliki lebih dari 30 paten yang diterbitkan atau diajukan yang berfokus pada pemrosesan sinyal, pembelajaran mesin, dan ilmu data.

Bisakah Anda membagikan kisah asal-usul Synthesis AI?

Sebelum mendirikan Synthesis AI pada tahun 2019, saya memimpin perusahaan layanan AI global yang berfokus pada pengembangan model computer vision untuk perusahaan teknologi terkemuka. Tidak peduli ukuran perusahaan, saya menemukan bahwa kami sangat dibatasi oleh kualitas dan jumlah data pelatihan berlabel. Ketika perusahaan berkembang secara geografis, menumbuhkan basis pelanggan mereka, atau mengembangkan model baru dan perangkat keras baru, data pelatihan baru diperlukan untuk memastikan model bekerja dengan baik. Juga menjadi jelas bahwa masa depan computer vision tidak akan berhasil dengan paradigma anotasi human-in-the-loop saat ini. Aplikasi visi komputer yang muncul dalam aplikasi otonomi, robotika, dan AR/VR/metaverse memerlukan kumpulan label 3D yang kaya, informasi kedalaman, sifat material, segmentasi terperinci, dll., yang tidak dapat diberi label oleh manusia. Paradigma baru diperlukan untuk menyediakan serangkaian label yang diperlukan untuk melatih model-model baru ini. Selain driver teknis, kami melihat peningkatan pengawasan konsumen dan peraturan seputar masalah etika terkait bias model dan privasi konsumen.

Saya mendirikan Synthesis AI dengan tujuan mengubah paradigma visi komputer. Platform pembuatan data sintetis dari perusahaan ini memungkinkan pembuatan data gambar fotorealistik berdasarkan permintaan dengan serangkaian label piksel sempurna 3D yang diperluas. Misi kami adalah memelopori teknologi data sintetis untuk memungkinkan pengembangan model yang lebih etis dan mumpuni.

Bagi pembaca yang tidak familiar dengan istilah ini, dapatkah Anda mendefinisikan apa itu data sintetik?

Data sintetik adalah data yang dihasilkan komputer yang berfungsi sebagai alternatif untuk data dunia nyata. Data sintetik dibuat dalam dunia digital simulasi daripada dikumpulkan dari atau diukur di dunia nyata. Menggabungkan alat dari dunia efek visual dan CGI dengan model AI generatif, Synthesis AI memungkinkan perusahaan membuat sejumlah besar data fotorealistik dan beragam sesuai permintaan untuk melatih model visi komputer. Platform pembuatan data perusahaan mengurangi biaya dan kecepatan untuk mendapatkan data gambar berkualitas tinggi dengan urutan besarnya sambil menjaga privasi.

Bisakah Anda mendiskusikan bagaimana data sintetis dihasilkan?

Kumpulan data sintetik dibuat secara artifisial, bukan melalui data dunia nyata. Teknologi dari industri efek visual digabungkan dengan jaringan saraf generatif untuk membuat data gambar berlabel yang luas, beragam, dan fotorealistik. Data sintetik memungkinkan untuk membuat data pelatihan dengan biaya dan waktu yang lebih murah dari pendekatan saat ini.

Bagaimana memanfaatkan data sintetik menciptakan keunggulan kompetitif?

Saat ini, sebagian besar sistem AI memanfaatkan 'pembelajaran terawasi' di mana manusia melabeli kunci yang diatribusikan dalam gambar dan kemudian melatih algoritme AI untuk menginterpretasikan gambar. Ini adalah proses intensif sumber daya dan waktu dan dibatasi oleh apa yang dapat diberi label secara akurat oleh manusia. Selain itu, kekhawatiran tentang bias demografi AI dan privasi konsumen telah meningkat, sehingga semakin sulit untuk mendapatkan data manusia yang representatif.

Pendekatan kami adalah menciptakan dunia digital fotorealistik yang menyatukan data gambar kompleks. Karena kami menghasilkan data, kami mengetahui segalanya tentang pemandangan, termasuk informasi yang belum pernah ada sebelumnya tentang lokasi objek 3D dan interaksi kompleksnya satu sama lain dan lingkungan. Memperoleh dan memberi label jumlah data ini menggunakan pendekatan saat ini akan memakan waktu berbulan-bulan, jika tidak bertahun-tahun. Paradigma baru ini akan memungkinkan peningkatan 100x dalam efisiensi dan biaya serta mendorong kelas baru model yang lebih mumpuni.

Karena data sintetik dihasilkan secara artifisial, hal ini menghilangkan banyak bias dan masalah privasi dengan mengumpulkan set data secara tradisional dari dunia nyata.

Bagaimana pembuatan data sesuai permintaan mengaktifkan penskalaan yang dipercepat?

Menangkap dan menyiapkan data dunia nyata untuk pelatihan model adalah proses yang panjang dan membosankan. Menyebarkan perangkat keras yang diperlukan bisa sangat mahal untuk sistem visi komputer yang rumit seperti kendaraan otonom, robot, atau citra satelit. Setelah data diambil, manusia memberi label dan membubuhi keterangan fitur-fitur penting. Proses ini rentan terhadap kesalahan, dan kemampuan manusia untuk melabeli informasi kunci seperti posisi 3D yang diperlukan untuk banyak aplikasi terbatas.

Data sintetik adalah urutan besarnya lebih cepat dan lebih murah daripada pendekatan data nyata beranotasi manusia tradisional dan akan datang untuk mempercepat penyebaran model baru dan lebih mampu di seluruh industri.

Bagaimana data sintetik memungkinkan pengurangan atau pencegahan bias AI?

Sistem AI ada di mana-mana tetapi dapat mengandung bias bawaan yang dapat berdampak pada sekelompok orang. Kumpulan data dapat menjadi tidak seimbang dengan kelas data tertentu dan kelompok orang yang terlalu banyak atau kurang terwakili. Membangun sistem yang berpusat pada manusia seringkali dapat menyebabkan bias gender, etnis, dan usia. Sebaliknya, data pelatihan yang dihasilkan desain seimbang dengan baik dan tidak memiliki bias manusia.

Data sintetik bisa menjadi solusi yang kuat dalam memecahkan masalah bias AI. Data sintetik dihasilkan sebagian atau seluruhnya secara artifisial daripada diukur atau diekstraksi dari peristiwa atau fenomena dunia nyata. Jika kumpulan data tidak beragam atau cukup besar, data yang dihasilkan AI dapat mengisi kekosongan dan membentuk kumpulan data yang tidak bias. Bagian terbaik? Pembuatan set data ini secara manual dapat memakan waktu beberapa bulan atau tahun bagi tim untuk menyelesaikannya. Saat dirancang dengan data sintetis, itu bisa dilakukan dalam semalam.

Di luar visi komputer, apa saja kasus penggunaan potensial lainnya di masa mendatang untuk data sintetik?

Selain banyaknya kasus penggunaan visi komputer yang terkait dengan produk konsumen, otonomi, robotika, AR/VR/metaverse, dan banyak lagi, data sintetis juga akan memengaruhi modalitas data lainnya. Kami telah melihat banyak perusahaan memanfaatkan pendekatan data sintetis untuk data tabular terstruktur, suara, dan pemrosesan bahasa alami. Teknologi yang mendasari dan jalur pembangkitan berbeda-beda untuk setiap modalitas, dan dalam waktu dekat, kami berharap dapat melihat sistem multi-modal (misalnya, video + suara).

Apakah ada hal lain yang ingin Anda bagikan tentang Synthesis AI?

Akhir tahun lalu, kami merilis API Manusia, perluasan signifikan dari kemampuan data sintetik Synthesis AI yang memungkinkan pembuatan terprogram jutaan manusia digital 3D berkualitas tinggi yang unik. Pengumuman ini muncul beberapa bulan setelah peluncuran produk data-as-a-service sintetis FaceAPI, yang telah menghasilkan lebih dari 10 juta gambar wajah berlabel untuk perusahaan smartphone, telekonferensi, mobil, dan teknologi terkemuka. HumanAPI adalah langkah selanjutnya dalam perjalanan perusahaan untuk mendukung aplikasi computer vision Artificial Intelligence (AI) tingkat lanjut.

HumanAPI juga memungkinkan segudang peluang baru bagi pelanggan kami, termasuk asisten AI cerdas, pelatih kebugaran virtual, dan tentu saja, dunia aplikasi metaverse.

Dengan menciptakan kembaran digital dari dunia nyata, metaverse akan mengaktifkan aplikasi baru mulai dari konsep ulang jejaring sosial, pengalaman hiburan, telekonferensi, game, dan banyak lagi. Computer vision AI akan menjadi dasar bagaimana dunia nyata ditangkap dan dibuat ulang dengan ketelitian tinggi di dunia digital. Manusia fotorealistik, ekspresif, dan perilaku akurat akan menjadi komponen penting dari masa depan aplikasi visi komputer. HumanAPI adalah produk pertama yang memungkinkan perusahaan membuat sejumlah besar data seluruh tubuh berlabel sempurna sesuai permintaan untuk membangun model AI yang lebih andal, termasuk estimasi pose, pengenalan emosi, karakterisasi aktivitas dan perilaku, rekonstruksi wajah, dan banyak lagi.

Terima kasih atas wawancaranya yang luar biasa, pembaca yang ingin belajar lebih banyak harus berkunjung Sintesis AI.