potongan Teknik Baru Membantu AI Mengidentifikasi Objek 3D - Unite.AI
Terhubung dengan kami

Kecerdasan Buatan

Teknik Baru Membantu AI Mengidentifikasi Objek 3D

Updated on
Gambar: Universitas Negeri NC

Teknik baru yang dikembangkan oleh para peneliti di North Carolina State University meningkatkan kemampuan program kecerdasan buatan (AI) untuk mengidentifikasi objek 3D. Disebut MonoCon, teknik ini juga membantu AI mempelajari bagaimana objek 3D berhubungan satu sama lain di ruang angkasa dengan menggunakan gambar 2D. 

MonoCon berpotensi memiliki berbagai aplikasi, termasuk membantu kendaraan otonom bernavigasi di sekitar kendaraan lain menggunakan gambar 2D yang diterima dari kamera onboard. Itu juga bisa memainkan peran dalam manufaktur dan robotika.

Tianfu Wu adalah penulis yang sesuai dari telaahan dan asisten profesor teknik elektro dan komputer di North Carolina State University. 

“Kita hidup di dunia 3D, tetapi saat Anda mengambil gambar, dunia tersebut direkam dalam gambar 2D,” kata Wu.

“Program AI menerima input visual dari kamera. Jadi jika kita ingin AI berinteraksi dengan dunia, kita perlu memastikan bahwa AI mampu menginterpretasikan apa yang dapat diceritakan oleh gambar 2D tentang ruang 3D. Dalam penelitian ini, kami berfokus pada satu bagian dari tantangan itu: bagaimana kami dapat membuat AI mengenali objek 3D secara akurat — seperti orang atau mobil — dalam gambar 2D, dan menempatkan objek tersebut di luar angkasa,” lanjut Wu. 

Kendaraan otonom

Kendaraan otonom sering mengandalkan lidar untuk menavigasi ruang 3D. Lidar, yang menggunakan laser untuk mengukur jarak, mahal, artinya sistem otonom tidak menyertakan banyak redundansi. Menempatkan lusinan sensor lidar pada mobil tanpa pengemudi yang diproduksi secara massal akan sangat mahal. 

“Tetapi jika kendaraan otonom dapat menggunakan input visual untuk bernavigasi di ruang angkasa, Anda dapat membangun redundansi,” kata Wu. “Karena kamera secara signifikan lebih murah daripada lidar, akan lebih ekonomis untuk menyertakan kamera tambahan — membangun redundansi ke dalam sistem dan membuatnya lebih aman dan lebih kuat.

“Itu salah satu aplikasi praktis. Namun, kami juga senang dengan kemajuan mendasar dari pekerjaan ini: bahwa data 3D dapat diperoleh dari objek 2D.”

Melatih AI

MonoCon dapat mengidentifikasi objek 3D dalam gambar 2D sebelum menempatkannya dalam “kotak pembatas”, yang memberi tahu AI tentang tepi luar objek tersebut. 

“Yang membedakan pekerjaan kami adalah cara kami melatih AI, yang dikembangkan berdasarkan teknik pelatihan sebelumnya,” kata Wu. “Seperti upaya sebelumnya, kami menempatkan objek dalam kotak pembatas 3D sambil melatih AI. Namun, selain meminta AI untuk memprediksi jarak kamera-ke-objek dan dimensi kotak pembatas, kami juga meminta AI untuk memprediksi lokasi masing-masing delapan titik kotak dan jaraknya dari pusat pembatas. kotak dalam dua dimensi. Kami menyebutnya 'konteks tambahan', dan kami menemukan bahwa ini membantu AI mengidentifikasi dan memprediksi objek 3D berdasarkan gambar 2D dengan lebih akurat.

“Metode yang diusulkan dimotivasi oleh teorema terkenal dalam teori ukuran, teorema Cramér-Wold. Hal ini juga berpotensi diterapkan pada tugas prediksi keluaran terstruktur lainnya dalam visi komputer.”

MonoCon diuji dengan kumpulan data tolok ukur yang banyak digunakan yang disebut KITTI.

“Pada saat kami mengirimkan makalah ini, MonoCon bekerja lebih baik daripada lusinan program AI lainnya yang bertujuan mengekstraksi data 3D pada mobil dari gambar 2D,” kata Wu.

Tim sekarang akan berupaya meningkatkan proses dengan kumpulan data yang lebih besar.

“Ke depan, kami meningkatkan ini dan bekerja dengan kumpulan data yang lebih besar untuk mengevaluasi dan menyempurnakan MonoCon untuk digunakan dalam mengemudi secara otonom,” kata Wu. “Kami juga ingin menjelajahi aplikasi di bidang manufaktur, untuk melihat apakah kami dapat meningkatkan kinerja tugas seperti penggunaan lengan robotik.”

Alex McFarland adalah jurnalis dan penulis AI yang mengeksplorasi perkembangan terkini dalam kecerdasan buatan. Dia telah berkolaborasi dengan banyak startup dan publikasi AI di seluruh dunia.