tunggul Téhnik Anyar Ngabantosan AI Ngidentipikasi Objék 3D - Unite.AI
Connect with kami

Kacerdasan buatan

Téhnik Anyar Ngabantosan AI Ngidentipikasi Objék 3D

diropéa on
Gambar: NC State University

Téhnik anyar anu dikembangkeun ku peneliti di North Carolina State University ningkatkeun kamampuan program kecerdasan buatan (AI) pikeun ngaidentipikasi objék 3D. Disebut MonoCon, téknik ieu ogé ngabantosan AI diajar kumaha hubungan objék 3D dina rohangan ku ngagunakeun gambar 2D. 

MonoCon berpotensi boga rupa-rupa aplikasi, kaasup nulungan kandaraan otonom napigasi sabudeureun kandaraan séjén maké gambar 2D ditampa ti kaméra onboard. Éta ogé tiasa maénkeun peran dina manufaktur sareng robotika.

Tianfu Wu nyaéta panulis saluyu tina kertas panalungtikan sareng asistén dosen rékayasa listrik sareng komputer di North Carolina State University. 

"Urang hirup di dunya 3D, tapi mun anjeun nyandak gambar, éta rékaman dunya dina gambar 2D," nyebutkeun Wu.

"Program AI nampi input visual tina kaméra. Janten upami urang hoyong AI berinteraksi sareng dunya, urang kedah mastikeun yén éta tiasa napsirkeun naon anu tiasa dicaritakeun ku gambar 2D ngeunaan rohangan 3D. Dina ieu panalungtikan, urang museurkeun kana hiji bagian tina tantangan éta: kumaha urang bisa meunang AI pikeun akurat ngakuan objék 3D - kayaning jalma atawa mobil - dina gambar 2D, sarta nempatkeun eta objék dina spasi, "Wu nuluykeun. 

Kandaraan Otonomi

Kandaraan otonom sering ngandelkeun lidar pikeun nganapigasi rohangan 3D. Lidar, anu ngagunakeun laser pikeun ngukur jarak, mahal, hartosna sistem otonom henteu kalebet seueur redundansi. Pikeun nempatkeun puluhan sensor lidar dina mobil driverless anu diproduksi sacara masal bakal mahal pisan. 

"Tapi upami kendaraan otonom tiasa nganggo input visual pikeun nganapigasi rohangan, anjeun tiasa ngawangun redundansi," saur Wu. "Kusabab kaméra sacara signifikan langkung murah tibatan lidar, éta bakal tiasa sacara ékonomis kalebet kaméra tambahan - ngawangun redundansi kana sistem sareng ngajantenkeun langkung aman sareng langkung kuat.

"Éta hiji aplikasi praktis. Nanging, kami ogé bungah ngeunaan kamajuan dasar tina karya ieu: yén kamungkinan pikeun nyandak data 3D tina objék 2D.

Ngalatih AI

MonoCon tiasa ngaidentipikasi objék 3D dina gambar 2D sateuacan nempatkeunana dina "kotak wates," anu nyarioskeun ka AI sisi luar obyék. 

"Anu ngabédakeun padamelan urang nyaéta kumaha urang ngalatih AI, anu ngawangun téknik pelatihan sateuacana," saur Wu. "Sapertos usaha sateuacana, urang nempatkeun objék dina kotak wates 3D nalika ngalatih AI. Nanging, salian ti naroskeun ka AI pikeun ngaduga jarak kaméra-ka-obyék sareng diménsi kotak-kotak wates, kami ogé naroskeun ka AI pikeun ngaduga lokasi unggal dalapan titik kotak sareng jarakna ti pusat wates. kotak dina dua diménsi. Kami nyauran ieu 'kontéks bantu,' sareng kami mendakan yén éta ngabantosan AI langkung akurat ngaidentipikasi sareng ngaduga objék 3D dumasar kana gambar 2D.

"Metoda anu diusulkeun didorong ku téoréma anu terkenal dina téori ukuran, teorema Cramér-Wold. Éta ogé berpotensi lumaku pikeun tugas prediksi-output terstruktur séjén dina visi komputer.

MonoCon diuji ku set data patokan anu loba dipaké disebut KITTI.

"Dina waktos urang ngalebetkeun makalah ieu, MonoCon ngalaksanakeun langkung saé tibatan puluhan program AI sanés anu ditujukeun pikeun ékstrak data 3D dina mobil tina gambar 2D," saur Wu.

Tim ayeuna bakal neuteup kana skala prosés sareng set data anu langkung ageung.

"Pindah ka hareup, kami nuju skala ieu sareng damel sareng set data anu langkung ageung pikeun meunteun sareng nyaluyukeun MonoCon pikeun dianggo dina nyetir otonom," saur Wu. "Kami ogé hoyong ngajalajah aplikasi dina manufaktur, pikeun ningali naha urang tiasa ningkatkeun kinerja tugas sapertos panangan robotic."

Alex McFarland mangrupikeun wartawan AI sareng panulis ngajalajah kamajuan panganyarna dina intelijen buatan. Anjeunna parantos kolaborasi sareng seueur ngamimitian AI sareng publikasi di sakuliah dunya.