Terhubung dengan kami

AI 101

Apa itu Visi Komputer?

mm

Apa itu Visi Komputer?

Algoritme visi komputer adalah salah satu sistem AI paling transformatif dan kuat di dunia saat ini. Sistem visi komputer lihat penggunaan di kendaraan otonom, navigasi robot, sistem pengenalan wajah, dan banyak lagi. Namun, apa sebenarnya algoritma visi komputer itu? Bagaimana mereka bekerja? Untuk menjawab pertanyaan ini, kami akan mendalami teori di balik visi komputer, algoritme visi komputer, dan aplikasi untuk sistem visi komputer.

Bagaimana Cara Kerja Sistem Computer Vision?

Untuk memahami sepenuhnya cara kerja sistem visi komputer, mari luangkan waktu sejenak untuk membahas cara manusia mengenali objek. Penjelasan terbaik yang dimiliki neuropsikologi tentang bagaimana kita mengenali objek adalah model yang menggambarkan fase awal pengenalan objek sebagai tempat di mana komponen dasar objek, seperti bentuk, warna, dan kedalaman diinterpretasikan terlebih dahulu oleh otak. Sinyal dari mata yang masuk ke otak dianalisis untuk menarik keluar tepian suatu benda terlebih dahulu, dan tepian tersebut digabungkan menjadi representasi yang lebih kompleks sehingga melengkapi bentuk benda tersebut.

Sistem visi komputer beroperasi sangat mirip dengan sistem visual manusia, dengan terlebih dahulu membedakan tepi objek dan kemudian menggabungkan tepi ini menjadi bentuk objek. Perbedaan besarnya adalah karena komputer menginterpretasikan gambar sebagai angka, sistem visi komputer memerlukan beberapa cara untuk menginterpretasikan masing-masing piksel yang membentuk gambar. Sistem visi komputer akan menetapkan nilai ke piksel dalam gambar dan dengan memeriksa perbedaan nilai antara satu wilayah piksel dan wilayah piksel lainnya, komputer dapat membedakan tepi. Misalnya, jika gambar yang dimaksud adalah skala abu-abu, maka nilainya akan berkisar dari hitam (diwakili oleh 0) hingga putih (diwakili oleh 255). Perubahan tiba-tiba dalam rentang nilai piksel yang berdekatan akan menunjukkan tepi.

Prinsip dasar membandingkan nilai piksel ini juga dapat dilakukan dengan gambar berwarna, dengan komputer membandingkan perbedaan antara saluran warna RGB yang berbeda. Jadi ketahuilah bahwa kita mengetahui bagaimana sistem visi komputer memeriksa nilai piksel untuk menginterpretasikan gambar, mari kita lihat arsitektur sistem visi komputer.

Jaringan Saraf Konvolusi (CNN)

Jenis utama AI yang digunakan dalam tugas visi komputer adalah satu berdasarkan jaringan saraf konvolusional. Apa itu konvolusi sebenarnya?

Konvolusi adalah proses matematis yang digunakan jaringan untuk menentukan perbedaan nilai antar piksel. Jika Anda membayangkan kisi nilai piksel, bayangkan kisi yang lebih kecil dipindahkan ke kisi utama ini. Nilai di bawah kisi kedua sedang dianalisis oleh jaringan, sehingga jaringan hanya memeriksa beberapa piksel dalam satu waktu. Ini sering disebut teknik "jendela geser". Nilai yang dianalisis oleh jendela geser diringkas oleh jaringan, yang membantu mengurangi kerumitan gambar dan mempermudah jaringan untuk mengekstraksi pola.

Jaringan saraf konvolusional dibagi menjadi dua bagian yang berbeda, bagian konvolusional dan bagian yang terhubung penuh. Lapisan konvolusional jaringan adalah ekstraktor fitur, yang tugasnya adalah menganalisis piksel dalam gambar dan membentuk representasi piksel tersebut sehingga lapisan jaringan saraf yang terhubung rapat dapat mempelajari polanya. Lapisan konvolusional dimulai dengan hanya memeriksa piksel dan mengekstraksi fitur tingkat rendah dari gambar seperti tepi. Lapisan konvolusional selanjutnya menggabungkan tepi menjadi bentuk yang lebih kompleks. Pada akhirnya, jaringan diharapkan akan memiliki representasi tepi dan detail gambar yang dapat diteruskan ke lapisan yang terhubung penuh.

Anotasi Gambar

Meskipun jaringan saraf konvolusional dapat mengekstraksi pola dari gambar dengan sendirinya, keakuratan sistem visi komputer dapat ditingkatkan secara signifikan dengan memberi anotasi pada gambar. Anotasi gambar adalah proses penambahan metadata pada citra yang membantu classifier dalam mendeteksi objek-objek penting pada citra. Penggunaan anotasi gambar penting saat sistem visi komputer harus sangat akurat, seperti saat mengendalikan kendaraan otonom atau robot.

Ada berbagai cara agar gambar dapat dianotasi untuk meningkatkan kinerja pengklasifikasi visi komputer. Anotasi gambar sering dilakukan dengan kotak pembatas, kotak yang mengelilingi tepi objek target dan memberi tahu komputer untuk memusatkan perhatiannya di dalam kotak. Segmentasi semantik adalah jenis lain dari anotasi gambar, yang beroperasi dengan menetapkan kelas gambar ke setiap piksel dalam gambar. Dengan kata lain, setiap piksel yang dapat dianggap sebagai β€œrumput” atau β€œpohon” akan diberi label sebagai bagian dari kelas tersebut. Teknik ini memberikan presisi tingkat piksel, tetapi membuat anotasi segmentasi semantik lebih rumit dan memakan waktu daripada membuat kotak pembatas sederhana. Metode anotasi lainnya, seperti garis dan titik, juga ada.

Blogger dan programmer dengan spesialisasi di Pembelajaran mesin dan Belajar mendalam topik. Daniel berharap dapat membantu orang lain menggunakan kekuatan AI untuk kebaikan sosial.