Connect with us

Wawancara

Sohaib Khan, Co-Founder & CEO of Hazen.ai – Interview Series

mm

Sohaib Khan, adalah Co-Founder & CEO of Hazen.ai, sebuah perusahaan yang menggunakan computer vision dan deep learning untuk merancang perangkat lunak analitik lalu lintas pintar yang dirancang untuk ‘memahami’ gerakan setiap kendaraan.

Apa yang awalnya menarik Anda ke bidang AI?

Itu terjadi selama undergraduate bahwa saya pertama kali membaca tentang bagaimana stereo-vision (atau binocular vision – memperkirakan kedalaman dari dua kamera) bekerja. Itu membuat saya tertarik untuk menjelajahi computer vision lebih lanjut. Menariknya, saya pertama kali membaca tentang itu dalam sebuah buku yang saya temukan dari pasar tradisional Jumat di mana mereka menjual buku bekas di trotoar samping jalan di kota kami. Saya kemudian melakukan PhD di bidang ini dari AS.

Anda sebelumnya adalah profesor di salah satu universitas terbesar di Pakistan, The Lahore University of Management Sciences (LUMS). Apa yang menjadi minat mengajar dan penelitian Anda?

Ketika saya bergabung dengan LUMS setelah PhD saya, saya membangun apa yang merupakan laboratorium penelitian pascasarjana pertama di universitas, dari dana yang saya terima dari sebuah organisasi pertahanan besar. Program pascasarjana di CS sangat baru, dan tidak ada laboratorium penelitian pada saat itu. Saya mengajar Computer Vision selama 12+ tahun di LUMS, dan memiliki laboratorium aktif di bidang ini. Awalnya, computer vision hampir tidak diajarkan di universitas Pakistan mana pun, tetapi kemudian, menjadi subjek standar, dan sebenarnya, banyak mahasiswa saya sekarang juga mengajar di universitas-universitas Pakistan.

Apakah Anda dapat membahas apa yang menginspirasi Anda untuk meluncurkan sebuah startup yang mengkhususkan diri dalam computer vision dan deep learning algorithms untuk video analytics?

Computer Vision, selama waktu yang lama, sebagian besar merupakan bidang penelitian eksperimental, dengan aplikasi terbatas dalam produk. Ini sebagian besar karena kematangan algoritma yang diperlukan untuk membangun produk tidak ada. Untuk sebuah produk, algoritma pemahaman gambar harus bekerja dalam berbagai kondisi pengambilan gambar dan pencahayaan, dan tidak hanya dalam beberapa eksperimen terkontrol. Kami memiliki lelucon di antara mahasiswa pascasarjana di laboratorium kami ketika saya melakukan PhD kembali pada tahun 2000, bahwa jika Anda dapat menemukan tiga gambar di mana algoritma Anda bekerja, Anda dapat menulis makalah. Jika itu bekerja pada tiga video, Anda mendapatkan makalah yang sangat baik! Poinnya adalah bahwa banyak algoritma visi bekerja hanya dalam skenario laboratorium yang hati-hati, dan tidak sangat kuat.

Tapi sekarang hal-hal telah berubah. Dengan munculnya deep learning pada tahun 2012, kami telah melihat beberapa kemajuan yang sangat cepat dan menarik dalam pemahaman gambar. Ketika kami melihat itu, kami merasa bahwa sekarang waktu yang tepat, mungkin untuk membangun produk yang solid yang dapat memiliki dampak yang signifikan.

Jenis pelanggaran lalu lintas apa yang dapat dipantau oleh Hazen.ai?

Tujuan kami adalah untuk dapat mengidentifikasi semua jenis perilaku mengemudi berbahaya di jalan. Ini didorong oleh tujuan utama kami untuk mengurangi kematian di jalan. Setiap 24 detik, seseorang meninggal dalam kecelakaan lalu lintas, yang setara dengan sekitar 15 787-8 Dreamliners jatuh setiap hari! Jadi ini benar-benar apa yang memotivasi kami. Itulah mengapa kami membangun perangkat lunak yang dapat mendeteksi berbagai jenis perilaku berbahaya dan tidak aman, seperti perubahan jalur yang tidak aman, putaran ilegal, melompati lampu merah atau tanda berhenti, memblokir penyeberangan pejalan kaki, tidak mengenakan sabuk pengaman atau mengemudi sambil mengirim teks. Kami juga bekerja untuk membangun fitur dalam perangkat lunak kami khusus untuk keselamatan pejalan kaki dan pengendara sepeda, karena lebih dari setengah korban kecelakaan lalu lintas terjadi pada segmen pengguna jalan yang rentan dari pejalan kaki, pengendara sepeda dan pengendara motor.

Apa beberapa tantangan unik di balik menggunakan computer vision untuk memantau objek yang bergerak pada kecepatan tinggi?

Ada dua jenis tantangan: Pertama adalah kinerja algoritma computer vision itu sendiri – Anda ingin memiliki produk yang dapat bekerja dalam kondisi lalu lintas yang menantang 24/7 dalam semua variasi pencahayaan. Sementara telah ada kemajuan teknis yang signifikan menuju tujuan ini, masih ada negara-negara di mana kepadatan pengguna jalan sangat tinggi, seperti klaster sepeda motor atau pejalan kaki dalam jarak yang sangat dekat, sehingga masih menantang bagi algoritma untuk melacak mereka secara individu dan memahami adegan. Tapi kedua, tantangan yang lebih besar adalah membuat produk yang solid dari algoritma computer vision, yang dapat diterapkan pada sumber daya perangkat keras yang terbatas di tepi, dan dapat dipantau dan dikelola dengan mudah meskipun didistribusikan di seluruh kota. Karena produk computer vision menangani banyak data video, menerapkan mereka di tepi, sebagai perangkat IoT, dan mengelolanya secara efektif, tetap menjadi tugas yang sulit.

Apa proses untuk pengguna akhir untuk mengkonfigurasi perangkat lunak untuk berbagai konfigurasi jalan?

Setiap persimpangan menyediakan skenario unik, dalam hal volume lalu lintas, konfigurasi jalur dan jenis kendaraan, sepeda atau interaksi pejalan kaki. Selain itu, minat manajer lalu lintas mungkin spesifik, untuk mengidentifikasi jenis perilaku lalu lintas tertentu di setiap situs. Misalnya, polisi lalu lintas mungkin melarang putaran U di sebuah persimpangan untuk memuluskan aliran lalu lintas, dan tertarik untuk menangkap statistik tersebut. Itulah mengapa kami telah menjaga perangkat lunak kami dapat dikonfigurasi untuk berbagai skenario. Ketika kamera diatur dengan perangkat lunak kami, kami mengkonfigurasinya melalui proses sederhana untuk apa yang diperlukan pengguna akhir di situs tersebut. Secara internal, kami telah membangun bahasa tingkat tinggi di mana kami dapat menjelaskan skenario lalu lintas yang menarik dengan cara yang sederhana. Ini memungkinkan kami untuk mengkonfigurasi situs dengan cepat untuk pelanggan kami.

Jenis perangkat keras apa yang diperlukan untuk mengoperasikan sistem ini?

Analitik video memerlukan daya komputasi yang signifikan. Kami telah mengoptimalkan kode kami untuk berjalan pada Nvidia GPU yang lebih kecil yang dapat diterapkan di tepi, seperti seri Jetson mereka, dan juga pada Intel CPU untuk beberapa fitur yang kami tawarkan. Dalam beberapa tahun terakhir, perangkat keras tepi yang lebih kuat tersedia pada titik harga yang wajar, sehingga ini benar-benar mengemudi banyak aplikasi yang menarik.

Apakah Anda dapat membahas jika ada yurisdiksi yang saat ini melakukan percobaan atau menggunakan teknologi Hazen.ai?

Kami sekarang memiliki percobaan yang sedang berlangsung di beberapa negara, UK, USA, Mesir, Arab Saudi, Pakistan, Oman, Peru dan berinteraksi dengan calon pelanggan di negara-negara lain juga.

Apakah ada yang lain yang Anda ingin bagikan tentang Hazen.ai?

Secara keseluruhan, kami merasa bahwa teknologi keselamatan lalu lintas belum cukup berkembang, dibandingkan dengan skala masalah. Namun, sekarang waktu yang tepat, karena kemajuan besar dalam computer vision dan deep learning, serta ketersediaan kamera dan perangkat keras komputasi yang murah. Kami akan melihat banyak aplikasi lain dari computer vision berbasis tepi di tahun-tahun mendatang. Ini adalah dasar yang mendorong Hazen.ai.

Terima kasih atas wawancara, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi Hazen.ai

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.