Wawancara
Olga Megorskaya, Pendiri dan CEO Toloka – Seri Wawancara

Olga Megorskaya, pendiri dan CEO Toloka, telah memimpin perusahaan sejak 2020, mengarahkannya dari akar crowd-labeling awal menjadi pemain utama dalam layanan data AI. Sebelum mendirikan dan memimpin Toloka, dia menghabiskan lebih dari satu dekade di Yandex, yang berpuncak pada peran sebagai Kepala Crowdsourcing dan Platform, di mana dia membangun dan menskalakan infrastruktur pelabelan data crowdsourced untuk produk machine-learning termasuk pencarian, suara, ucapan, self-driving, moderasi konten, dan lain-lain. Di bawah kepemimpinannya di Toloka, perusahaan telah memposisikan diri sebagai mitra data global untuk AI — menggabungkan teknologi machine-learning dengan keahlian manusia untuk mendukung pelatihan, evaluasi, dan keamanan untuk model AI besar dan agen.
Toloka adalah perusahaan yang berbasis di Belanda dengan kantor pusat di Amsterdam yang menyediakan data berkualitas tinggi, yang dikurasi dengan ahli untuk pengembangan AI, mulai dari anotasi dan pelabelan hingga dataset kustom untuk fine-tuning yang diawasi (SFT) dan pembelajaran dari umpan balik manusia (RLHF). Perusahaan ini mendukung berbagai modality — teks, gambar, audio, video — dan melibatkan ahli domain bersama dengan kerumun global untuk menyediakan dataset yang akurat dan dapat diskalakan untuk melatih dan mengevaluasi agen AI canggih dan model bahasa besar. Layanan mereka membantu meningkatkan kemampuan seperti penalaran, pemahaman multibahasa, generasi gambar/audio, dan keamanan AI di seluruh industri dan aplikasi.
Anda menghabiskan beberapa tahun membangun sistem human-in-the-loop di Yandex sebelum mendirikan Toloka pada 2020. Apa yang membuat Anda yakin bahwa ini perlu menjadi perusahaan tersendiri, dan bagaimana pengalaman itu membentuk visi Anda untuk peran Toloka dalam pengembangan AI?
Di titik tertentu, kami menyadari bahwa Toloka telah berkembang melebihi perusahaan asalnya. Peneliti AI dari seluruh dunia menggunakan platform ini, dan kami mengakui bahwa perusahaan dapat mencapai lebih banyak sebagai entitas independen. Akibatnya, Toloka dapat mengandalkan pengalaman kumulatif ratusan tim AI yang mengumpulkan data pelatihan untuk spektrum penuh solusi AI — dari pencarian web dan asisten suara hingga chatbot GenAI dan Agen AI. Kami telah menggabungkan keahlian kami dalam mengelola upaya manusia dengan membangun dan melatih Agen AI untuk menciptakan produk baru kami, Tendem.
Anda telah mengatakan bahwa gangguan nyata di depan tidak akan datang dari agen yang sepenuhnya otonom. Apa yang membuat Anda menyimpulkan bahwa agen hibrida — menggabungkan otomatisasi AI dengan penilaian manusia — adalah model yang akan akhirnya menang?
Meskipun saya percaya bahwa solusi AI-only di banyak area akan segera mencapai tingkat kualitas yang luar biasa untuk memenuhi kebutuhan pelanggan, akan selalu ada ekor panjang dari kasus penggunaan yang model dasar tidak akan dioptimalkan. Inilah tempat pendekatan hibrida akan mengungguli kedua solusi AI-only dan human-only untuk masa depan yang dapat diprediksi. Kami telah melihat pola yang sama berulang kali selama dekade terakhir: AI dapat menskalakan tugas dengan indah, tetapi ia bergelut dengan nuansa, konteks, dan jenis panggilan penilaian yang penting dalam pengaturan bisnis nyata. Profesional ingin kecepatan, tetapi mereka juga membutuhkan keandalan — agen yang sepenuhnya otonom tidak dapat menjamin itu saat ini. Sistem hibrida menang karena mereka memecahkan kedua sisi persamaan. AI menangani apa yang terbaik untuknya: kecepatan, struktur, dan keterulangan. Keahlian manusia mengisi celah: ketidakjelasan, kasus tepi, dan interpretasi. Ketika Anda menggabungkan keduanya secara asli, Anda mendapatkan alur kerja yang cepat dan dapat dipercaya. Itulah model yang profesional akhirnya akan andalkan.
Anda telah mencatat bahwa AI rusak pada ketidakjelasan dan penalaran multi-dokumen. Apa jenis tugas yang menunjukkan keterbatasan ini dengan jelas?
Tugas jangka panjang — yang memerlukan sintesis dari beberapa sumber, memperbaiki informasi yang bertentangan, atau menafsirkan konteks, dan yang akan memakan waktu berjam-jam atau bahkan berhari-hari bagi manusia untuk menyelesaikannya — cenderung mengekspos batasan AI saat ini. Contoh termasuk penelitian pasar, analisis kompetitif, meringkas dokumen panjang, membuat konten asli dari input campuran, atau menarik kesimpulan yang bergantung pada nuansa manusia daripada pengenalan pola. AI sangat baik dalam menghasilkan lulus pertama. Tetapi saat tugas memerlukan prioritas, penilaian, atau memperbaiki ketidakjelasan, keandalan turun tajam. Itulah tempat ahli manusia sangat penting.
Banyak profesional menggunakan AI tetapi masih tidak sepenuhnya mempercayainya. Bagaimana pendekatan Anda membangun kembali kepercayaan dalam mendelegasikan pekerjaan nyata ke sistem yang dibantu AI?
Kepercayaan meningkat ketika orang tidak perlu lagi memperbaiki output AI. Pendekatan kami membangun kembali kepercayaan dengan mengintegrasikan manusia ke dalam alur kerja dari awal, bukan sebagai jalur eskalasi ketika AI gagal. Setiap tugas di Tendem mengalir melalui manajer proyek AI yang memutuskan apa yang harus diotomatisasi dan apa yang memerlukan keahlian manusia. Setelah itu, baik pemeriksaan otomatis maupun QA manusia memastikan output akhir akurat, lengkap, dan siap bisnis. Bagi profesional, ini berarti mereka dapat mendelegasikan pekerjaan dan benar-benar mengharapkan hasil yang diverifikasi, bukan draf yang perlu mereka perbaiki.
Apa mekanisme yang memastikan bahwa ahli manusia dalam loop mempertahankan output berkualitas tinggi tanpa memperlambat alur kerja?
Dua hal membuat ini memungkinkan:
- Spesialisasi skala besar. Ahli di jaringan Tendem telah diverifikasi, dilatih, dan dicocokkan berdasarkan keahlian domain. Mereka bukan freelancer umum yang mencoba beradaptasi di tengah jalan — mereka sudah memenuhi syarat untuk tugas tertentu.
- QA berlapis dan pengaturan cerdas. AI menangani langkah-langkah roti dan keju sehingga ahli manusia hanya fokus pada bagian yang memerlukan penilaian. Kemudian ada lapisan kedua QA otomatis dan verifikasi manusia jika diperlukan. Ini menjaga manusia terlibat di mana mereka menambah nilai paling banyak, bukan di mana mereka menciptakan bottleneck.
Hasilnya adalah kecepatan yang setara dengan otomatisasi, dengan akurasi yang setara dengan tinjauan ahli.
Di industri yang menuntut akurasi dan kepatuhan, bagaimana sistem hibrida dapat menawarkan verifiabilitas dan auditabilitas yang dapat diandalkan bisnis?
Sistem hibrida secara inheren memungkinkan auditabilitas karena setiap langkah dalam alur kerja dilacak, diatribusikan, dan diperiksa kualitasnya. Anda tahu bagian mana yang diotomatisasi, bagian mana yang dilakukan oleh ahli yang diverifikasi, dan langkah-langkah QA apa yang memvalidasi output. Di industri yang sangat diatur, proses ini menjadi penting. Anda tidak lagi mengandalkan keputusan AI black-box; Anda memiliki rantai verifikasi penilaian, koreksi, dan persetujuan. Itulah yang membuat sistem hibrida cocok untuk domain di mana akurasi dan kepatuhan tidak dapat diabaikan.
Mana kategori pekerjaan pengetahuan yang Anda harapkan untuk beralih ke agen hibrida pertama, dan mana yang akan paling lambat untuk mengadopsi model ini?
Secara keseluruhan, saya pikir pendekatan hibrida jauh lebih mudah diadopsi daripada pendekatan AI-only, sehingga kami antisipasi hampir semua domain dapat diliput dengan model ini — perbedaannya hanya akan dalam proporsi AI versus keterlibatan manusia. Pengadopsi awal adalah peran di mana kecepatan dan akurasi keduanya penting, namun pekerjaannya masih sangat berulang. Kami sudah melihat tarikan kuat dari konsultasi, pemasaran, operasi penjualan, penelitian, dan pembuatan konten. Area yang paling kompleks (dan mungkin paling menarik) untuk dipecahkan adalah yang lebih dekat dengan dunia fisik, seperti arsitektur dan konstruksi. Tetapi saya melihat jalur teknologi yang jelas untuk sampai ke sana juga.
Dari sudut pandang operasional, bagaimana organisasi mendapat manfaat ketika beralih dari pekerjaan yang dikelola freelancer ke agen hibrida?
Agen hibrida menghilangkan dua ketidakefisienan terbesar dalam pekerjaan yang dikelola freelancer: overhead manajemen dan kualitas yang tidak konsisten. Organisasi dan profesional tidak perlu lagi merekrut, memverifikasi, memberi briefing, mengelola, atau memperbaiki freelancer. Agen hibrida menangani orkestrasi alur kerja secara otomatis, menugaskan kombinasi yang tepat dari AI dan keahlian manusia untuk setiap langkah. Ini mengurangi waktu putaran, memstandarkan kualitas output, dan menskalakan pekerjaan tanpa menskalakan jumlah pegawai. Dengan singkat: Anda mendapatkan kecepatan otomatisasi dengan keandalan tim ahli, tetapi tanpa mengelola keduanya.
Seiring sistem hibrida mendapatkan daya tarik mainstream, apa dampak yang Anda harapkan peralihan ini akan memiliki pada perekonomian freelancer dan gig yang lebih luas?
Kami pikir itu akan membentuk kembali perekonomian freelancer, bukan menggantinya. Alih-alih freelancer menghabiskan waktu untuk tugas berulang rendah, mereka dapat memasuki sistem hibrida sebagai spesialis dalam domain tertentu. Pekerjaan menjadi lebih terstruktur: nilai yang lebih tinggi, lebih dapat diprediksi, dan lebih stabil. Alih-alih mengejar proyek yang tidak konsisten, ahli dapat berkontribusi pada skala melalui platform seperti Tendem, di mana keterampilan mereka dicocokkan dengan tugas yang tepat dan didukung oleh sistem AI yang menghilangkan pekerjaan yang membosankan.
Melihat ke depan beberapa tahun, apa yang “delegasi ke AI” terlihat seperti sekali agen hibrida menjadi standar di seluruh pekerjaan digital?
Delegasi akan terasa kurang seperti “menggunakan alat” dan lebih seperti menyerahkan pekerjaan kepada tim yang mampu. Anda akan menjelaskan hasil yang diinginkan, dan agen hibrida akan memecahnya, mengatur tugas-tugas, menerapkan campuran yang tepat dari AI dan keahlian manusia, memverifikasi hasil, dan mengirimkan produk jadi — semuanya dalam hitungan jam. Perubahan akan dari menggunakan AI sebagai asisten drafting, kepercayaan AI sebagai manajer proyek yang mengawasi seluruh alur kerja. Itulah saat delegasi yang sebenarnya terjadi: ketika profesional dapat mempercayai sistem untuk mengirimkan output akhir, bukan hanya titik awal.
Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut dapat mengunjungi Toloka.












