Pemimpin pemikiran
Kepribadian AI Anda Memiliki Arti yang Sama Besar dengan IQ-nya β dan Akan Membuat atau Menghancurkan Penerapan Perusahaan

Sebagian besar perusahaan masih memilih model AI berdasarkan benchmark. Dalam prakteknya, itu jarang menentukan apakah sistem tersebut benar-benar bekerja.
Sampai sekarang, sebagian besar percakapan tentang model bahasa besar di lingkungan perusahaan telah didominasi oleh benchmark. Tim-tim cenderung menuju kinerja yang dapat diukur, seperti model mana yang paling cerdas, paling kuat dalam coding, paling akurat dalam ringkasan, atau dalam penalaran matematika.
Namun, ketika tim mulai melampaui fase eksperimen dan memasuki penerapan yang sebenarnya pada skala besar, faktor-faktor lain yang penting, yang saat ini diabaikan oleh sebagian besar CEO, akan terbukti sama pentingnya untuk kesuksesan bisnis.
Keterpekerjaan AI
Inteligensi dan kemampuan analitis yang mentah sangat penting, tetapi variabel yang paling kurang dihargai dalam penerapan AI perusahaan adalah kepribadian. Kepribadian, dalam konteks model bahasa besar, merujuk pada suara, nada, dan perilaku yang konsisten yang ditampilkan oleh model dalam interaksi. Ini membuat AI terasa kohesif dan dapat diandalkan.
Ketika menerapkan AI, bisnis perlu menggunakan pendekatan yang sama seperti ketika merekrut karyawan manusia: menilai tidak hanya bagaimana model dapat menyelesaikan tugas, tetapi juga sikapnya terhadap pekerjaan, bagaimana ia berkomunikasi, dan bagaimana ia masuk dalam alur kerja yang lebih besar.
Kemampuan model untuk mempertahankan konsistensi, merespons dengan tepat, dan menangani nuansa dalam konteks yang berbeda dapat memiliki dampak signifikan pada hasil bisnis. AI yang sangat cerdas secara teknis yang merespons lambat, bergeser dalam nada, atau menangani interaksi yang halus dengan tidak tepat dapat disalahgunakan oleh bisnis, membuat pengguna frustrasi, mengurangi keterlibatan, dan pada akhirnya mengurangi efektivitas AI dan kesuksesan bisnis.
Hal ini sangat penting dalam industri seperti dukungan pelanggan, pendekatan politik, atau komunikasi internal, karena pergeseran halus dalam nada atau frasa antara respons dapat menyebabkan kebingungan, mengikis kepercayaan, dan mengurangi keterlibatan secara keseluruhan. Seperti halnya manusia, tidak ada model impian tunggal yang mengungguli kompetisi dalam setiap kategori. Beberapa model lebih baik dalam melakukan tugas analitis seperti coding atau matematika, sementara yang lain melakukan jauh lebih baik dalam penulisan percakapan dan merangkum pertemuan.
Namun, tantangan bagi tim yang membangun di atas sistem ini adalah bahwa karakteristik ini tidak tetap.
Target yang Bergerak
Lanskap AI berkembang lebih cepat daripada sebagian besar organisasi dapat mengikuti. Versi baru dirilis secara teratur, dan karakteristik kinerja dapat bergeser dari satu pembaruan ke pembaruan berikutnya. Seri model Gemini dari Google adalah contoh baru-baru ini.
Gemini 2.0 Pro dirilis pada Februari 2025 dan segera dipromosikan sebagai model unggulan bagi pengembang dan perusahaan yang menggunakannya untuk coding dan prompt kompleks di seluruh dunia.
Ini dilengkapi dengan jendela konteks terbesar yang pernah ditawarkan Google pada saat itu, yaitu dua juta token, yang memberinya kemampuan untuk menganalisis dan memahami sejumlah besar informasi sekaligus, serta menggunakan alat seperti Google Search dan bahkan menulis kode.
Bagi tim yang membangun sistem yang perlu memproses volume data besar dengan cepat dan akurat, tampaknya ini adalah pilihan yang jelas. Namun, dalam beberapa minggu, Google merilis Gemini 2.5 Pro, yang segera mengungguli pendahulunya dengan perbaikan dalam coding, matematika, dan sains.
Secara tiba-tiba, model yang baru saja menjadi pilihan terbaik di pasar sudah digantikan kurang dari dua bulan setelah peluncuran. Namun, para pelopor awal segera menyadari bahwa perubahan tersebut tidak hanya inkremental atau analitis — kepribadian Gemini secara keseluruhan telah berubah dalam semalam. Beberapa pengembang bahkan menyatakan AI tersebut bertindak seolah-olah telah “dilobotomi” setelah pembaruan.
Mereka mengeluh bahwa AI tampaknya menjadi, secara harfiah, “lebih bodoh” — secara konsisten menghasilkan respons yang lebih lambat, output yang kurang kohesif, dan menampilkan inkonsistensi dalam menangani prompt yang sebelumnya tidak ada masalah dan tugas yang dulunya terasa lancar tiba-tiba menjadi kaku.
Dan inilah tempat strategi perusahaan seputar penerapan AI mulai bergeser secara fundamental.
Di Luar Benchmark
Secara teori, Gemini 2.5 Pro seharusnya menjadi pemenang yang jelas dengan perbaikan besar dalam kemampuan dan keamanan.
Namun, dalam prakteknya, perubahan tersebut sama sekali mengubah seberapa andal model tersebut, bagaimana ia berperilaku, merespons prompt, dan, pada gilirannya, mengirim tim yang baru saja menghabiskan uang dan menghabiskan berjam-jam untuk membangun di atas sistem ini kembali ke titik awal jika kemampuan model baru tidak sesuai dengan pipeline yang ada.
Even small shifts in behavior can disrupt systems built around consistency and predictability. Ini menciptakan risiko operasional yang nyata jika bisnis sangat bergantung pada model tunggal, karena setiap pembaruan dapat memperkenalkan ketidakstabilan segera ke tim yang mengandalkan sistem ini.
Untuk mengatasi hal ini, banyak perusahaan yang berpikiran maju telah mulai menerapkan strategi multi-model di mana mereka mengarahkan tugas yang berbeda ke model yang paling sesuai untuk mereka, bukan hanya mengandalkan satu model untuk menangani semuanya.
Pendekatan ini tidak hanya meningkatkan kinerja yang disesuaikan dengan setiap tugas, tetapi juga mengurangi risiko yang terkait dengan implementasi AI, karena jika satu model memburuk setelah pembaruan, itu tidak akan membawa seluruh sistem yang mengandalkannya turun bersama-sama karena ada cadangan yang tersedia.
Singkatnya, kepribadian dan keandalan AI sama pentingnya dengan inteligensi mentahnya ketika menerapkan model dalam lingkungan kerja untuk menyelesaikan tugas yang beragam. Perubahan dalam cara berpikir ini mewakili perubahan fundamental dalam cara bisnis tidak lagi hanya membeli “alat yang lebih pintar,” tetapi membangun dan mengelola seluruh sistem infrastruktur digital.
Agar perusahaan tidak hanya bertahan, tetapi juga berkembang dalam lanskap bisnis saat ini, tim perlu membangun pipeline yang dapat menukar model yang berbeda tergantung pada tugas, dan terus memantau bagaimana pembaruan mempengaruhi kinerja dan kualitas interaksi.
Akhirnya, model-model itu sendiri akan terus berkembang dengan kecepatan yang sulit diikuti. Namun, bisnis yang merencanakan perubahan, membangun redundansi, dan memperlakukan AI sebagai alat dan rekan tim akan menjadi mereka yang mengubah perubahan cepat ini menjadi keunggulan kompetitif. Perubahan ini akan mempengaruhi kinerja dan kualitas interaksi. Pada akhirnya, model-model itu sendiri akan terus berkembang dengan kecepatan yang sulit diikuti. Namun, bisnis yang merencanakan perubahan, membangun redundansi, dan memperlakukan AI sebagai alat dan rekan tim akan menjadi mereka yang mengubah perubahan cepat ini menjadi keunggulan kompetitif. updates affect both performance and interaction quality. Ultimately, the models themselves will continue to evolve at a pace that’s hard to match. But businesses that plan for change, build redundancy, and treat AI as both a tool and a teammate will be the ones that turn these rapid shifts into a competitive advantage.












