Pemimpin pemikiran
Mengapa Generative-Augmented Retrieval Adalah Batas Terdepan Berikutnya dari Data Analytics

Tiga dari empat orang mengatakan bahwa organisasi mereka menggunakan AI. Namun, sebagian besar kegiatan itu masih berfokus pada konten tidak terstruktur: meringkas pertemuan, mengatur email, atau mengotomatisasi dukungan pelanggan.
Tapi ironisnya, sebagian besar data yang sebenarnya mengarahkan keputusan bisnis – laporan keuangan, tabel gudang, dan KPI – masih belum disentuh oleh AI.
Alasannya bukanlah kurangnya ambisi, tetapi kurangnya kepercayaan. Ketika model menghalusinasi sebuah kalimat, itu sering dapat diperbaiki; ketika itu menghalusinasi sebuah angka, itu adalah bencana. Seorang CFO tidak dapat menandatangani jawaban yang tidak dapat diverifikasi.
Hari ini, data terstruktur hidup di seluruh puluhan sistem, masing-masing dengan aturannya sendiri dan hubungannya. Mendapatkan AI untuk berpikir dengan benar di seluruh kompleksitas itu adalah tantangan yang lebih sulit daripada chatbot mana pun.
Bisnis dan tim mereka – termasuk pengguna non-teknis – perlu dapat berinteraksi dengan data mereka dengan cara yang sederhana untuk mengurangi bottleneck dan mengambil wawasan yang akurat dan cepat. Tanpa harus belajar SQL.
Beberapa solusi mulai muncul – mari kita lihat beberapa contoh terkemuka, dengan manfaat dan kelemahannya.
AI dan Data Terstruktur – Jembatan Terlalu Jauh
Selama dua tahun terakhir, beberapa upaya telah muncul untuk menghubungkan wawasan AI dan data terstruktur.
Banyak yang berasal dari raksasa teknologi dengan sumber daya dan data yang signifikan. Snowflake, misalnya, memperkenalkan Cortex Analyst, yang mencoba memungkinkan pengguna untuk mengajukan pertanyaan bahasa alami terhadap gudang data Snowflake.
Untuk meningkatkan akurasi, Cortex memiliki cara untuk menyediakan metadata semantik – tetapi modelnya sangat terbatas. Untuk satu, itu harus dibangun secara manual, dan bahkan demikian, itu hanya dapat beroperasi pada maksimal 10 tabel, tidak cukup bahkan untuk perusahaan berukuran sedang. Lebih tinggi, dan kepercayaan putus, karena akurasi menurun.
Cerita itu berulang dengan upaya oleh Databricks, yang mengambil pendekatan text-to-SQL dengan AI/BI Genie. Solusi ini hanya dapat diterapkan secara efektif pada domain kecil, kehilangan akurasi dengan meningkatnya dataset.
Microsoft Power BI Copilot mengambil pendekatan generatif permukaan, memasukkan AI langsung ke dalam dashboard untuk menjelaskan visual, menyarankan pengukuran, dan mengatur laporan. Ini meningkatkan eksplorasi tetapi tidak mengubah cara analitik dipikirkan atau diverifikasi. Setiap respons masih bergantung pada penilaian model, dan ketika penilaian itu gagal, tidak ada jejak audit atau logika deterministik untuk kembali.
Secara kolektif, sistem ini menunjuk ke arah yang benar: menerapkan AI pada data perusahaan terstruktur. Tetapi mereka juga berbagi kelemahan kritis. Mereka bergantung pada model AI untuk menghasilkan SQL dari bahasa alami, dan ketika SQL itu salah, yang terjadi sering, pengguna bisnis terjebak. Seorang eksekutif yang tidak dapat membaca SQL tidak memiliki cara untuk mendiagnosis atau memperbaiki hasil. Percakapan berhenti dingin.
Cara lain untuk mendekati masalah ini adalah dengan pra-mengindeks pasangan pertanyaan-jawaban yang mungkin. GARAGe Ada, di antara lainnya, mengikuti metode ini. Ini bekerja dengan baik di domain yang sempit di mana pertanyaan dapat diprediksi, tetapi kinerja menurun ketika kompleksitas data tumbuh. Sekali tabel dan skema berkembang, pra-mengindeks dengan cepat menjadi tidak dapat diatur.
Jalur Berbeda: Generative-Augmented Retrieval
Generative-Augmented Retrieval (GAR) membalikkan pendekatan RAG saat ini (Retrieval-Augmented Generation sumber informasi relevan dan menggabungkannya ke dalam LLM untuk meningkatkan akurasi).
Sebagai gantinya, GAR menggunakan AI generatif untuk memahami niat pertanyaan pengguna, dan kemudian membuat langkah-langkah penalaran untuk menghasilkan jawaban.
Dalam GAR, pertanyaan berinteraksi langsung dengan basis pengetahuan. Mereka dikompilasi bukan dihasilkan, pertanyaan yang sama selalu menghasilkan jawaban yang sama. Rantai penalaran dalam GAR adalah artefak yang dapat ditinjau, bukan obrolan sementara, sehingga seluruh rantai penalaran dapat direproduksi.
Itu berarti hasilnya jauh lebih akurat daripada dengan mesin genAI yang umum.
Pada intinya, GAR melakukan tiga hal:
- Membangun lapisan semantik secara otomatis. GAR menggunakan AI untuk mengungkap hubungan dan definisi bisnis di seluruh sistem, mempersatukan data ke dalam model tunggal
- Menerjemahkan niat bisnis ke dalam bahasa analitis tingkat tinggi. Bahasa ini menangkap pertanyaan pada tingkat konsep bisnis (“pendapatan per kunjungan oleh penyedia untuk Q2”) dan dikompilasi langsung ke SQL.
- Mencatat setiap langkah penalaran untuk keamanan. Asal dari setiap respons dapat dilacak.
Mengapa Ini Penting
Dengan membatasi penalaran pada model pengetahuan internal bisnis, GAR dapat menghilangkan halusinasi dan menyampaikan jawaban yang dapat dibuktikan dengan benar.
Definisi, metrik, dan pola pertanyaan yang berkembang biak dari waktu ke waktu, membuat jawaban di masa depan lebih disesuaikan dengan pengguna tertentu.
Unsur kepercayaan sangat penting bagi pengguna bisnis yang bergantung pada data terstruktur mereka untuk membuat keputusan bisnis yang tepat. Ketika lebih banyak organisasi menerapkan solusi AI canggih, mereka akan menuntut kerangka kerja yang membawa risiko halusinasi dan kesalahan hampir nol.
Itu terjadi ketika pertanyaan terhubung langsung ke data Anda, ketika AI dapat bekerja pada set data besar tanpa putus, dan ketika jawaban disediakan dengan konsistensi dan dapat dibuktikan.








