Kecerdasan buatan1 year ago
LLM-as-a-Judge: Solusi Scalable untuk Mengevaluasi Model Bahasa Menggunakan Model Bahasa
Kerangka LLM-as-a-Judge adalah alternatif otomatis yang scalable untuk evaluasi manusia, yang sering kali mahal, lambat, dan terbatas oleh volume respons yang dapat dinilai. Dengan menggunakan LLM...