Yapay Zekâ

Ajan Laboratuvarı: AMD ve Johns Hopkins Tarafından Sanal Araştırma Ekibi

Published January 13, 2025

Updated April 26, 2026

Alex McFarland

Herkes AI ajanları ve otomasyon hakkında konuşurken, AMD ve Johns Hopkins Üniversitesi, insanların ve AI’ın araştırma alanında nasıl işbirliği yapabileceğini geliştirmeye çalışıyor. Yeni açık kaynaklı çerçeveleri, Ajan Laboratuvarı, bilimsel araştırmaların insan-AI işbirliği yoluyla nasıl hızlandırılabileceğini tamamen yeniden düşünüyor.

Çok sayıda AI araştırma çerçevesini inceledikten sonra, Ajan Laboratuvarı pratik yaklaşımı nedeniyle öne çıkıyor. Mevcut birçok çözümün aksine, insan araştırmacıları değiştirmeye çalışmak yerine, araştırma sürecinin zaman alan yönlerini ele alarak ve insanları sürücü koltuğunda tutarak yeteneklerini güçlendirmeye odaklanıyor.

Buradaki temel yenilik basit ama güçlü: Tamamen otonom araştırmayı takip etmek (bu genellikle şüpheli sonuçlara yol açar) yerine, Ajan Laboratuvarı, birden fazla uzmanlaşmış AI ajanının birlikte çalıştığı sanal bir laboratuvar oluşturur, her biri araştırma sürecinin farklı yönlerini ele alır ve insan rehberliğine bağlı kalır.

Sanal Laboratuvarın Ayrıştırılması

Ajan Laboratuvarını, AI ajanlarının uzmanlaşmış roller oynadığı iyi organize edilmiş bir araştırma ekibi olarak düşünün. Gerçek bir araştırma laboratuvarında olduğu gibi, her ajanın belirli sorumlulukları ve uzmanlıkları vardır:

Doktora ajansı literatür incelemeleri ve araştırma planlaması ile ilgilenir
Postdoc ajanları deneysel yaklaşımları iyileştirir
ML Mühendis ajanları teknik uygulamayı ele alır
Profesör ajanları araştırma çıktılarını değerlendirir ve puanlar

Bu sistemin özellikle ilginç olan yanı, iş akışıdır. Geleneksel AI araçlarının izole olarak çalıştığından farklı olarak, Ajan Laboratuvarı, bu ajanların birbirleriyle etkileşime girdiği ve birbirlerinin çalışmalarına dayandığı işbirlikçi bir ortam oluşturur.

Süreç, doğal bir araştırma ilerlemesini takip eder:

Literatür İncelemesi: Doktora ajansı, arXiv API kullanarak akademik makaleleri tarar, ilgili araştırmaları toplar ve organize eder
Plan Oluşturma: Doktora ve postdoc ajanları, ayrıntılı araştırma planları oluşturmak için işbirliği yapar
Uygulama: ML Mühendis ajanları kod yazıp test eder
Analiz ve Belgeleme: Takım, sonuçları yorumlamak ve kapsamlı raporlar oluşturmak için birlikte çalışır

Ama burası gerçekten pratik: Çerçeve, hesaplama esnekliğine sahiptir, yani araştırmacılar, hesaplama gücüne ve bütçe kısıtlamalarına bağlı olarak kaynakları tahsis edebilir. Bu, gerçek dünya araştırma ortamları için tasarlanmış bir araçtır.

Schmidgall et al.

İnsan Faktörü: AI ile Uzmanlık Nerede Buluşur

Ajan Laboratuvarı, etkileyici otomasyon yeteneklerine sahipken, gerçek sihir, “ko-pilot modu” olarak adlandırdıkları şeydedir. Bu kurulumda, araştırmacılar, sürecin her aşamasında geri bildirim sağlayabilir, insan uzmanlığı ve AI yardımı arasında gerçek bir işbirliği oluşturur.

Ko-pilot geri bildirimi verileri, bazı dikkat çekici içgörüler ortaya koyuyor. Otonom modda, Ajan Laboratuvarı tarafından oluşturulan makaleler, insan değerlendirmelerinde ortalama 3,8/10 puan aldı. Ancak araştırmacılar ko-pilot moduna geçtiğinde, bu puanlar 4,38/10’a yükseldi. Özellikle ilginç olan, bu iyileştirmelerin nerede ortaya çıktığı – makaleler, açıklık (+0,23) ve sunum (+0,33) açısından önemli ölçüde daha yüksek puanlar aldı.

Ama burası gerçeklik kontrolü: hatta insan katılımıyla birlikte, bu makaleler masih kabul edilen ortalama NeurIPS makalesinin (5,85) altında, yaklaşık 1,45 puan altında kaldı. Bu, bir başarısızlık değil, ancak AI ve insan uzmanlığının birbirini tamamlamak zorunda olduğu konusunda kritik bir öğrenmedir.

Değerlendirme, bir başka ilginç şeyi ortaya koydu: AI değerlendiricileri, insan değerlendiricilerine kıyasla makaleleri yaklaşık 2,3 puan daha yüksek puanladı. Bu fark, neden insan denetiminin araştırma değerlendirmesinde kritik önem taşıdığını vurguluyor.

Schmidgall et al.

Sayıların Ayrıştırılması

Araştırma ortamında gerçekten önemli olan nedir? Maliyet ve performans. Ajan Laboratuvarının model karşılaştırma yaklaşımı, bu konuda bazı sürpriz verimlilik kazanımları ortaya koyuyor.

GPT-4o, tüm iş akışını sadece 1.165,4 saniyede tamamlayarak hız şampiyonu çıktı – bu, o1-mini’den 3,2 kat ve o1-önizlemeden 5,3 kat daha hızlı. Ancak daha da önemli olan, her makale için yalnızca 2,33 $ maliyeti. Önceki otonom araştırma yöntemlerine kıyasla, bu, %84’lik bir maliyet azaltması anlamına geliyor.

Model performansına bakıldığında:

o1-önizleme, fayda ve açıklık açısından en yüksek puanı aldı
o1-mini, deneysel kalite puanlarında en iyi sonucu elde etti
GPT-4o, metriklerde geri kaldı ancak maliyet verimliliği lideri oldu

Gerçek dünya uygulamaları burada önemli.

Araştırmacılar artık yaklaşımını özgü ihtiyaçlarına göre seçebilir:

Hızlı prototip oluşturma gerekiyor mu? GPT-4o hız ve maliyet verimliliği sunuyor
Deneysel kaliteye öncelik veriliyor mu? o1-mini en iyi seçim olabilir
En çok işlenmiş çıktıya mı ihtiyaç var? o1-önizleme vaat ediyor

Bu esneklik, araştırma ekiplerinin çerçeveyi kaynaklarına ve gereksinimlerine uyarlamalarına olanak tanır, böylece tek boyutlu bir çözüme kilitlenmezler.

Araştırmada Yeni Bir Bölüm

Ajan Laboratuvarının yeteneklerini ve sonuçlarını inceledikten sonra, araştırma nasıl yürütüleceğinde önemli bir değişimle karşı karşıya olduğumu düşünüyorum. Ancak bu, thường olarak manşetlerde yer alan değiştirme anlatısı değil, daha nüanslı ve güçlü bir şey.

Ajan Laboratuvarının makaleleri henüz en iyi konferans standartlarına ulaşmasa da, araştırma hızlandırması için yeni bir paradigm oluşturuyor. Bunun, uyku bilmeyen AI araştırma asistanları ekibi gibi düşünün, her biri bilimsel sürecin farklı yönlerinde uzmanlaşmış.

Araştırmacılar için etkiler derin:

Literatür incelemeleri ve temel kodlama için harcanan zaman, yaratıcı fikir üretimi için yönlendirilebilir
Kaynak kısıtlamaları nedeniyle rafa kaldırılmış araştırma fikirleri uygulanabilir hale gelir
Hipotezlerin hızla prototip oluşturulması ve test edilmesi, daha hızlı buluşlara yol açabilir

Mevcut sınırlamalar, AI ve insan değerlendirme puanları arasındaki fark gibi, fırsatlar. Bu sistemlerin her bir yinelemesi, insan ve AI arasındaki daha sofistike araştırma işbirliğine bizi daha da yaklaştırıyor.

İleriye bakıldığında, bilimsel keşfi yeniden şekillendirebilecek üç ana gelişme görüyorum:

Daha sofistike insan-AI işbirliği kalıpları, araştırmacıların bu araçları etkili bir şekilde kullanmayı öğrenmesi ile ortaya çıkacak
Maliyet ve zaman tasarrufu, araştırmayı daha küçük laboratuvarlar ve kurumlar için daha erişilebilir hale getirebilir, böylece daha iddialı projelerin peşinden gitmelerine olanak tanır
Hızlı prototip oluşturma yetenekleri, araştırmada daha deneysel yaklaşımlara yol açabilir

Bu potansiyeli en üst düzeye çıkarmak için anahtar nedir? Ajan Laboratuvarı ve benzer çerçevelerin, otomasyon için değil, güçlendirme için araçlar olduğunu anlamak. Araştırmanın geleceği, insan uzmanlığı ve AI yetenekleri arasında seçim yapmak değil, bunları birbirini tamamlamak için yenilikçi yollar bulmak.

Related Topics:artificial intelligence research

Alex McFarland

Alex McFarland yapay zeka muhabiri ve yazarıdır ve yapay zekadaki son gelişmeleri araştırıyor. Birçok yapay zeka başlangıç şirketi ve dünya çapındaki yayınlarda işbirliği yaptı.