Yapay Zekâ
Ajan Laboratuvarı: AMD ve Johns Hopkins Tarafından Sanal Araştırma Ekibi

Herkes AI ajanları ve otomasyon hakkında konuşurken, AMD ve Johns Hopkins Üniversitesi, insanların ve AI’ın araştırma alanında nasıl işbirliği yapabileceğini geliştirmeye çalışıyor. Yeni açık kaynaklı çerçeveleri, Ajan Laboratuvarı, bilimsel araştırmaların insan-AI işbirliği yoluyla nasıl hızlandırılabileceğini tamamen yeniden düşünüyor.
Çok sayıda AI araştırma çerçevesini inceledikten sonra, Ajan Laboratuvarı pratik yaklaşımı nedeniyle öne çıkıyor. Mevcut birçok çözümün aksine, insan araştırmacıları değiştirmeye çalışmak yerine, araştırma sürecinin zaman alan yönlerini ele alarak ve insanları sürücü koltuğunda tutarak yeteneklerini güçlendirmeye odaklanıyor.
Buradaki temel yenilik basit ama güçlü: Tamamen otonom araştırmayı takip etmek (bu genellikle şüpheli sonuçlara yol açar) yerine, Ajan Laboratuvarı, birden fazla uzmanlaşmış AI ajanının birlikte çalıştığı sanal bir laboratuvar oluşturur, her biri araştırma sürecinin farklı yönlerini ele alır ve insan rehberliğine bağlı kalır.
Sanal Laboratuvarın Ayrıştırılması
Ajan Laboratuvarını, AI ajanlarının uzmanlaşmış roller oynadığı iyi organize edilmiş bir araştırma ekibi olarak düşünün. Gerçek bir araştırma laboratuvarında olduğu gibi, her ajanın belirli sorumlulukları ve uzmanlıkları vardır:
- Doktora ajansı literatür incelemeleri ve araştırma planlaması ile ilgilenir
- Postdoc ajanları deneysel yaklaşımları iyileştirir
- ML Mühendis ajanları teknik uygulamayı ele alır
- Profesör ajanları araştırma çıktılarını değerlendirir ve puanlar
Bu sistemin özellikle ilginç olan yanı, iş akışıdır. Geleneksel AI araçlarının izole olarak çalıştığından farklı olarak, Ajan Laboratuvarı, bu ajanların birbirleriyle etkileşime girdiği ve birbirlerinin çalışmalarına dayandığı işbirlikçi bir ortam oluşturur.
Süreç, doğal bir araştırma ilerlemesini takip eder:
- Literatür İncelemesi: Doktora ajansı, arXiv API kullanarak akademik makaleleri tarar, ilgili araştırmaları toplar ve organize eder
- Plan Oluşturma: Doktora ve postdoc ajanları, ayrıntılı araştırma planları oluşturmak için işbirliği yapar
- Uygulama: ML Mühendis ajanları kod yazıp test eder
- Analiz ve Belgeleme: Takım, sonuçları yorumlamak ve kapsamlı raporlar oluşturmak için birlikte çalışır
Ama burası gerçekten pratik: Çerçeve, hesaplama esnekliğine sahiptir, yani araştırmacılar, hesaplama gücüne ve bütçe kısıtlamalarına bağlı olarak kaynakları tahsis edebilir. Bu, gerçek dünya araştırma ortamları için tasarlanmış bir araçtır.

Schmidgall et al.
İnsan Faktörü: AI ile Uzmanlık Nerede Buluşur
Ajan Laboratuvarı, etkileyici otomasyon yeteneklerine sahipken, gerçek sihir, “ko-pilot modu” olarak adlandırdıkları şeydedir. Bu kurulumda, araştırmacılar, sürecin her aşamasında geri bildirim sağlayabilir, insan uzmanlığı ve AI yardımı arasında gerçek bir işbirliği oluşturur.
Ko-pilot geri bildirimi verileri, bazı dikkat çekici içgörüler ortaya koyuyor. Otonom modda, Ajan Laboratuvarı tarafından oluşturulan makaleler, insan değerlendirmelerinde ortalama 3,8/10 puan aldı. Ancak araştırmacılar ko-pilot moduna geçtiğinde, bu puanlar 4,38/10’a yükseldi. Özellikle ilginç olan, bu iyileştirmelerin nerede ortaya çıktığı – makaleler, açıklık (+0,23) ve sunum (+0,33) açısından önemli ölçüde daha yüksek puanlar aldı.
Ama burası gerçeklik kontrolü: hatta insan katılımıyla birlikte, bu makaleler masih kabul edilen ortalama NeurIPS makalesinin (5,85) altında, yaklaşık 1,45 puan altında kaldı. Bu, bir başarısızlık değil, ancak AI ve insan uzmanlığının birbirini tamamlamak zorunda olduğu konusunda kritik bir öğrenmedir.
Değerlendirme, bir başka ilginç şeyi ortaya koydu: AI değerlendiricileri, insan değerlendiricilerine kıyasla makaleleri yaklaşık 2,3 puan daha yüksek puanladı. Bu fark, neden insan denetiminin araştırma değerlendirmesinde kritik önem taşıdığını vurguluyor.

Schmidgall et al.
Sayıların Ayrıştırılması
Araştırma ortamında gerçekten önemli olan nedir? Maliyet ve performans. Ajan Laboratuvarının model karşılaştırma yaklaşımı, bu konuda bazı sürpriz verimlilik kazanımları ortaya koyuyor.
GPT-4o, tüm iş akışını sadece 1.165,4 saniyede tamamlayarak hız şampiyonu çıktı – bu, o1-mini’den 3,2 kat ve o1-önizlemeden 5,3 kat daha hızlı. Ancak daha da önemli olan, her makale için yalnızca 2,33 $ maliyeti. Önceki otonom araştırma yöntemlerine kıyasla, bu, %84’lik bir maliyet azaltması anlamına geliyor.
Model performansına bakıldığında:
- o1-önizleme, fayda ve açıklık açısından en yüksek puanı aldı
- o1-mini, deneysel kalite puanlarında en iyi sonucu elde etti
- GPT-4o, metriklerde geri kaldı ancak maliyet verimliliği lideri oldu
Gerçek dünya uygulamaları burada önemli.
Araştırmacılar artık yaklaşımını özgü ihtiyaçlarına göre seçebilir:
- Hızlı prototip oluşturma gerekiyor mu? GPT-4o hız ve maliyet verimliliği sunuyor
- Deneysel kaliteye öncelik veriliyor mu? o1-mini en iyi seçim olabilir
- En çok işlenmiş çıktıya mı ihtiyaç var? o1-önizleme vaat ediyor
Bu esneklik, araştırma ekiplerinin çerçeveyi kaynaklarına ve gereksinimlerine uyarlamalarına olanak tanır, böylece tek boyutlu bir çözüme kilitlenmezler.
Araştırmada Yeni Bir Bölüm
Ajan Laboratuvarının yeteneklerini ve sonuçlarını inceledikten sonra, araştırma nasıl yürütüleceğinde önemli bir değişimle karşı karşıya olduğumu düşünüyorum. Ancak bu, thường olarak manşetlerde yer alan değiştirme anlatısı değil, daha nüanslı ve güçlü bir şey.
Ajan Laboratuvarının makaleleri henüz en iyi konferans standartlarına ulaşmasa da, araştırma hızlandırması için yeni bir paradigm oluşturuyor. Bunun, uyku bilmeyen AI araştırma asistanları ekibi gibi düşünün, her biri bilimsel sürecin farklı yönlerinde uzmanlaşmış.
Araştırmacılar için etkiler derin:
- Literatür incelemeleri ve temel kodlama için harcanan zaman, yaratıcı fikir üretimi için yönlendirilebilir
- Kaynak kısıtlamaları nedeniyle rafa kaldırılmış araştırma fikirleri uygulanabilir hale gelir
- Hipotezlerin hızla prototip oluşturulması ve test edilmesi, daha hızlı buluşlara yol açabilir
Mevcut sınırlamalar, AI ve insan değerlendirme puanları arasındaki fark gibi, fırsatlar. Bu sistemlerin her bir yinelemesi, insan ve AI arasındaki daha sofistike araştırma işbirliğine bizi daha da yaklaştırıyor.
İleriye bakıldığında, bilimsel keşfi yeniden şekillendirebilecek üç ana gelişme görüyorum:
- Daha sofistike insan-AI işbirliği kalıpları, araştırmacıların bu araçları etkili bir şekilde kullanmayı öğrenmesi ile ortaya çıkacak
- Maliyet ve zaman tasarrufu, araştırmayı daha küçük laboratuvarlar ve kurumlar için daha erişilebilir hale getirebilir, böylece daha iddialı projelerin peşinden gitmelerine olanak tanır
- Hızlı prototip oluşturma yetenekleri, araştırmada daha deneysel yaklaşımlara yol açabilir
Bu potansiyeli en üst düzeye çıkarmak için anahtar nedir? Ajan Laboratuvarı ve benzer çerçevelerin, otomasyon için değil, güçlendirme için araçlar olduğunu anlamak. Araştırmanın geleceği, insan uzmanlığı ve AI yetenekleri arasında seçim yapmak değil, bunları birbirini tamamlamak için yenilikçi yollar bulmak.












