Anderson’un Açısı
Yapay Zeka Web Aramalarını Üç Farklı Gerçekliğe Ayırıyor

Yeni bir araştırma, Google’un kendi arama imparatorluğu içinde üç farklı bilgi sistemi kullandığını, düzenli Arama, AI Özetleri ve Gemini’nin farklı kaynakları, sıralamaları ve içerikleri tercih ettiğini buldu.
Redüksiyonizm hüküm sürüyor. Son on iki ayda, ‘Bunu Google’a sorayım’ mim ‘Google aramasını özetleyeyim’ trendine yerini bıraktı, burada AI özetleri arama sonuçlarında okuyucuları arama bağlantılarına tıklamaktan kurtarır (arguably kaynak siteleri fonlamayı azaltır), tüm arama sonuçlarını birkaç üretilen paragrafa kondensererek.
Birisi, ortaya çıkan temel bilginin ve bu bilgiyi elde etmek için kullanılan sitelerin, üç popüler arama yönteminde – geleneksel web araması, AI özetleri (AIO’lar) ve LLM’ler gibi artan kullanım ile web-orakl olarak – tương đối benzer olacağını düşünebilir.
Ancak, ABD’den yapılan recent bir araştırma, bunun aslında çok uzak olduğunu gösteriyor ve hatta Google’un kendi üçlüsü – SERPS*, AI özetleri ve Gemini LLM serisi ile doğrudan etkileşim – arasında bile önemli ve ilginç discrepanklar olduğunu ortaya koyuyor.
Üç Yönlü Bölünme
Yeni Jersey Teknoloji Enstitüsü’nden altı araştırmacı, yeni bir makalede, How Generative AI Disrupts Search: An Empirical Study of Google Search, Gemini, and AI Overviews, üç arama yönteminin nasıl farklılaştığını ve bu kırılmaların olası nedenlerini ortaya koyuyor.
Makale şöyle diyor:
‘[İlk olarak,] temsilci, gerçek kullanıcı sorgularının %51,5’inde AIO’ların üretildiğini ve organik arama sonuçlarının üzerinde görüntülendiğini bulduk. Tartışmalı sorular sık sık bir AIO’ya neden oluyor.
‘İkincisi, her bir arama motoru için geri getirilen kaynakların önemli ölçüde farklı olduğunu gösteriyoruz (<0.2 ortalama Jaccard benzerliği). Geleneksel Google araması, hükümet veya eğitim gibi popüler veya kurumsal web sitelerinden bilgi alma olasılığı daha yüksekken, üretken arama motorları Google’a ait içeriği alma olasılığı daha yüksek.
‘Üçüncüsü, Google’ın AI web tarama botunu engelleyen web sitelerinin, içeriğe erişimi olmasına rağmen, AIO’larda geri getirilme olasılıklarının önemli ölçüde daha düşük olduğunu gözlemliyoruz.’
Makale, fascinir bir fikir yelpazesidir, bu nedenle lineer ve yöntemsel bir iş akışına uymak yerine, bu ve diğer bazı sürpriz ve aydınlatıcı bulgulara daha yakından bakacağız.
Eski ‘İki-Bir’
Çalışmanın ilginç bulgularından biri, Google’ın AI özetlerinin ani gelişen haber olayları için bastırıldığını gösteriyor, çünkü en erken ve en mevcut kaynaklar en doğru olmayabilir.
Bu sistem her zaman çalışmıyor: Araştırmacılar tarafından not edilen aşağıdaki örnekte, bir Google AI özeti, bir boks maçının sonucunu yanlış boksöre atfetmiştir, çünkü yalnızca bu (yanlış) sonucu bildiren kaynak, Facebook’ta bir mizah dergisiydi:

Google’ın AI özetleri zaman kritik özetleri tránh ediyor, çünkü erken bilgi eksik veya tamamen yanlış olabilir. Bu durumda, boksör Jake Paul aslında maçı kaybetti. Kaynak
Araştırmacılar, AIO’ların genellikle bir olay en az beş gün eski olduğunda ortaya çıktığını, bu nedenle bu durumun bir anomali olduğunu, ancak yine de kolayca ortaya çıkarılabileceğini belirtiyorlar.
AIO’lar, sorgunun soru işaretiyle kapandığında daha olasıydı ve query intent bir AIO’nun sunulup sunulmayacağına etki ediyordu:

Araştırmacıların testlerindeki olayların yüzdesi, bir AI arama özeti üretildi. Burada ‘bilgilendirici’ doğrudan soruları gösterir, bunlar diğer tür etkileşimlerden daha fazla AIO üretir.
Araştırmaya göre, uzun sorgular da bir AI özeti üretme olasılığı daha yüksek.
Bir Bölünmüş Krallık
Yeni çalışmanın belki de en şaşırtıcı sonucu, Google’un (aforementioned) üç arama platformunun sonuç kalitesi/tipinde göreceli olarak küçük bir örtüşme göstermesidir.
Çalışma, düzenli Google Araması, AI özetleri ve Gemini (LLM) aynı sorgu için çarpıcı şekilde farklı kaynaklar geri getiriyor, örtüşme puanları, bir şirket içinde üç rekabetçi geri getirme mantığı olduğunu ima ediyor, oysa kullanıcılar, Google’un bir otoriter dizini ve bir sıralama felsefesi olduğunu varsayarlar:

Google’ın kendi ekosisteminde bile, geleneksel Arama, AI Özetleri ve Gemini arasındaki örtüşme şaşırtıcı şekilde küçüktü, aynı sorgu genellikle her bir Google sistemi tarafından işlendiğinde önemli ölçüde farklı kaynak listeleri üretiyordu. Bu karşılaştırmada, binlerce arama sorgusu boyunca, alışveriş ve tartışma konularından yerel aramalara ve genel bilgi sorularına kadar, üç sistem arasındaki kaynak seçimi arasındaki benzerliği görüyoruz, daha düşük puanlar kaynaklar arasındaki anlaşmazlığı gösteriyor.
Araştırmacılar, bu analiz bölümü hakkında şunları söylüyor:
‘[Yukarıdaki tablo] her bir sorgu için AIO, Gemini ve geleneksel SERP tarafından geri getirilen kaynak listelerinin ortalama benzerliğini sunuyor.
‘Ana sonuç, herhangi bir sorgu alt kümesi ve hangi arama motoru çiftinin karşılaştırıldığına bakılmaksızın, geri getirilen listelerin benzer olmadığıdır, tümünün Google tarafından geliştirilmiş olmasına rağmen.’
Araştırmacılar, hiçbir arama yönteminin rank-biased overlap (RBO) puanının 0,27’nin üzerinde olmadığını, bu düşük bir puan olduğunu belirtiyorlar. Ayrıca, Amazon Perakende ve yerel sorguların (yani, ‘yakınımdaki mağazalar’) arama yöntemleri arasındaki benzerliğin en düşük olduğunu belirtiyorlar.
Bu düşük anlaşmazlığı, ‘arama motorları arasındaki tutarsızlık’ olarak açıklıyorlar ve bu tutarsızlığın rastgelelik veya başka bir açık faktörle açıklanamayacağını belirtiyorlar.
Bir açıklama, argüman olarak, eğitim veri noktalarının sıralamasının, Google’ın son yirmi yıl içinde geliştirdiği PageRank ve ardılları için kullanılan yöntemlerden çok farklı bir şekilde atanması olabilir. Ayrıca, Google Araması algoritmasının gizli bir gündemi varsa, bu tür bir müdahale veya ‘oyun’, özellikle de difüzyon tabanlı AI’lar gibi Gemini’de (filtreleme, sistem promtları ve ticari modellere uygulanan diğer korunma yöntemleri yoluyla) tutarlı bir şekilde uygulanması çok daha zordur.
Kendin Yap..?
Belirli web siteleri veya web sitesi kategorileri, AI özetlerinin ortaya çıkması ve LLM tabanlı aramanın geleneksel arama alanına girmesiyle etkilenmiş görünüyor – hem olumsuz hem de olumlu şekilde, durumun göreği:

Geleneksel Google Aramasına kıyasla, AI Özetleri ve Gemini, birçok büyük web sitesinden alıntıları azaltırken, bazı domainlerin görünürlüğünü artırdı. YouTube, her iki sistemde de en büyük faydalanıcılar arasındaydı, जबकi Reddit, Vikipedi, Facebook ve birçok kurumsal kaynak AI tarafından üretilen geri getirme daha az sıklıkla ortaya çıktı.
Araştırmacılar, testler sırasında bazı beklenmedik tercihlerin ortaya çıktığını belirtiyorlar:
‘Üstteki grafiklerden üç ana sonuç çıkardık. Birincisi, büyük ve bilinen web siteleri en çok etkilenenler (hem olumlu hem de olumsuz). Bu, büyük web sitelerinin birçok farklı sorgu için ilgili içerikte çeşitlilik ve üne sahip olmaları nedeniyle doğaldır.
‘İkincisi, bu web sitelerinin çoğunluğu, üretken arama motorlarında (kırmızı çubuklar ve yukarıdaki grafiklerdeki negatif numaralarla gösterilir) genel ve ilk üç alıntı sayısını azalttı. Bu, üretken aramanın geleneksel arama motorlarına kıyasla daha niş kaynaklardan bilgi aldığını gösteriyor.
‘Üçüncüsü, Google’ın AIO’ları Google web sitelerini (örneğin, google.com ve youtube.com alan adlarını) tercih ediyor.
‘Gemini de YouTube’ü geleneksel Google Aramasına kıyasla tercih ediyor, ancak mutlak fark daha küçüktür.’
Herhangi Bir ‘Engeller’..?
Çalışma, yayıncıların Google’ın AI web tarama botunu engellediğini buldu – web sitelerinden veri çeken otomatik web-bot, robots.txt dosyasıyla engellenmediği sürece.
Bu, açık bir şekilde kendi kendine verilen bir yara gibi görünse de, aslında Google kamuya açık bir şekilde AI özetlerinde içeriğin görünmeyeceğini belirtmedi, ancak yayıncıların veri toplama, koleksiyon oluşturma ve AI eğitimi için veri kullanmayacağını belirtti.
Ancak, bu yeni çalışmanın araştırmacıları, popüler AI’yı engelleyen yayıncıların Gemini tarafından çok az alıntı yapıldığını, hatta hiçbir alıntı yapılmadığını buldu. ‘Etkili olarak engellenen’ yayıncılar, NYTimes, CNN, BBC, ScienceDirect, Reuters, Wiley, Nature, ESPN, Business Insider, CNBC, NPR, WIRED, USA Today, NBC News, Genius, National Geographic, The Conversation, U.S. News & World Report, Scientific American, Consumer Reports ve STAT olarak listelendi.

Yukarıda listelenen yayıncılar tarafından yapılan bazı robots.txt AI tarama yasakları. Ancak bu, Google tarafından daha geniş bir yaptırıma neden oldu mu?
Araştırmacılar şöyle diyor:
‘Analizlerimizde en çok etkilenen alanlarda, 21 popüler yayıncının (her iki Google Araması ve AIO’larda en az 20 benzersiz sorgu için geri getirilen) Gemini tarafından hiç alıntı yapılmadığını bulduk.
‘Ayrıca, Facebook, Instagram, Tiktok gibi bazı popüler sosyal medya ve IMDb, Yelp, Tripadvisor gibi inceleme web siteleri de Gemini’den hiçbir alıntı almadı. Daha fazla incelediğimizde, bu web sitelerinin tümünün Google-Extended botunu robots.txt dosyalarında engellediğini bulduk.’
Eğer bu bulgu başka yerde doğrulanırsa ve sürekli olursa, bu şirketlerin Google’ın AI operasyonlarına uyum sağlamak ve işbirliği yapmak için kısmi listeden çıkarma yoluyla baskıya maruz kaldıklarını varsayabiliriz. İlk bakışta, sonuçlar cezai gibi görünüyor, ancak bu çalışmanın bulguları daha çok kargaşa niż kasten yapılmış gibi görünüyor; bu nedenle, yalnızca bu sonuçların ‘kinaye’ gibi göründüğünü söyleyebiliriz, neyin gerçekten neden olduğunu bilemeyiz.
SONUÇ
Görüş Bu, bir zip-bomb gibi bir makale, yalnızca on sayfası, birçok ilginç bulguyla birlikte açılıyor. Bu nedenle, yalnızca küçük bir bölümünü kapsayabildiğimiz için, kaynağı tüm okuyuculara, hatta casual okuyuculara bile öneriyoruz.
Bir ‘sarı’ tutum, yazarların keşiflerine birçok olumsuz yorum getirebilir, ancak bu çalışma, küresel bir teknoloji liderinin AI tabanlı aramada küresel bir liderlik elde etmeye ve korumaya çalışmasını, çok farklı koşullarda ve dönemlerde geliştirilen yüksek karşıtlıklı platformlar kullanarak, en iyi şekilde açıklıyor.
Üç arama yöntemi inceleniyor, ancak gerçek tartışma, geleneksel arama motoru sonuçları ile AI tabanlı seçim yöntemleri arasındaki rekabettir.
Yapay Zeka 1999 Gibi
Google’ın ortaya çıkmasından önce, arama sonuçlarını sadece hacimle ‘oyun oynayarak’ ön sayfa SERPS yerleştirme mogelijkiydi ve bu şekilde, minimum (sık sık otomatik) çabayla ön sayfa yerleştirme mogelijkiydi. Bu ‘sayı oyunu’ 2002 yılında Google’ın daha sofistike ve gizli arama sıralama algoritması tarafından sona erdirildi. Ancak, yüksek hacimli ve düşük kaliteli içerik hiçbir zaman anlamlı bir şekilde ortadan kalkmadı.
Dolayısıyla, Common Crawl gibi hyperscale koleksiyonlar modern AI devriminin temellerini attığında, veri baskınlığı, otomatik süreçlerin gelen veri kalitesini filtreleme ve sıralama yeteneğine bağlı olarak ve (daha az olası olarak) bu verileri sıralamak için para ödeyebilecek insanların varlığına bağlı olarak belirlenecekti.
Bu büyük ve seçilmeyen koleksiyonlarda çok kötü veya düşük kaliteli veri vardı; bu veriler, internet araması sonuçları gibi 1999-2001 yılları arasında self-serving ve hacimli olabilirdi, ancak kolayca filtrelenemeyen şeyler içeriyorlardı.
Çünkü bu veri induksiyon süreçleri hala mükemmel değil, Google’ın AI’ı iş gibi davranması çok zor, çünkü Gemini’nin PageRank tarzı kararları Google’ın politika mühendisleri tarafından değil, AI modelinin eğitimi sırasında hyperscale verilerin nasıl dönüştüğüne dair eksik bir anlayış tarafından belirleniyor.
* Arama Motoru Sonuç Sayfaları.
† Yazarların vurgusu, benim değil. Ancak, alıntılarda italik vurguyu kalın yazıya çevirdim, çünkü italik vurgu alıntılarda iyi çalışmıyor.
İlk olarak Çarşamba, 13 Mayıs 2026’da yayımlandı












