Yapay Zeka

Bir Makaleyi Siz Okurken Yeniden Yazmak için Bir Makine Öğrenimi Sistemi

Yayınlanan Mayıs 11, 2021

Güncellenmiş 9 Aralık 2022

Martin Anderson

Kanada'da yapılan yeni bir araştırma, Tinder tarzı 'kaydırma' veya okuyucunun makalede yer alan çeşitli içeriklerle etkileşiminin pasif bir şekilde gözlemlenmesine dayalı olarak, bir makaleyi okurken otomatik olarak yeniden yazmayı sağlayan bir yöntem öneriyor.

Okurken Bileyin (HARE) başlıklı sistem, kâğıt Kanada, Ontario'daki Western University'den ilgili Python koduyla birlikte GitHub'da.

Projenin ana fikri, bir makalenin, başlıktan daha fazla ayrıntıya doğru gelişen (bunun gibi) çeşitli içerik türlerini içerebileceğidir. Bir makalenin sonraki bölümleri, haberin sonuçları hakkında farklı türde destekleyici materyal, kullanım durumları veya hipotezler veya varsayımlar içerebilir.

HARE'de, bu tür içeriklerden hoşlanmazsanız, sistem tercihlerinizi öğrenirken paragraf paragraf oy vererek reddedebilirsiniz. Böylece, aşağı kaydırdığınızda, "eksi oy verdiğiniz" içeriğe benzer içerikler kaldırılmış veya yeniden yazılmış olur. Sistemin eğitimine aktif olarak katılmak istemiyorsanız, HARE belgeyle olan pasif etkileşimlerinizi gözlemleyerek tercihlerinizi belirleyebilir.

Rahatsız Edici Cümleler İçin Tinder Tarzı Oylama

Aşağıdaki görselde, kullanıcının açık veya örtük davranışlarına bağlı olarak HARE için üç olası çıkarımsal kategorilendirme türü görüyoruz. İlk durumda (solda), kullanıcı, paragrafın veya cümlenin içeriğinde veya üslubunda, karmaşıklığında veya tonunda onay veya hoşnutsuzluk ifade eden Tinder tarzı bir oylama hareketiyle aktif olarak "sola (veya sağa) kaydırır".

Kaynak: https://arxiv.org/pdf/2105.02923.pdf

İkinci durumda (ortada), sistem, kaydırma duraklamasının konumu ve süresine bağlı olarak, kullanıcının ilgisinin bir ölçüsü olarak bekleme süresini kullanır.

Üçüncü durumda (sağda), HARE akıllı telefon kamerasını kullanarak izleyicinin bakışının görünür belgelerin paragrafları boyunca izlediği yolu ve kalma süresini tahmin ediyor.

Araştırmacılar, herhangi bir paragrafta kalma süresinin artmasının kullanıcı ilgisinin arttığını gösterebileceğini iddia ediyor, ancak mantıksal olarak bu, izleyicinin karmaşık veya kötü yazılmış olabilecek metni özümsemeye çalıştığı durum olmayabilir.

Kullanıcı geri bildirimi, makalenin henüz görülmemiş kısımlarını etkili bir şekilde düzenler, yeniden yazar veya tamamen siler.

İçeriğin Kullanıcı Tercihlerine Göre Ön İşleme Alınması

Makale, HARE'nin kullanıcı deneyimini makale bazında ele alıyor; ancak kullanıcının belgelerle geçmişteki etkileşiminin, içerik türlerinin sürekli olarak tanınması ve yeni makalelere şablonlanmış kullanıcı tercihlerinin uygulanmasıyla gelecekteki okuma deneyimlerinin özelleştirilmesine olanak sağladığı açık; böylece kullanıcı giderek daha az 'istenmeyen' içerik gördükçe etkileşim ihtiyacı azalıyor.

HARE, sayfanın aşağısındaki görünmeyen içeriğin kullanıcı gelmeden önce stil veya özet açısından yeniden yazılmasına izin veren bir özetleyici algoritma olarak karakterize edilir; ancak makale, içeriği kullanıcı geri bildirimlerine göre önleyici olarak kaldırabileceğini de açıkça ortaya koymaktadır.

Test amacıyla, sistem bir külliyat İngiltere'nin 11,222 makalesinden Daily Mail gazetesi ve Telegram sohbet uygulamasındaki bir test dağıtımı aracılığıyla değerlendirildi. On paragraftan az olan makaleler, deneme amacıyla elendi.

Telegram HARE uygulaması, kullanıcılarla test aşamasında.

Araştırmacıların metodolojisi şunları kullanır: K-Kümeleme anlamına gelir on SBERT makalelerdeki cümle yerleşimleri, başlangıçta ele alınan kavramlar için rastgele ağırlıklar.

Geniş bir algoritma ve yaklaşım grubu arasında HARE, üç karşılaştırma modeli içerir; bunlardan ilki (ORACLEGREEDY) önceki kullanıcı tercihlerine erişime sahiptir ve bu, algoritmanın makaleleri etkileşimli olarak değil, yükte ön işleme koyma niyetini gösterir.

Diğer modeller, ORACLESORTED ve ORACLEUNIFORM, sırasıyla ilgi düzeyine göre veya makale boyunca rastgele cümleler seçer.

İçerik Kaldırma ve Yeniden Yazma

Şaşırtıcı bir şekilde, ORACLEUNIFORM, önceki kullanıcı ilgi alanlarına erişimi olmamasına rağmen kontrol kümesinden daha iyi performans gösterdi. Araştırmacılar, bunun makalenin tamamını tek seferde ele alması ve 'sadece en ilginç cümleleri seçmesi' nedeniyle olduğunu iddia ediyorlar. Araştırmacılar, bunun mevcut içeriği yalnızca en önemli kavramla ilgili cümlelerle sınırlayabileceğini ve bu nedenle kavramın sonuçları veya değerlendirmesiyle ilgili olabilecek diğer metinleri mantıksal olarak ortadan kaldırabileceğini kabul ediyorlar.

HARE'de kullanılan çıkarımsal özetleyiciler LexRank, ToplamTemel, ve MetinSırası.

HARE, 13 deneme ve çeşitli algoritmik yaklaşımlar boyunca 70 gönüllü üzerinde test edildi ve denenen modele bağlı olarak tüketici sınıfı bir dizüstü bilgisayarda 1.3 milisaniye ile 100 ms arasında bir yerde özetleri (yeniden yazılmış/kesilmiş metin) güncelleyebildi. Sonuçlar, çoğu metni kaldıran modellerin iyi performans göstermediğini, bunun başlıca nedeninin kalan metnin tutarlılığını etkileyebileceğini buldu.

Dinamik Makale Yeniden Yazmanın Etik Etkileri

Araştırmacılar, bu tür teknolojilerle ilgili etik kaygıları kabul ediyor:

'HARE görevi, gelecekteki kullanıcı odaklı uygulamaların tasarımı için tasarlanmıştır. Tasarımları gereği, bu uygulamalar bir kullanıcının belirli bir makaleden ne okuduğunu kontrol etme yeteneğine sahiptir. Bu araçların, yeterli özen gösterilmeden kullanıldığında, otomatik haber akışları, arama sonuçları ve çevrimiçi toplulukların zaten ürettiği "yankı odası" etkisini daha da kötüleştirmesi mümkündür.'

Bununla birlikte, böyle bir sistemin, makalede başlangıçta mevcut olmayabilecek alternatif bakış açılarını öneren metinler ekleyerek yankı odası etkisini azaltmak için gelecekteki uygulamalarda kullanılabileceğini de belirtiyorlar. Şu gözlemde bulunuyorlar: 'Bu faktörün ağırlığı, hem ilgi çekici bir okuma deneyimi hem de çeşitli fikirlere maruz kalma sağlayacak şekilde ayarlanabilir.'

Araştırmacılara göre böyle bir sistemden yararlanabilecek olanlar, bilgi alırken zamandan tasarruf etmek isteyen okuyucular ve içerik yayıncılarıdır.

Martin Anderson

Makine öğrenimi yazarı, insan görüntü sentezi alanında uzman. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel sitesi: martinanderson.ai
İletişim [e-posta korumalı]
Twitter: @manders_ai