Connect with us

Makine Öğrenimi Sistemi ile Bir Makaleyi Okurken Yeniden Yazma

Yapay Zekâ

Makine Öğrenimi Sistemi ile Bir Makaleyi Okurken Yeniden Yazma

mm

Kanada’dan yapılan yeni bir araştırmada, bir makaleyi okurken, Tinder tarzı ‘swipe’ veya okuyucunun makaledeki çeşitli içeriklerle etkileşimini pasif olarak gözlemleme yoluyla otomatik olarak yeniden yazma yöntemi önerilmektedir.

Sistem, Hone As You Read (HARE) olarak adlandırılmaktadır ve Batı Ontario Üniversitesi’nden bir makale ile sunulmaktadır ve ilgili Python kodu GitHub‘da bulunabilir.

Projenin merkezi fikri, bir makalenin çeşitli içerik türlerini içerebileceği, başlıktan itibaren daha ayrıntılı bilgilere doğru ilerleyebileceği yönündedir. Makalenin daha sonraki kısımları, farklı türde destekleyici materyal, kullanım örnekleri, hipotezler veya haberin sonuçları hakkında varsayımlar içerebilir.

HARE altında, bu tür materyali beğenmezseniz, paragraf paragraf olarak oy kullanarak sistem sizin tercihlerinizi öğrenecek şekilde diseñlanmıştır, böylece aşağıya kaydırırken, ‘downvoted’ ettiğiniz materyale benzer içerik zaten kaldırılmış veya yeniden yazılmış olacaktır. Sistem, sizin aktif olarak katılmanız durumunda, belgedeki pasif etkileşimlerinizi gözlemleyerek sizin tercihlerinizi öğrenebilir.

Tinder Tarzı Oy Verme Hoş Olmayan Cümleler İçin

Aşağıdaki resimde, HARE için üç olası türde çıkarımlı kategorizasyon görülmektedir, bunlar kullanıcıların açık veya gizli davranışlarına dayanmaktadır. İlk durumda (solda), kullanıcı aktif olarak ‘swipe left’ (veya right) yapar, bir Tinder tarzı oy verme jesti ile paragraf veya cümlenin içeriği, stili, karmaşıklığı veya tonu hakkında onay veya hoşnutsuzluk ifade eder.

Source: https://arxiv.org/pdf/2105.02923.pdf

Source: https://arxiv.org/pdf/2105.02923.pdf

İkinci durumda (ortada), sistem kullanıcı ilgisini ölçmek için dwell-time metricini kullanır, bu da kaydırma duraklatma pozisyonu ve süresine dayanır.

Üçüncü durumda (sağda), HARE akıllı telefon kamerasını kullanarak görüntülenen belgenin paragrafları boyunca gaze konumunun yolunu ve dwell-time’ı tahmin eder.

Araştırmacılar, herhangi bir paragraf上的 artan dwell zamanının kullanıcı ilgisini gösterebileceğini iddia etmektedirler, mantıksal olarak bu, okuyucunun karmaşık veya sadece kötü yazılmış metni anlamaya çalıştığı durumlarda geçerli olmayabilir.

Kullanıcı geri bildirimi etkili bir şekilde düzenler, yeniden yazar veya henüz görülmemiş makale kısımlarını tamamen siler.

Kullanıcı geri bildirimi etkili bir şekilde düzenler, yeniden yazar veya henüz görülmemiş makale kısımlarını tamamen siler.

Kullanıcı Tercihlerine Göre İçeriği Ön İşleme

Makale, HARE’nin kullanıcı deneyimi ile ilgili olarak bir makale bazında ele alınmaktadır, ancak açıkça kullanıcıların belgelerle historical etkileşimi, gelecekteki okuma deneyimlerini özelleştirmeye izin vermektedir, böylece tutarlı bir şekilde içerik türlerini tanıyarak ve şablonlu kullanıcı tercihlerini yeni makalelere uygulayarak, kullanıcıların gördüğü ‘istenmeyen’ içeriğin azaltılması sağlanmaktadır.

HARE, bir özetleme algoritması olarak karakterize edilmektedir, bu da görülmeyen içeriğin, stil veya concision açısından yeniden yazılmasına izin vermektedir, ancak makale, bunun aynı zamanda kullanıcı geri bildirimi temelinde içeriği önceden kaldırabileceğini de belirtmektedir.

Test amaçları için, sistem UK’nin Daily Mail gazetesinin 11,222 makalesinden oluşan bir corpus kullanmıştır ve Telegram sohbet uygulamasında test edilmiştir. On paragrafdan az olan makaleler deneme amaçları için atılmıştır.

Telegram HARE uygulaması, kullanıcılarla test aşamasında.

Telegram HARE uygulaması, kullanıcılarla test aşamasında.

Araştırmacıların metodolojisi, makalelerdeki K-Means clustering kullanmaktadır, bu da SBERT cümle gömme işlemlerine dayanmaktadır, başlangıçta kavramlar için rastgele ağırlıklar atanmaktadır.

Geniş bir algoritma ve yaklaşım grubu arasında, HARE üç karşılaştırma modeli sunmaktadır, ilki (ORACLEGREEDY) önceden kullanıcı tercihlerine erişimi olan bir modeldir, bu da algoritmanın makaleleri yüklerken önceden işleyebileceği anlamına gelmektedir.

Diğer modeller (ORACLESORTED ve ORACLEUNIFORM), cümleleri ilgi düzeyine veya makale boyunca rastgele olarak seçmektedir.

İçerik Kaldırma ve Yeniden Yazma

Şaşırtıcı bir şekilde, ORACLEUNIFORM kontrol setinden daha iyi performans göstermiştir, bu da önceden kullanıcı ilgilerine erişimi olmadığını göstermektedir. Araştırmacılar, bunun nedeni tüm makaleyi bir defada ele alması ve ‘sadece en ilginç cümleleri’ seçmesidir. Araştırmacılar, bu durumun yalnızca en önemli kavramla ilgili cümlelerle ilgilenen diğer metinleri mantıksal olarak kaldırabileceğini kabul etmektedirler.

HARE’de kullanılan extractive summarizers, LexRank, SumBasic ve TextRank‘dir.

HARE, 13 gönüllü üzerinde 70 deneme boyunca ve çeşitli algoritmik yaklaşımlarla test edilmiştir ve 1.3 milisaniye ile 100ms arasında bir tüketici sınıfı dizüstü bilgisayarda, denenen modele bağlı olarak, özetleri (yeniden yazılmış/silinmiş metin) güncelleyebilmiştir. Sonuçlar, en çok metin kaldıran modellerin iyi performans göstermediğini göstermiştir, çünkü bu kalan metnin tutarlılığını etkileyebilir.

Dinamik Makale Yeniden Yazmanın Etik Sonuçları

Araştırmacılar, bu tür teknolojiler etrafındaki etik endişeleri kabul etmektedir:

‘HARE görevi, gelecekteki kullanıcı odaklı uygulamaların tasarımına yöneliktir. Tasarım tarafından, bu uygulamalar bir makaledeki belirli bir içeriği kontrol etme yeteneğine sahiptir. Yeterli özen gösterilmeden dağıtıldığında, bu araçlar zaten otomatik haber beslemeleri, arama sonuçları ve çevrimiçi topluluklar tarafından üretilen “echochamber” etkisini artırabilir.’

Ancak, aynı zamanda böyle bir sistemin gelecekteki uygulamalarda echochamber etkisini hafifletmek için alternatif görüşleri sunmak için kullanılabileceğini not etmektedirler. Gözlemlerine göre: ‘Bu faktörün ağırlığı, hem bir okuma deneyimi hem de fikir çeşitliliği sunmak için ayarlanabilir.’

Bu sistemden yararlanabilecek olanlar, araştırmacılara göre, bilgi alma süresini kısaltmak isteyen okuyucular ve içerik yayıncılarıdır.

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]