Bizimle iletişime geçin

Yapay Zeka

Duygu Analizinde Twitch İfadelerini Anlamak

mm

Halkın artan kullanım sosyal medya platformlarında iletişim kurmanın emojiler, emoticonlar, ifadeler, memler, GIF'ler ve diğer sözlü olmayan yollarının kullanımı, son yıllarda veri bilimcilerin küresel sosyolojik manzarayı anlama çabalarını giderek daha fazla şaşırttı; en azından, dünya çapındaki sosyolojik eğilimlerin kamusal söylemden ayırt edilebildiği ölçüde.

Doğal Dil İşleme (NLP) son on yılda duygu analizinde güçlü bir araç haline gelmiş olsa da, sektör sadece yeni gelişmelere ayak uydurmakta zorluk çekmiyor. sürekli gelişen sözlük birden çok dilde argo ve dilbilimsel kısayolların yanı sıra anlamını deşifre etmeye çalışırken görüntü tabanlı Facebook ve Twitter gibi sosyal medya platformlarında paylaşımlar.

Yana sınırlı sayı Bu tür araştırmalar için gerçekten hiper ölçekli tek kaynak, oldukça kalabalık sosyal medya platformları olduğundan, yapay zeka sektörünün en azından bu hızla ilerlemeye çalışması şarttır.

Temmuz ayında, Tayvan'dan bir gazete, Yeni yöntem Sosyal medya paylaşımlarına gönderilen "tepki GIF'leri"ne (aşağıdaki görsele bakın) dayanarak kullanıcı duygularını kategorize etmek ve bir gönderiye gelen tepkileri tahmin etmenin bir yolunu geliştirmek için 30,000 tweet'ten oluşan bir veritabanı kullandık. Makale, görsel tabanlı yanıtların alaycılık içerme olasılıkları daha düşük olduğundan, birçok yönden ölçülmesinin daha kolay olduğunu buldu. kayda değer meydan okuma duygu analizinde.

Tayvanlı araştırmacılar, 2021 tarihli bir makalede, animasyonlu tepki GIF'lerinin duygu durumunun 'indirgeyici göstergeleri' olarak kullanımını incelediler.

Bu yılın başlarında, Boston Üniversitesi tarafından yürütülen bir araştırma çalışması eğitimli makine öğrenimi modelleri Twitter'da viral olma olasılığı yüksek resimli memleri tahmin etmek için; ve Ağustos ayında, İngiliz araştırmacılar emojilerin büyümesini ifade simgeleriyle karşılaştırarak incelediler (bir fark) sosyal medyada, resimsel Twitter duyarlılığının büyük ölçekli 7 dilli bir veri kümesini derliyor.

Twitch İfadeleri

Artık ABD'li araştırmacılar, sürekli gelişen sözde sözlüğü daha iyi anlamak, kategorilere ayırmak ve ölçmek için bir makine öğrenimi metodolojisi geliştirdiler. emotes son derece popüler Twitch ağında.

Duygular, Twitch'te duygu, ruh hali veya esprileri ifade etmek için kullanılan yeni sözcüklerdir. Tanımları gereği yeni ifadeler olduklarından, bir makine öğrenimi sisteminin karşılaştığı zorluk, yeni duygu ifadelerini (sadece bir kez kullanılabilen veya aksi takdirde hızla kullanımdan kalkabilen) sonsuza dek kataloglamak değil, onları sonsuza dek üreten çerçeveyi daha iyi anlamak ve bir duygu ifadesini, duygusal/politik sıcaklığının tamamen bağlamdan ölçülmesi gerekebilecek "geçici olarak geçerli" bir kelime veya bileşik ifade olarak tanıyabilen sistemler geliştirmektir.

Anlamı belirsiz eklerle değiştirilebilen 'FeelsGoodMan' ifadesinin komşuları. Kaynak: https://arxiv.org/pdf/2108.08411.pdf

Anlamı belirsiz eklerle değiştirilebilen 'FeelsGoodMan' ifadesinin komşuları. Kaynak: https://arxiv.org/pdf/2108.08411.pdf

The kâğıt başlıklı FeelsGoodMan: Twitch Neolojizmlerinin Çıkarımsal Semantiği, ve San Francisco'daki bir sosyal medya analiz şirketi olan Spiketrap'teki üç araştırmacıdan geliyor.

Yem ve Anahtar

Yeniliklerine ve genellikle kısa ömürlü olmalarına rağmen, Twitch ifadeleri sıklıkla kültürel materyalleri (eski ifadeler dahil) duyarlılık analizi çerçevelerini yanlış yöne yönlendirebilecek şekilde geri dönüştürür. Bir emote geliştikçe anlamındaki değişimin izini sürmek, orijinal duygu veya niyetinin tamamen tersine çevrildiğini veya olumsuzlandığını bile ortaya çıkarabilir.

Örneğin, araştırmacılar, orijinal alternatif sağın yanlış kullanım isimsiz Iyi Adam Hissediyor Kurbağa Pepe memi, Twitch'teki kullanımı bağlamında orijinal politik lezzetini neredeyse tamamen kaybetti.

İfadenin, sanatçı Matt Furie'nin 2005 çizgi romanından bir karikatür kurbağa görüntüsüyle birlikte kullanılması, aşırı sağcı bir meme oldu 2010'larda. Vox'a rağmen yazdı 2017'de sağın bu memeyi sahiplenmesinin Furie'nin kendi kendine itiraf ettiği gibi hayatta kaldığı disassociation böyle bir kullanımla, yeni makalenin arkasındaki San Francisco araştırmacıları aksini buldular*:

Furie'nin karikatür kurbağası, 4'ların başında 2010chan gibi çeşitli çevrimiçi forumlarda sağcı posterler tarafından benimsendi. O zamandan beri Furie, karakterinin anlamını geri kazanmak için kampanya yürüttü ve emote, daha ana akımda bir artış gördü. nefret dışı kullanım ve Twitch'te olumlu kullanım. Twitch'teki sonuçlarımız da bunu doğruluyor ve "FeelsGoodMan" ve karşılığı olan "FeelsBadMan" ifadelerinin çoğunlukla gerçek anlamda kullanıldığını gösteriyor.

Aşağı akışta sorun

Bir memin genelleştirilmiş "özellikleri" hakkında bu tür bir "yem ve değiştirme", onu zaten "nefret dolu", "sağcı" veya "milliyetçi [ABD]" olarak kategorize etmiş ve bu bilgileri uzun vadeli açık kaynaklı depolara aktarmış olan NLP araştırma projelerini engelleyebilir. Daha sonraki NLP projeleri, eski verilerin güncelliğini denetlemeyi tercih etmeyebilir; bunu yapmak için pratik bir mekanizmaya sahip olmayabilir; hatta bu ihtiyacın farkında bile olmayabilirler.

Bunun sonucu olarak, bir "politik kategorizasyon" algoritması formüle etmek için 2017 Twitch tabanlı veri kümelerinin kullanılması, Iyi Adam Hissediyor ifade. Twitch olabilir veya olmayabilir alternatif sağ etkileyicilerle doluAncak yeni makalenin araştırmacılarına göre bunu kurbağayla kanıtlayamazsınız.

'Pepe' memesinin politik önemi, Twitch'in 140 milyon kullanıcısı (ki bunların %41'i) tarafından önemsenmemiş gibi görünüyor. 24 yaşın altında), eseri orijinal hırsızlardan etkili bir şekilde yeniden çalan ve herhangi bir özel gündem olmaksızın kendi renklerine boyayanlar.

Yöntem ve Veriler

Araştırmacılar, bir sonuca varılmasına rağmen etiketli Twitch ifade verilerinin 'neredeyse hiç' olmadığını buldular. önceki çalışma olduğunu toplam sekiz milyon ifadeve önceki araştırmacılar tarafından seçilen haftada Twitch çıktısının tek haftasında 400,000 kişi vardı.

A 2017 çalışmada Twitch'te ifade tahminini ele almak, kendisini yalnızca en iyi 30 Twitch ifadesini tahmin etmekle sınırladı ve ifade tahmini için yalnızca 0.39 puan aldı.

Bu açığı kapatmak için San Francisco'lu araştırmacılar, eski verilere yeni bir yaklaşım benimseyerek verileri eğitim ve test arasında 80/20 oranında böldüler ve daha önce Twitch verilerini incelemek için kullanılmamış 'geleneksel' makine öğrenimi yöntemlerini uyguladılar. Bu yöntemler şunları içeriyordu: Naif bayanlar (not), Rastgele Orman (RF), Destek Vektör Makinesi (doğrusal çekirdekli SVM) ve Lojistik regresyon.

Bu yaklaşım, önceki Twitch duygu temel çizgilerini %63.8 oranında geride bıraktı ve araştırmacıların daha sonra yeni sözcükleri belirleyebilen ve mevcut modelleri bu yeni tanımlarla 'zenginleştirebilen' LOOVE (Kelimelerden Duygu Öğrenme) çerçevesini geliştirmelerine olanak sağladı.

Araştırmacılar tarafından geliştirilen LOOVE (Kelime Duygularını Öğrenmek) çerçevesinin mimarisi.

Araştırmacılar tarafından geliştirilen LOOVE (Kelime Duygularını Öğrenmek) çerçevesinin mimarisi.

LOOVE, kelime yerleştirmelerin denetimsiz eğitimini kolaylaştırır ve ayrıca, görevin ölçeği ve ifadelerin hızlı gelişimi göz önüne alındığında lojistik olarak pratik olmayacak olan etiketli veri kümelerine olan ihtiyacı ortadan kaldırarak periyodik yeniden eğitim ve ince ayar içerir.

Proje hizmetinde, araştırmacılar eğitilmiş Etiketlenmemiş bir Twitch veri kümesi üzerinde 'Sahte Sözlük' adlı bir ifade, bu süreçte 444,714 adet kelime, ifade, emoji ve ifade simgesinin yerleştirilmesini sağlıyor.

Ayrıca, bir VADER sözlüğü bir ile emoji/ifade sözlüğüve yukarıda bahsedilen EC veri setine ek olarak, kamuya açık diğer üç veri setinden de yararlandı. üçlü Twitter, Rotten Tomatoes ve örneklenmiş bir YELP veri kümesinden duygu sınıflandırması.

Çalışmada kullanılan çok çeşitli metodolojiler ve veri kümeleri göz önüne alındığında, sonuçlar değişkendir, ancak araştırmacılar en iyi durum temellerinin en yakın önceki ölçümden 7.36 puan daha iyi performans gösterdiğini iddia etmektedir.

Araştırmacılar, projenin devam eden değerinin, 2 milyondan fazla Twitch sohbet mesajı üzerinde eğitilmiş kelimeden vektöre (W313V) yerleştirmelere dayalı LOOVE'un geliştirilmesi olduğunu düşünüyor. K-En Yakın Komşu (KNN).

Yazarlar şu sonuca varıyor:

'Çerçevenin arkasındaki itici özelliklerden biri, bilinmeyen ifadeler için duygu türetmek üzere kullanılabilen bir duygu sözlüğüdür. Bu duygu sözlüğünü kullanarak 22,507 ifade için bir duygu tablosu oluşturduk. Bu, bu ölçekte duygu anlayışının ilk örneğidir.'

 

* Satır içi alıntıları köprülere dönüştürmem.