Trí tuệ nhân tạo

Các GIF Phản ứng Cung cấp một Chìa khóa Mới cho Nhận dạng Cảm xúc trong NLP

Published May 24, 2021

Updated April 28, 2026

Martin Anderson

Một nghiên cứu mới từ Đài Loan đang cung cấp một phương pháp mới cho Xử lý Ngôn ngữ Tự nhiên (NLP) để thực hiện phân tích cảm xúc trên các diễn đàn truyền thông xã hội và tập dữ liệu nghiên cứu ngôn ngữ – bằng cách phân loại và gắn nhãn các GIF động được đăng tải để phản ứng với các thông báo văn bản.

Các nhà nghiên cứu, dẫn đầu bởi Boaz Shmueli của Đại học Quốc gia Tsing Hua tại Đài Loan, đã sử dụng cơ sở dữ liệu tích hợp của Twitter về các GIF phản ứng như một chỉ số để lượng hóa trạng thái cảm xúc của phản hồi của người dùng, loại bỏ nhu cầu phải đàm phán các phản hồi ngôn ngữ đa dạng, thử thách của việc phát hiện sự讽刺, hoặc xác định nhiệt độ cảm xúc cốt lõi từ các phản hồi mơ hồ hoặc quá ngắn.

Nhấp vào nút 'GIF' khi soạn một bài đăng Twitter cung cấp một tập hợp tiêu chuẩn của các GIF động được gắn nhãn, dễ dàng hơn cho NLP để diễn giải hơn là việc sử dụng ngôn ngữ văn bản plain-text.

Nhấp vào nút ‘GIF’ khi soạn một bài đăng Twitter cung cấp một tập hợp tiêu chuẩn của các GIF động được gắn nhãn, có thể dễ dàng hơn cho NLP để phân tích thành ‘cảm xúc được xác định’ so với ngôn ngữ văn bản plain-text.

<bài báo mô tả việc sử dụng GIF phản ứng theo cách này như ‘một loại nhãn mới, chưa có sẵn trong các tập dữ liệu cảm xúc NLP’, và lưu ý rằng các tập dữ liệu hiện có sử dụng mô hình chiều của cảm xúc hoặc mô hình cảm xúc rời rạc, không cung cấp loại thông tin này.

Một GIF động phản ứng với một bài đăng người dùng. Với GIF do Twitter cung cấp bây giờ được mã hóa theo trạng thái cảm xúc, sự mơ hồ của ý định gần như được loại bỏ. Nguồn: https://arxiv.org/pdf/2105.09967.pdf

Các nhà nghiên cứu đã phát hành một tập dữ liệu gồm 30.000 tweet chứa GIF phản ứng. Phương pháp này cung cấp cho NLP một sự khác biệt không có trong các tài liệu hiện tại: một phương pháp để phân biệt cảm xúc được nhận thức (cảm xúc mà người đọc xác định từ văn bản) và cảm xúc được kích thích (cảm giác mà người đọc trải qua như một phản ứng với văn bản).

GIF Phản ứng như Chỉ số Giảm

Về mặt phản hồi hỗ trợ cho một bài đăng đang chia sẻ một trạng thái cảm xúc khó khăn, một GIF phù hợp là hữu ích và không mơ hồ về ý định, khi được đăng tải mà không có văn bản hỗ trợ (và những loại phản hồi GIF này là những gì nghiên cứu tập trung vào).

Ví dụ, các phản hồi như ‘Đó thật tàn nhẫn, anh bạn’, ‘Đó thật đáng tiếc’, hoặc ‘Awww’ chứa đựng sự mơ hồ về ý định, từ khả năng của một quan điểm ‘lâm sàng’ và không bị ảnh hưởng đến khả năng của sự讽刺; nhưng việc đăng tải một trong hàng trăm GIF ‘ôm’ của Twitter để lại ít khoảng trống cho việc giải thích:

Đào sâu vào Các Ý nghĩa con của Phản hồi GIF

Tuy nhiên, trong bất kỳ loại phản hồi nào, chẳng hạn như ‘ôm’, có nhiều chỉ số khác về tâm trạng hoặc quan điểm bao gồm nhiều thể loại của trạng thái cảm xúc, bao gồm quan điểm của các giả định về mối quan hệ lãng mạn hoặc gia đình giữa người phản hồi và người đăng bài gốc.

Sự mô tả của các loại mối quan hệ trong danh mục ‘ôm’ GIF có sẵn của Twitter. Việc sử dụng các thể loại, mô hình, mô tả giới tính và các yếu tố khác thêm độ hạt vào khả năng giải thích của một GIF cho cảm xúc này.

Tập dữ liệu ReactionGIF được rút ra từ 100 GIF đầu tiên trong mỗi danh mục phản hồi có sẵn trên Twitter, dẫn đến một cơ sở dữ liệu gồm 4300 hình ảnh động. Khi một GIF xuất hiện trong nhiều danh mục, danh mục với vị trí cao hơn trong GUI được tính trọng số cao hơn. Các hình ảnh xuất hiện trong nhiều danh mục được gán một yếu tố tương tự phản hồi – một thước đo được phát minh cho nghiên cứu.

Các mối quan hệ được khám phá bằng cách sử dụng phân cụm thứ bậc và liên kết trung bình.

Tăng cường Dữ liệu GIF Phản ứng

Tập dữ liệu được tạo và gắn nhãn bằng cách áp dụng phương pháp này vào 30.000 tweet. ‘Tín hiệu cảm xúc phong phú’ của một danh mục phản hồi cho phép các nhà nghiên cứu tăng cường tập dữ liệu với các nhãn cảm xúc bổ sung, dựa trên các cụm phản hồi tích cực và tiêu cực, và thêm các nhãn cảm xúc với một lược đồ ánh xạ phản hồi-sang-cảm xúc chuyên dụng, dựa trên quyết định đa số của ba người đánh giá trên các tweet mẫu.

Các công việc trước đó từ Yahoo và Đại học Rochester, liên quan đến việc chú thích GIF, không có lớp văn bản này, cũng không có bất kỳ danh mục phản hồi nào, mà chỉ thuần túy về mặt ngữ nghĩa.

Các nhà nghiên cứu đã đánh giá tập dữ liệu trên bốn phương pháp: RoBERTa, Mạng nơ-ron tích chập (CNN) GloVe, một phân loại器 hồi quy logistic, và một phân loại器 đa số lớp đơn giản. Trọng lượng của sự thuyết phục cho mỗi danh mục xuất hiện khá rõ ràng trong kết quả, với sự tán thưởng, thỏa thuận và chia sẻ dễ dàng xác định nhất (và được đại diện nhiều nhất), và xin lỗi khó đánh giá nhất, có thể vì nó bao gồm khả năng của sự讽刺.

Mô hình RoBERTa tạo ra xếp hạng trung bình cao nhất được thử nghiệm trên tất cả các phương pháp đánh giá, bao gồm Dự đoán Phản ứng Cảm xúc, Dự đoán Cảm xúc Kích thích và Dự đoán Cảm xúc Kích thích.

Thu thập Cảm xúc Người dùng từ GIF Phản ứng

Các nhà nghiên cứu quan sát rằng việc xác định cảm xúc kích thích là một trong những nhiệm vụ khó khăn nhất trong phân tích cảm xúc và cảm xúc dựa trên NLP, và việc sử dụng GIF phản ứng như một đại diện cung cấp khả năng cho các dự án sau này để thu thập ‘lượng lớn các nhãn cảm xúc tự nhiên, ít tốn kém, chất lượng cao’.

Mặc dù tập trung vào một vị trí rất cụ thể của GIF được nhúng vào trải nghiệm người dùng Twitter, nghiên cứu cho rằng phương pháp này có thể tổng quát hóa sang các nền tảng truyền thông xã hội khác, cũng như các nền tảng nhắn tin tức thời, và có thể hữu ích trong các lĩnh vực như nhận dạng cảm xúc và phát hiện cảm xúc đa phương tiện.

Độ phổ biến như Một Chỉ số Chính

Phương pháp này dường như phụ thuộc vào một loại ‘virality’ nhất định cho mỗi GIF, chẳng hạn như khi một GIF thực sự được cung cấp thông qua các cơ chế của Twitter. Presumably, các GIF do người dùng tạo mới không thể tham gia vào hệ sinh thái này ngoại trừ thông qua sự phổ biến và áp dụng tăng lên như một meme.

GIF Phản ứng đã phục hồi việc sử dụng định dạng GIF động nguyên thủy từ năm 1987 trong 10 năm qua, sau nhiều năm bị coi là một kẻ ngốn băng thông (chủ yếu được sử dụng cho quảng cáo banner khó chịu) trong thời đại Internet V1 trước băng thông rộng.