Connect with us

Статистическая модель помогает обнаруживать дезинформацию в социальных сетях

Искусственный интеллект

Статистическая модель помогает обнаруживать дезинформацию в социальных сетях

mm

Профессор математики из Американского университета, вместе со своей командой сотрудников, разработал статистическую модель, которая может обнаруживать дезинформацию в постах социальных сетей.

Машинное обучение все чаще используется для предотвращения распространения дезинформации, но существует значительная проблема, связанная с проблемой “черных ящиков”, которые возникают. Это относится к ситуации, когда исследователи не понимают, как машина принимает одно и то же решение, что и человеческие тренеры.

Обнаружение дезинформации с помощью статистических моделей

Зоис Букувалас, помощник профессора в департаменте математики и статистики AU, использовал набор данных Twitter с твитами, содержащими дезинформацию о COVID-19, чтобы продемонстрировать, как статистические модели могут обнаруживать дезинформацию в социальных сетях во время крупных событий, таких как пандемия или катастрофа.

Букувалас и его коллеги, в состав которых входят студентка AU Кейтлин Морони и профессор компьютерных наук Натали Жапкович, продемонстрировали, как решения модели совпадают с решениями людей в недавно опубликованном исследовании.

“Мы хотим знать, о чем думает машина, когда она принимает решения, и как и почему она согласуется с людьми, которые ее обучили”, – сказал Букувалас. “Мы не хотим блокировать учетную запись социальной сети человека, потому что модель принимает предвзятые решения.”

Метод, используемый командой, представляет собой тип машинного обучения, который опирается на статистику. Статистические модели эффективны и предоставляют другой способ борьбы с дезинформацией.

Модель достигла высокой точности прогнозирования и классифицировала набор тестирования из 112 реальных и дезинформационных твитов с точностью почти 90%.

“Что важно в этом открытии, так это то, что наша модель достигла точности, предлагая прозрачность о том, как она обнаружила твиты, которые были дезинформацией”, – продолжил Букувалас. “Методы глубокого обучения не могут достичь такой точности с прозрачностью.”

Обучение и подготовка модели

Исследователи подготовили модель к обучению перед ее тестированием на наборе данных, поскольку информация, предоставляемая людьми, может ввести предвзятости и “черные ящики”.

Твиты были помечены исследователями как дезинформация или реальные на основе набора предопределенных правил о языке, используемом в дезинформации. Команда также учитывала нюансы человеческого языка и лингвистические особенности, связанные с дезинформацией.

До обучения модели профессор социолингвистики Кристин Маллинсон из Университета Мэриленда в округе Балтимор определила твиты по стилям письма, связанным с дезинформацией, предвзятостью и менее надежными источниками в новостных СМИ.

“Как только мы добавляем эти входные данные в модель, она пытается понять основные факторы, которые приводят к разделению хорошей и плохой информации”, – сказала Жапкович. “Она учится контексту и тому, как слова взаимодействуют.”

Исследователи теперь будут работать над улучшением пользовательского интерфейса модели, а также ее способности обнаруживать дезинформацию в постах социальных сетей, которые включают изображения или другие мультимедийные элементы. Статистическая модель должна научиться тому, как различные элементы взаимодействуют друг с другом, чтобы создать дезинформацию.

И Букувалас, и Жапкович считают, что человеческий интеллект и грамотность в области новостей являются ключом к предотвращению распространения дезинформации.

“Через нашу работу мы проектируем инструменты на основе машинного обучения, чтобы предупредить и просвещать общественность, чтобы исключить дезинформацию, но мы твердо убеждены, что люди должны играть активную роль в том, чтобы не распространять дезинформацию в первую очередь”, – сказал Букувалас.

Алекс Макфарленд - журналист и писатель в области искусственного интеллекта, исследующий последние разработки в этой области. Он сотрудничал с многочисленными стартапами и изданиями в области искусственного интеллекта во всем мире.