Из-за огромного объема ежедневно создаваемой информации трудно отличить настоящие новости от фальшивых, но достижения в области обработки естественного языка (NLP) позволяют решить эту проблему.
В современную цифровую эпоху распространение информации через социальные сети и интернет-платформы дало людям возможность получать новости из самых разных источников. Однако недостатком такой независимости является рост числа фальшивых новостей. Фальшивые новости - это недостоверная информация, целенаправленно распространяемая для того, чтобы запутать общественность и подорвать доверие к авторитетной журналистике. Для поддержания информированности и единства мирового сообщества необходимо выявлять и устранять фальшивые новости.
НЛП, поднаправление искусственного интеллекта, наделяет компьютеры способностью понимать и интерпретировать человеческий язык, что делает его важнейшим инструментом для выявления обманчивой информации. В данной статье рассматривается, как НЛП может быть использовано для выявления фальшивых новостей, и приводятся примеры его применения для обнаружения недостоверных данных.
Сентиментальный анализ
Для выявления фальшивых новостей эффективной стратегией может стать анализ настроений с использованием НЛП. Алгоритмы NLP позволяют определить намерения и предвзятость автора, анализируя эмоции, проявляемые в новостях или сообщениях в социальных сетях. Фальшивые новости часто используют сильные выражения и преувеличения, чтобы завладеть эмоциями читателей.
Извлечение фраз мнений из отзывов пользователей с помощью Stanford CoreNLP http://t.co/t6VIzfNRfz #machinelearning #nlp pic.Twitter.com/RHiTl40Q7c
- Джулиан Хиллебранд (@JulianHi) 11 сентября 2014 г.
Например, новостной материал, освещающий политический инцидент, может быть идентифицирован с помощью модели анализа настроений на основе NLP как значительно предвзятый в пользу определенной партии и использующий эмоционально заряженные формулировки для воздействия на общественное мнение.
Семантический анализ и проверка фактов
Для подтверждения достоверности материала инструменты фактчекинга на основе НЛП могут анализировать содержание новостного материала по достоверным источникам или базам данных. Семантический анализ позволяет выявить несоответствия и противоречия, которые могут указывать на фальшивые новости, и понять смысл и контекст используемого языка.
Например, система проверки фактов на основе НЛП может мгновенно сопоставить утверждение в новостной статье о том, что известная знаменитость поддерживает спорный продукт, с достоверными источниками, чтобы убедиться в его правдивости.
Распознавание именованных сущностей (NER)
В NLP распознавание именованных сущностей (NER) позволяет компьютерам распознавать и классифицировать определенные сущности, упоминаемые в тексте, такие как люди, группы, места или даты. Выявление значимых фигур позволяет опровергнуть фальшивые новости, обнаружив противоречия или выдуманную информацию.
Система распознавания именованных сущностей (NER) идентифицирует и классифицирует сущности в тексте.
- Simform (@simform) 31 июля 2023 г.
Вы можете извлекать структурированную информацию для информационного поиска и управления знаниями.
Примерами несуществующих организаций или населенных пунктов, которые алгоритмы NER могут выделить как потенциальные признаки ложных новостей, являются упоминания в новостных статьях о якобы произошедших экологических катастрофах.
Распознавание сенсаций и кликбейта
НЛП-модели могут быть обучены выявлять сенсационные формулировки и заголовки типа "кликбейт", которые являются характерными признаками фальшивых новостей. Эти методы могут помочь в отсеивании ложной информации и ранжировании заслуживающих доверия источников новостей.
Например, сенсационные фразы и раздутые утверждения, которые часто сопровождают статьи типа "кликбейт", можно обнаружить, проанализировав заголовки и содержание с помощью алгоритма, работающего на базе НЛП.
Оценка надежности источника
Методы НЛП способны анализировать историческую информацию о новостных организациях, такую как их положение, надежность и точность исторических сообщений. Эти данные могут быть использованы для оценки достоверности свежего контента и выявления потенциальных источников фальшивых новостей.
Например, система на базе НЛП может оценить легитимность менее известного сайта, на котором опубликовано поразительное сообщение, прежде чем признать его содержание достоверным.
Источник