Обнаружение поддельных новостей
Здравствуйте, ребята, в предыдущем блоге мы рассмотрели шесть различных исследовательских работ и записали их результаты. В этом блоге мы собираемся обсудить еще несколько научных работ, которые помогли мне создать мой проект.
Обнаружение поддельных новостей с помощью глубокой нейронной сети
Авторы: Рохит Кумар Калияр
Работа: в этом проекте изучались различные модели машинного обучения, такие как наивный байесовский алгоритм, K ближайших соседей, дерево решений, случайный лес и сети глубокого обучения, такие как неглубокие сверточные нейронные сети (CNN), очень глубокая сверточная нейронная сеть (VDCNN), длинная кратковременная память. Сеть (LSTM), Gated Recurrent Unit Network (GRU), комбинация сверточной нейронной сети с долговременной кратковременной памятью (CNN-LSTM) и сверточной нейронной сети с Gated Recurrent Unit (CNN-LSTM). Также были изучены преимущества извлечения функций, такие функции, как n-gram, функции TF-IDF, были извлечены и использованы в нашей модели. Мы также изучили эффективность функций встраивания слов и word2vec в сетях Deep Neural.
Вывод: проводится сравнение между различными моделями и определяется оценка F1, полнота и точность каждого алгоритма. Но окончательная оценка наиболее подходящего алгоритма не упоминается.
Обнаружение поддельных новостей в социальных сетях с помощью классификатора ближайших соседей
Авторы: Анкит Кесарвани, Судакар Сингх Чаухан, Анил Рамачандран Наир
Работа: в последние годы было проведено множество исследований по обнаружению фейковых новостей из-за их значительного влияния на общественное мнение и социальный дискурс. Одно из таких исследований было проведено с использованием алгоритма классификатора K-Nearest Neighbor (KNN) для обнаружения фейковых новостей в социальных сетях. Выбор признаков из наборов данных является важной частью этого процесса, поскольку он используется алгоритмом интеллектуального анализа данных (K-Nearest Neighbour) для классификации новостной статьи в социальных сетях.
Вывод: Точность, достигнутая с помощью алгоритма KNN, составляет 79%, что меньше, чем у алгоритма SVM, как показано в другой статье. В заключение исследование демонстрирует эффективность алгоритма классификатора KNN в обнаружении фейковых новостей в социальных сетях. Однако необходимы дальнейшие исследования для изучения других алгоритмов и методов машинного обучения для более точного и эффективного обнаружения фейковых новостей.
Обнаружение поддельных новостей: сравнение доступных методов глубокого обучения в векторном пространстве
Автор: Лавдип Сингх
Работа: в этой статье исследуется эффективность различных методов глубокого обучения для обнаружения фейковых новостей. В исследовании используется набор данных новостных статей, собранных из различных источников, которые были классифицированы как фейковые или настоящие новости.
В исследовании оценивается эффективность трех методов глубокого обучения: сверточных нейронных сетей (CNN), сетей с долговременной кратковременной памятью (LSTM) и двунаправленных сетей LSTM. Текстовые данные сначала предварительно обрабатываются путем удаления стоп-слов, знаков препинания и специальных символов, а затем преобразуются в векторные представления с использованием алгоритма Word2Vec.
Затем модели глубокого обучения обучаются на предварительно обработанных и векторизованных данных, а их производительность оценивается с использованием различных показателей оценки, таких как точность, воспроизводимость и оценка F1. Результаты исследования показывают, что двунаправленная сеть LSTM превосходит две другие модели, достигая точности 94,9% и оценки F1 0,95.
Вывод. В исследовании сделан вывод о том, что методы глубокого обучения могут быть очень эффективными при обнаружении фальшивых новостей, причем двунаправленная сеть LSTM является наиболее эффективным методом среди трех, оцененных в исследовании. В исследовании также подчеркивается важность надлежащей предварительной обработки данных и методов векторизации для достижения оптимальной производительности.
Обнаружение поддельных новостей из потоков данных
Авторы: Павел Зыблевский, Павел Ксеневич, Рафал Козик, Михал Хорас, Михал Возняк, Агата Гелчик
Работа: В исследовательской работе исследуется проблема обнаружения фальшивых новостей из динамических потоков данных. В исследовании предлагается подход к онлайн-обучению для обнаружения фейковых новостей в режиме реального времени из потоков данных. В исследовании используется набор данных новостных статей, собранных из различных источников, которые были классифицированы как фейковые или настоящие новости. Поток данных моделируется путем случайного выбора новостных статей из набора данных и их потоковой передачи через предлагаемый алгоритм онлайн-обучения.
Алгоритм онлайн-обучения основан на алгоритме пассивно-агрессивного (ПА) — популярном методе онлайн-обучения. Алгоритм обучается на скользящем окне данных, которое постоянно обновляется по мере поступления новых данных. Данные предварительно обрабатываются путем удаления стоп-слов, знаков препинания и специальных символов, а затем преобразуются в векторные представления с использованием метода TF-IDF.
Производительность предлагаемого подхода оценивается с использованием различных показателей оценки, таких как точность, достоверность, полнота и оценка F1. Результаты исследования показывают, что предложенный подход позволяет достичь точности до 88% при обнаружении фейковых новостей из потоков данных.
Вывод. В исследовании сделан вывод о том, что методы онлайн-обучения могут быть эффективны для обнаружения фальшивых новостей из потоков данных в режиме реального времени. В исследовании также подчеркивается важность надлежащей предварительной обработки данных и методов проектирования функций для достижения оптимальной производительности. В целом, исследовательская работа дает ценную информацию об использовании методов онлайн-обучения для обнаружения фальшивых новостей из потоков данных, что может быть полезно для исследователей и практиков, работающих в этой области.
Это десять исследовательских работ, которые помогли мне понять концепции, необходимые для создания моего проекта. В следующем блоге мы собираемся обсудить концепции, какие идеи я получил, прочитав исследовательские работы, и их применение в нашем проекте. А пока следите за обновлениями!