Классификатор спама G-mail с машинным обучением: -

Надеюсь, у вас все хорошо!!! Добро пожаловать в мой блог!

Я до сих пор помню свой первый день в классе машинного обучения. Первым примером, который был предоставлен для объяснения того, как работает машинное обучение, было «Обнаружение спама». Мы говорим о том, как машинное обучение участвует в обнаружении спама, а затем просто переходим к другим вещам.

Мы все слышали о спаме в электронной почте, верно?

Предположим, вы встали утром, открыли Gmail и обнаружили письмо, в котором говорилось что-то вроде: «Привет, вы выиграли iPhone 10 в розыгрыше, проведенном вчера Amazon. Чтобы получить приз, пожалуйста, войдите в свою учетную запись и заберите свой подарок». Увидев почту, вы сначала проверили отправителя и обнаружили, что он подлинный, и с радостью бросились на сайт, вошли в систему и обнаружили, что приза вообще нет. С грустью ты вернулся к своим работам.

Через несколько часов вы получили сообщение о том, что с вашего банковского счета недавно была проведена транзакция, и вы шокированы тем, как это произошло. Сообщив об инциденте в банк, они сказали, что вас рассылали спамом, и миллионы людей сталкиваются с той же проблемой, звучит ужасно, верно! Но, друзья мои, к счастью для вас, у Google есть какой-то механизм для поиска таких писем и их разделения в папке СПАМ.

Gmail — это эффективный, быстрый и дешевый способ общения. Ожидается, что общее количество учетных записей электронной почты по всему миру увеличится. Итак, как Gmail борется с этим и что вы, как пользователь Gmail, можете сделать, чтобы обезопасить себя?

Спамовые электронные письма — это нежелательные электронные письма, рассылаемые в массовом порядке с целью сбора данных, фишинга, выполнения социальной инженерии, начала атаки и многого другого — в основном по плохим причинам. Обычно это рекламные и маркетинговые материалы.

Прежде всего, мы должны понять, что такое машинное обучение и традиционное программирование. Машинное обучение было представлено много лет назад, но то волнение, которое оно вызвало в последние несколько лет, просто невероятно. Все говорят о машинном обучении, но, как и многие другие вещи в мире, оно используется в разных значениях.

От самоуправляемого автомобиля Google до Siri от Apple — все это примеры машинного обучения из реальной жизни, поэтому мы получаем так много реальных примеров машинного обучения. Разные люди по-разному воспринимают значение машинного обучения. по-своему правильно. Но для новичка это может быть очень запутанным. Прежде чем разбираться в машинном обучении, давайте разберемся, что такое традиционное программирование?

ТРАДИЦИОННОЕ ПРОГРАММИРОВАНИЕ:-

Допустим, у нас есть функция, которая принимает 2 входа (a и b) и возвращает сумму (a+b), поэтому в традиционном программировании мы просто берем входные данные, помещаем их в функцию и получаем желаемый результат. Эта функция может быть любой функцией, может быть функцией внутри функции, сотнями функций в одной программе, но базовый блок работает так просто.

И еще один,

МАШИННОЕ ОБУЧЕНИЕ:-

Теперь предположим, что у нас есть входные данные, а также выходные данные, здесь цель состоит в том, чтобы получить связь между x и y. давайте сначала разберемся с этим. У нас есть функция, F(x) = y, здесь у нас есть x, у нас есть y, и нам нужно аппроксимировать функцию «F». Входные данные X также могут называться функциями в мире машинного обучения, а выходные данные Y также могут называться метками классов. Давайте разберемся в этом на простом примере. Представьте, что вы получили работу в Amazon в качестве специалиста по данным, и ваш менеджер попросил вас создать модель машинного обучения, которая может предсказать, будет ли конкретный отзыв, данный клиентом Amazon, положительным или отрицательным. Теперь, прежде чем создавать модель машинного обучения, давайте разберемся, почему она важна. Почему отзывы клиентов Amazon важны для Amazon? Допустим, на сайте Amazon есть товар «Синие джинсы», и у него в общей сложности 500 отзывов, 400 людям не понравился товар, они дали плохие отзывы и только 100 человек дали хорошие отзывы. Теперь вопрос: «Поместит ли Amazon этот продукт на свои первые начальные страницы»? Ответ «НЕТ», Amazon не будет размещать такой продукт на своих первых начальных страницах. Вот почему отзывы клиентов очень важны для Amazon.

С помощью машинного обучения мы можем решить эту проблему классификации спам-писем. Идея этого поста состоит в том, чтобы понять, как это работает и как это помогает облегчить жизнь каждого. Кроме того, в следующий раз, когда вы увидите электронное письмо «Вы выиграли в лотерею», а не проигнорируете его, вы можете сообщить о нем как о спаме.

Чтобы классифицировать электронное письмо как спам или не спам.

Есть два типа писем: первый - спам, а другой - ветчина, то есть не спам. Спам — это нежелательная, нежелательная, нежелательная массовая рассылка, используемая для распространения добродетели, троянов, вредоносного кода, рекламы или для получения прибыли при незначительных затратах.

Ветчина является законной, разыскиваемой, запрошенной почтой.

На приведенном выше изображении представлен обзор фильтрации спама. Каждый день приходит множество писем, некоторые из них попадают в спам, а остальные остаются в папке «Входящие» (если вы не определили дополнительные категории). Синее поле посередине — это «Модель машинного обучения». Как она определяет, какая почта является спамом, а какая нет?

Есть 7 шагов машинного обучения:

Шаг 1: Сбор данных,

Шаг 2: Подготовка данных (очистка),

Шаг 3: Анализ данных (визуализация),

Шаг 4: Обучение,

Шаг 5: Тестирование,

Шаг 6: Развертывание…

В этом главное — обучение и тестирование модуля машинного обучения, поэтому мы берем случайные данные (электронные письма), которые тоже состоят из спама и не спама, и помечаем их вручную.

На этих данных будет проходить обучение модуля и после обучения проводится тестирование модуля, в целях тестирования используются разные данные (e-mail) для более точных результатов. При тестировании результата модели машинного обучения мы получаем те же результаты, что и ожидались. Письма со спамом попадают в папку со спамом, а сообщения, не являющиеся спамом, попадают прямо в папку «Входящие».

Используя эту методологию машинного обучения, мы можем легко решить эту проблему. Надеюсь, что было легко пройтись по блогу, так как я старался сделать его кратким и простым.

Спасибо

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning