Общие наборы данных могут давать уникальные результаты и отличные модели ИИ.

Если вы ищете хитрости, которые сделают ваши неконтролируемые модели умными и надежными, не пропустите Распределение данных, которое является ядром механизмов рекомендаций, которые мы используем в MarieAI (marieai.com) для обучения интеллектуальных моделей.

Модели в действии

Иногда, когда вы видите механизмы рекомендаций в действии, вы, вероятно, задаетесь вопросом, почему они такие тупые? Качество или количество данных? Может не хватило настройки параметров? Возможно, вам нужно больше механических турок и больше денег, чтобы обучить качественную умную модель.

Что, если бы я сказал вам, что вы можете иметь небольшое количество образцов (скажем, до 5 000) на основе общих, широко доступных метаданных и при этом получить модель с уникальными функциями, схватывая нечеткую логику и отношения? . И самое главное — на разработку уйдут не месяцы, а всего неделя-две. Как?

Уровни данных — сделайте ваши данные умнее

В 2017 году я оставил карьеру разработчика игр и сосредоточился на разработке новой техники машинного обучения будущего.

Способ, который не требует замысловатой докторской степени, терабайтов данных и бесчисленных часов, затрачиваемых на настройку параметров. Это просто неконтролируемое подключение (данные) и воспроизведение (использование в производстве). Так родился MarieAI.com.

Чтобы иметь такой тип ИИ, вам, очевидно, нужен неконтролируемый алгоритм, в котором ЧТО вы ставите — ярлыки — имеет решающее значение, поскольку алгоритм выводит согласованные модели на основе входных данных. Таким образом, представление данных — маркировка — это ключ, и я хочу научить вас технике, которую я использовал для механизма рекомендаций нового поколения.

Как научить ИИ юмору — пример?

Давайте посмотрим на окончательные результаты механизма рекомендаций фильмов, использующего эту технику. Он может обрабатывать различные типы юмора (ромком, сатира, фарс, черная комедия) и другие нишевые поджанры на основе общедоступных данных, которые есть у всех. В то время как алгоритмы рекомендаций Netflix или Amazon довольно часто могут подвести своих пользователей, с многослойностью данных вы получаете очень последовательное и интуитивно понятное понимание обычно понятных людям, но нечетких определений. В конце концов, может ли ваш алгоритм «понимать», что такое комедия фарса?

Предоставить нечеткие данные

Может ли ИИ вообще понять нечеткость и нюансы данных? Давайте попробуем использовать его для возраста актеров в качестве примера (хотя наш движок имеет гораздо больше входных данных).

Допустим, вы хотите обучить алгоритм динамике возраста персонажей — чему-то, что мы, люди, можем видеть и ассоциировать с определенной химией на экране, это нужно предоставить как общую информацию. Это не только помогает лучше понять романтическую химию между актерами на экране, но также помогает ИИ понимать другие типы фильмов, в которых актеры молоды (подростковые приключения) или старше (например, фильмы, в которых звезды старых боевиков пытаются нас снова удивить) или микс (например, семейный фильм).

Спин на общих данных

Очевидно, что возраст актеров и дата выхода фильма не являются уникальными типами данных, но если вы извлечете их возраст во время производства фильма и объедините с другими актерами, вы получите новую категорию метаданных, основанную на возрасте. различия и возрастные рамки. Но как создать многоуровневую структуру данных и при этом избежать математических вычислений?

Простой. Ниже у вас есть пример того, как вы можете создавать абстрактные метаданные на основе числовых значений, не используя числа — следовательно, создавая пул метаданных.

Как вы видите, возраст актеров в разных фильмах открывает различный диапазон меток, а диапазон помогает создавать перекрытия — эти перекрытия — это наилучший способ разделения данных — он создает разные шаблоны меток для разных типов фильмов, группируя похожие вместе.

Шаблоны для каждого жанра кино

В рамках одной категории алгоритмы машинного обучения, такие как marieai.com, могут взвешивать фильмы по-разному, основываясь только на возрастной динамике. Этот интеллектуальный способ разделения данных позволяет создавать интеллектуальные модели ИИ без дополнительных параметров настройки или даже без знания того, как работать с ИИ. Это чистая наука о данных!

Другой пример. Когда вы сравниваете закономерности возрастной динамики между жанрами фильмов (имейте в виду, что я упрощаю ради аргумента), неконтролируемые алгоритмы, предназначенные для выявления закономерностей и аномалий (как и MarieAI), отображают в за считанные минуты очень умная и мощная модель, которую можно использовать на бэкэнде или во внешнем интерфейсе.

Не так быстро

Очевидно, это всего лишь пример одного из многих типов этикеток, которые я наслаивал, но я надеюсь, что вы теперь уловили концепцию. Использование таких методов и неконтролируемых алгоритмов, таких как MarieAI, позволяет создавать отличные модели ИИ, способные выполнять классификацию данных, рекомендации или прогнозы без сложной математики или даже без знания того, как строить модели ML.

Шучу — это быстро!

И — в двух словах — это миссия моей жизни. Научить людей простым приемам, чтобы они могли создавать умные, интеллектуальные модели для своего ИИ и строить лучшее будущее. Никакой сложной математики, никаких трат на аспирантов и облачных вычислений.
Вы можете проверить свои навыки — с MarieAI — с помощью этого руководства, например:

https://marcin-rybicki.medium.com/text-classifier-tutorial-for-marieai-com-f5afaec87063

Подсели на идею цифрового гиппокампа

Я считаю — и я изобрел способ работать с ним —существует простой способ для нашего мозга запоминать и забывать вещи. Я назвал его цифровой гиппокамп, и он быстрее и энергоэффективнее, работает для создание общего ИИ, и мы могли бы создавать чипы и память в будущем, чтобы цифровые устройства могли работать так же, как думают люди.

https://marcin-rybicki.medium.com/digital-hippocampus-how-to-build-one-c6f4cbed7ab0

Обо мне

Привет, я Марчин. Бывший разработчик игр и дизайнер алгоритмов.
В настоящее время работает над новым алгоритмом общего назначения, который можно использовать в автономном режиме на любом устройстве. Моя мечта — предоставить решение, которое можно было бы обучать, повышать квалификацию и работать как рой, решая безумно сложные проблемы.

Так родился сайт MarieAI(https://marieai.com/).
Концепция цифрового гиппокампа
Техника наложения данных, описанная здесь.

Найдите меня на LinkedIn: https://www.linkedin.com/in/marcin-rybicki-qa/