Всего понемногу ИИ #3

МОДЕЛЬ НЕДЕЛИ: ЛАМА

LLAMA — это языковая модель, разработанная META и доступная в сообществе открытого исходного кода под лицензией GPL-3. LLAMA — одна из самых актуальных моделей, выпущенных в этом году, особенно для open-source сообщества,

Идти против направления большинства моделей, выпускаемых с постоянно растущим количеством параметров, обучающих данных и вычислительных ресурсов в погоне за универсальной моделью. LLAMA доступен в нескольких различных размерах (от 7 до 65 миллионов параметров), чтобы дать людям возможность выбирать между высокой производительностью и используемыми вычислительными ресурсами, например, модель 7B может быть запущена на процессорах компьютеров для легкого потребления (которые имеют 8гб ОЗУ и без выделенной видеокарты), смартфоны и даже на хромированных табах.

Благодаря этому доступ к технологии языковых моделей стал намного более демократичным, что позволило значительной части населения мира загрузить «мини» LLM для использования дома. Это также очень помогло исследованиям в этой области, поскольку можно использовать эту модель в качестве базы обучения для других специалистов по какой-либо конкретной задаче или других LLM без финансовых затрат на доступ.

На его основе было создано несколько других моделей с открытым исходным кодом, таких как: Vicuna, Alpaca, Koala и WizardLM (подробнее о них мы узнаем в следующих выпусках).

Кроме того, инициатива LLAMA также предоставляет набор инструментов под названием llama.cpp, который позволяет осуществлять процесс квантования (уменьшения модели, как в стратегии LLAMA) других моделей, основанных на нем, что позволяет использовать несколько LLM сегодня в этом мини-формате. таких форматов, как викунья 7б/13б, альпака 7б/13б и другие.

Вместе с ним появились и такие проекты, как GPT4All — бесплатная программа, которую можно загрузить и которая содержит интерфейс чата, где пользователи могут загрузить любую модель и взаимодействовать с ней локально на своем персональном компьютере (gpt4all.io/index.html).

СРОКИ НЕДЕЛИ: базовые модели, модели инструкций и модели чата.

Базовые модели - это LLM, обученные на больших объемах данных в больших масштабах, часто с использованием методов обучения с самостоятельным или полууправляемым обучением. Эти модели могут быть адаптированы для широкого круга последующих задач.

ПРИМЕР: GPT3, GPT4, LLAMA, BERT и T5.

Модели инструкций — это модели, которые могут следовать инструкциям на естественном языке, не нуждаясь в примерах.

ПРИМЕР: Долли, Альпака, WizardML и Гуанако.

Модели чата предназначены для ведения бесед, подобных человеческим, и могут взаимодействовать с пользователями в разговорной манере. Эти модели могут отвечать на вопросы, помогать в выполнении задач и вести диалог с пользователями.

Например: ChatGPT, Bard, Bing Chat, HugginChat, Vicuna, MPT-Chat

Эти модели можно развивать с помощью тонкой настройки, например, базовую модель можно обучить отвечать на инструкции и общаться с пользователем точно так же, как модель инструкций можно обучать разговорам и так далее.

ПОЛЕЗНЫЙ ИНЖЕНЕРНЫЙ СОВЕТ НЕДЕЛИ: думайте шаг за шагом

Всякий раз, когда вам нужен LLM для выполнения задачи, требующей несколько более сложных рассуждений, рекомендуется ставить в конце подсказки инструкцию Думайте шаг за шагом. Это обеспечит более глубокое отражение вашего запроса вместо того, чтобы «давать первый ответ, который приходит на ум», что позволяет давать более сложные и точные ответы. GPT-3, например, обычно не справляется с математическими задачами, когда их просят решить их напрямую, но если эту инструкцию поместить в конец, ей удается решить ту же задачу, получая правильный результат.

ЗАПУСК НЕДЕЛИ: BrowseGPT

С помощью этого расширения Google Chrome вы можете автоматизировать просмотр веб-страниц с помощью ИИ, вместо того, чтобы вводить URL-адреса и много щелкать, вы можете ввести текст в текстовое поле, куда должен перейти ИИ, и наблюдать, как происходит волшебство (перейдите на Amazon и найдите фантастические книги).

Ссылка:browgpt.ai

НАУЧНАЯ СТАТЬЯ НЕДЕЛИ:Voyager

Первый агент непрерывного обучения на протяжении всей жизни, включенный в LLM (Large Language Model) в Minecraft, который постоянно исследует мир, приобретает разнообразные навыки и делает беспрецедентные открытия без вмешательства человека. «Вояджер» состоит из трех ключевых компонентов:

Автоматическая учебная программа, которая максимизирует исследования.
Постоянно растущая библиотека исполняемого кода для хранения и извлечения сложного поведения.
Новый итеративный механизм стимулирования, который включает в себя обратную связь от среды, ошибки выполнения и самопроверку для улучшения программы.

Voyager взаимодействует с GPT-4 через запросы черного ящика, что позволяет избежать тонкой настройки параметров модели. Навыки, разработанные «Вояджером», являются расширенными во времени, интерпретируемыми и композиционными, что быстро расширяет возможности агента и облегчает катастрофическое забывание. Эмпирически Voyager демонстрирует сильную способность к обучению на протяжении всей жизни и демонстрирует исключительное мастерство в игре Minecraft. Он получает в 3,3 раза больше уникальных предметов, преодолевает расстояния в 2,3 раза дольше и открывает ключевые вехи дерева технологий в 15,3 раза быстрее, чем предыдущий уровень техники. Voyager может использовать библиотеку изученных навыков в новом мире Minecraft для решения беспрецедентных задач с нуля, в то время как другие методы с трудом поддаются обобщению.

ВИДЕО НЕДЕЛИ: ChatGPT играет Detroit Become Human

РЕКОМЕНДУЕМЫЕ ИНСТРУМЕНТЫ:

AndiSearch: инструмент поиска AI, немного отличающийся от других, помимо предоставления ответа, он также позволяет просматривать все ссылки, содержащие тему. (andisearch.com)

CallAnnie: позвоните онлайн-искусственному интеллекту и поговорите с ней на любую тему. (калланни.ай)

LLM Garden: Динамический список всех доступных сегодня языковых моделей и их характеристики. (лм.сад)

Текущее: подборка новостей на любую тему, созданная искусственным интеллектом. (текущий.отчет)

Gemmo Chat: общайтесь с ИИ, чтобы запросить создание изображений и видео. (genmo.ai)

Kaiber: генерация видео по тексту или изображениям. (kaiber.ai)

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning