МОДЕЛЬ НЕДЕЛИ: ЛАМА
LLAMA — это языковая модель, разработанная META и доступная в сообществе открытого исходного кода под лицензией GPL-3. LLAMA — одна из самых актуальных моделей, выпущенных в этом году, особенно для open-source сообщества,
Идти против направления большинства моделей, выпускаемых с постоянно растущим количеством параметров, обучающих данных и вычислительных ресурсов в погоне за универсальной моделью. LLAMA доступен в нескольких различных размерах (от 7 до 65 миллионов параметров), чтобы дать людям возможность выбирать между высокой производительностью и используемыми вычислительными ресурсами, например, модель 7B может быть запущена на процессорах компьютеров для легкого потребления (которые имеют 8гб ОЗУ и без выделенной видеокарты), смартфоны и даже на хромированных табах.
Благодаря этому доступ к технологии языковых моделей стал намного более демократичным, что позволило значительной части населения мира загрузить «мини» LLM для использования дома. Это также очень помогло исследованиям в этой области, поскольку можно использовать эту модель в качестве базы обучения для других специалистов по какой-либо конкретной задаче или других LLM без финансовых затрат на доступ.
На его основе было создано несколько других моделей с открытым исходным кодом, таких как: Vicuna, Alpaca, Koala и WizardLM (подробнее о них мы узнаем в следующих выпусках).
Кроме того, инициатива LLAMA также предоставляет набор инструментов под названием llama.cpp, который позволяет осуществлять процесс квантования (уменьшения модели, как в стратегии LLAMA) других моделей, основанных на нем, что позволяет использовать несколько LLM сегодня в этом мини-формате. таких форматов, как викунья 7б/13б, альпака 7б/13б и другие.
Вместе с ним появились и такие проекты, как GPT4All — бесплатная программа, которую можно загрузить и которая содержит интерфейс чата, где пользователи могут загрузить любую модель и взаимодействовать с ней локально на своем персональном компьютере (gpt4all.io/index.html).
СРОКИ НЕДЕЛИ: базовые модели, модели инструкций и модели чата.
Базовые модели - это LLM, обученные на больших объемах данных в больших масштабах, часто с использованием методов обучения с самостоятельным или полууправляемым обучением. Эти модели могут быть адаптированы для широкого круга последующих задач.
ПРИМЕР: GPT3, GPT4, LLAMA, BERT и T5.
Модели инструкций — это модели, которые могут следовать инструкциям на естественном языке, не нуждаясь в примерах.
ПРИМЕР: Долли, Альпака, WizardML и Гуанако.
Модели чата предназначены для ведения бесед, подобных человеческим, и могут взаимодействовать с пользователями в разговорной манере. Эти модели могут отвечать на вопросы, помогать в выполнении задач и вести диалог с пользователями.
Например: ChatGPT, Bard, Bing Chat, HugginChat, Vicuna, MPT-Chat
Эти модели можно развивать с помощью тонкой настройки, например, базовую модель можно обучить отвечать на инструкции и общаться с пользователем точно так же, как модель инструкций можно обучать разговорам и так далее.
ПОЛЕЗНЫЙ ИНЖЕНЕРНЫЙ СОВЕТ НЕДЕЛИ: думайте шаг за шагом
Всякий раз, когда вам нужен LLM для выполнения задачи, требующей несколько более сложных рассуждений, рекомендуется ставить в конце подсказки инструкцию Думайте шаг за шагом. Это обеспечит более глубокое отражение вашего запроса вместо того, чтобы «давать первый ответ, который приходит на ум», что позволяет давать более сложные и точные ответы. GPT-3, например, обычно не справляется с математическими задачами, когда их просят решить их напрямую, но если эту инструкцию поместить в конец, ей удается решить ту же задачу, получая правильный результат.
ЗАПУСК НЕДЕЛИ: BrowseGPT
С помощью этого расширения Google Chrome вы можете автоматизировать просмотр веб-страниц с помощью ИИ, вместо того, чтобы вводить URL-адреса и много щелкать, вы можете ввести текст в текстовое поле, куда должен перейти ИИ, и наблюдать, как происходит волшебство (перейдите на Amazon и найдите фантастические книги).
Ссылка:browgpt.ai
НАУЧНАЯ СТАТЬЯ НЕДЕЛИ:Voyager
Первый агент непрерывного обучения на протяжении всей жизни, включенный в LLM (Large Language Model) в Minecraft, который постоянно исследует мир, приобретает разнообразные навыки и делает беспрецедентные открытия без вмешательства человека. «Вояджер» состоит из трех ключевых компонентов:
- Автоматическая учебная программа, которая максимизирует исследования.
- Постоянно растущая библиотека исполняемого кода для хранения и извлечения сложного поведения.
- Новый итеративный механизм стимулирования, который включает в себя обратную связь от среды, ошибки выполнения и самопроверку для улучшения программы.
Voyager взаимодействует с GPT-4 через запросы черного ящика, что позволяет избежать тонкой настройки параметров модели. Навыки, разработанные «Вояджером», являются расширенными во времени, интерпретируемыми и композиционными, что быстро расширяет возможности агента и облегчает катастрофическое забывание. Эмпирически Voyager демонстрирует сильную способность к обучению на протяжении всей жизни и демонстрирует исключительное мастерство в игре Minecraft. Он получает в 3,3 раза больше уникальных предметов, преодолевает расстояния в 2,3 раза дольше и открывает ключевые вехи дерева технологий в 15,3 раза быстрее, чем предыдущий уровень техники. Voyager может использовать библиотеку изученных навыков в новом мире Minecraft для решения беспрецедентных задач с нуля, в то время как другие методы с трудом поддаются обобщению.
ВИДЕО НЕДЕЛИ: ChatGPT играет Detroit Become Human
РЕКОМЕНДУЕМЫЕ ИНСТРУМЕНТЫ:
AndiSearch: инструмент поиска AI, немного отличающийся от других, помимо предоставления ответа, он также позволяет просматривать все ссылки, содержащие тему. (andisearch.com)
CallAnnie: позвоните онлайн-искусственному интеллекту и поговорите с ней на любую тему. (калланни.ай)
LLM Garden: Динамический список всех доступных сегодня языковых моделей и их характеристики. (лм.сад)
Текущее: подборка новостей на любую тему, созданная искусственным интеллектом. (текущий.отчет)
Gemmo Chat: общайтесь с ИИ, чтобы запросить создание изображений и видео. (genmo.ai)
Kaiber: генерация видео по тексту или изображениям. (kaiber.ai)