Управление контекстом LLM — проблема рюкзака

LLM могут быть более полезными и менее подверженными галлюцинациям, когда они могут читать соответствующие документы, веб-страницы и предыдущие разговоры, прежде чем отвечать на новый вопрос пользователя. К сожалению, LLM имеют конечную длину контекста, которая может быть быстро превышена при запросе на чтение этих внешних ресурсов. Так что надо как-то решить, какие ресурсы стоит попросить прочитать LLM, а получается, что это проблема ранца.

Обзор рюкзака

Задача о рюкзаке — это классическая задача динамического программирования, которая обычно начинается со следующего описания:

Вор, грабящий магазин, находит N предметов. Товар i стоит v[i] долларов и весит w[i] фунтов, где v[i] и w[i] — целые числа. Вор хочет взять как можно более ценный груз, но может унести в своем рюкзаке не более W фунтов за некоторое целое число W.

Какие предметы должен украсть вор?

Вышеприведенное технически представляет собой вариант 0–1 задачи о рюкзаке, потому что вор может украсть либо 0 из 1 копий каждого предмета (а не несколько копий или дробные копии).

Решить, что показать LLM

Давайте представим, что вы используете LLM для ответа на вопрос пользователя и хотите, чтобы он прочитал как можно больше соответствующих документов, прежде чем ответить. Каждый документ стоит LLM определенное количество токенов для чтения, что равно w[i]. Кроме того, у каждого документа есть некоторое значение v[i], которое можно вычислить различными способами в зависимости от ваших целей. Например, вы можете использовать эмбеддинги и косинусное сходство для оценки документов на основе того, насколько они семантически похожи на новый вопрос пользователя. Возможно, вы также хотите уменьшить оценку старых документов, поскольку они с большей вероятностью содержат устаревшую информацию.

После того, как каждый документ имеет известную стоимость и значение, нам нужно определиться с бюджетом токена W. Максимальное значение для W равно L — P — R, где L — длина контекста LLM, P — это длина приглашения, предшествующего выбранным документам, а R — это количество маркеров, зарезервированных для ответа LLM. Теперь вы можете подключить все эти входные данные к Knapsack, и вам будет возвращена подборка документов, наиболее достойных чтения с учетом вашего бюджета.

Другие соображения

Вместо этого вы можете захотеть использовать жадное приближение решения задачи о рюкзаке, потому что оно работает за O(N log N) и имеет очень простую стратегию: сначала выбираются элементы с наивысшим отношением ценности к весу. Решение динамического программирования работает за время O(N * W), которое является псевдополиномиальным, но в некоторых случаях может быть гораздо более оптимальным.
Разделение документа может быть жизнеспособной стратегией для работы с документами, содержащими нерелевантную информацию. Однако решить, как разделить документ, сохранив его значение, кажется нетривиальной задачей. Может быть, LLM сам мог предварительно обработать и обобщить документы?

Найди меня в Твиттере или на моем личном сайте.

Первоначально опубликовано на https://www.awelm.com 9 июля 2023 г.

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning