Генеративный ИИ, обучение на примерах и авторское право

TL;DR: авторское право в первую очередь существует для поощрения творчества. Использование генеративного ИИ не должно автоматически подразумевать нарушение авторских прав, и каждый результат должен оцениваться с точки зрения его достоинств, как и другие существующие способы создания.

На протяжении многих лет я много писал о том, как искусственный интеллект изменит экономику. Я постараюсь не повторяться здесь, но суть в том, что ИИ неизбежно изменит то, как мы ведем бизнес (и расстроит ряд секторов из-за его разрушения), но это приведет к чистой выгоде для человечества. Вместо этого в этом посте я сосредоточусь на опровержении аргумента о том, что генеративные модели, такие как Stable Diffusion и GitHub Copilot, необходимо отменить, поскольку они потенциально нарушают закон об авторском праве.

Это полезная, хотя и слишком упрощенная метафора, чтобы сказать, что модели ИИ учатся так же, как и люди: изучая большой набор примеров, и люди, и модели ИИ учатся путем подражания. Один из первых советов, который дают начинающим авторам, — прочитать как можно больше книг. Между тем, подающих надежды визуальных художников обычно поощряют смотреть и черпать вдохновение из искусства других людей. Однако, когда писатели детективных рассказов вдохновляются Шерлоком Холмсом Конан Дойля или Пуаро Кристи, они не обязаны платить этим авторам гонорары, за исключением случаев, когда они изначально покупают свои книги. Из этого следует, что обучение моделей ИИ на общедоступных художественных произведениях (таких как интернет-фанфики и искусство) не следует рассматривать как что-то необычное. Это означало бы, что каждый, кто был вдохновлен другими художниками на творчество, по закону обязан платить этим создателям за «кражу» их работ.

У людей, незнакомых с ИИ, иногда создается впечатление, что все, что делает ИИ, — это считывает обучающие данные, такие как текст и изображения, и выдает их обратно оптом. Это неверно. Не вдаваясь в технические детали, большинство моделей ИИ работают путем оптимизации для достижения цели, а не просто копируют обучающие данные (фактически, большинство исследователей машинного обучения наказывают модели, которые делают это). Для генеративного ИИ это означает изучение определенных характеристик целевого вывода и создание вывода, соответствующего этим характеристикам. Это аналогично тому, как создатели-люди изучают техники своих более опытных сверстников, чтобы учиться у них.

Однако пользователи генеративных моделей должны проявлять особую бдительность и проверять, не нарушают ли их результаты закон об авторском праве, прежде чем публиковать их. Если автор, прочитавший всю библиографию Стивена Кинга, вдохновлен на написание рассказов в стиле Кинга, это не должно считаться нарушением авторских прав. Однако, если они скопируют полный текст «Побега из Шоушенка» и опубликуют его как свой собственный, это будет нарушением авторских прав. Этого легче избежать при создании искусства традиционным ручным способом, но такого же уровня усердия следует ожидать от пользователей генеративных моделей, которые хотят публиковать свои результаты. (Конечно, это тоже можно автоматизировать — уже существует множество инструментов для проверки на плагиат, и подобную систему можно создать для изображений.)

До сих пор в этом посте я сосредоточивался на том, почему рассмотрение всех результатов генеративного ИИ как нарушения авторских прав не согласуется с применением закона об авторском праве в аналогичных ручных сценариях, но я не касался того, помогает ли такой подход творчеству или мешает ему. . Хотя общество (справедливо) укоренило в большинстве из нас добродетель ценить оригинальность, важно помнить, что это полезно, когда порождает больше творчества. Фактически, существует множество аргументов против так называемых «авторских троллей», когда авторское право продлевается дольше, чем необходимо, в результате чего другим авторам запрещается использовать их работу. Поэтому авторское право полезно для общества, когда оно поощряет творчество.

Имея это в виду, можно утверждать, что преимущества генеративного ИИ (где люди могут создавать больше произведений искусства, поскольку они сосредотачиваются на творческом направлении, а не на рутине ремесла) перевешивают недостатки. Таким образом, генеративный ИИ создает избыток творческой продукции, что позволяет людям пользоваться его преимуществами с меньшими затратами. Подавление этого развития бюрократической волокитой в области интеллектуальной собственности на самом деле будет препятствовать общему творческому результату общества. Генеративный ИИ может даже побудить традиционных художников бросить вызов передовым достижениям в своей области, поскольку им нужно по-настоящему открыть новые горизонты, чтобы создать то, что модель ИИ не может. Таким образом, модели ИИ служат только для расширения наших возможностей как общества.

Виктор Анджело Бланкада – писатель и менеджер по обработке и анализу данных.