Несмотря на важность, качество контента трудно определить, не прибегая к цикличности. Под качеством контента мы подразумеваем меру или совокупность мер, которые представляют ценность контента, независимую от конкретной информационной потребности любого искателя.
Другими словами, качество контента дополняет релевантность. В то время как релевантность измеряет, насколько хорошо контент соответствует информационной потребности искателя, качество является независимой от потребности мерой полезности или желательности контента.
Качество дополняет актуальность
Когда искатель выполняет задачу поиска информации, релевантность важна. Не только важный, но и необходимый: по определению нерелевантный контент не удовлетворяет требованию удовлетворения потребности пользователя в информации.
Но актуальность, хотя и необходимая, недостаточна.
Рассмотрим аналогию. Если вы голодны, то вся еда соответствует вашим потребностям. Но это не значит, что вы будете есть все, что вам положат на тарелку. У вас есть предпочтения среди возможных вариантов еды. Более того, хотя ваши предпочтения являются личными, они, вероятно, связаны с объективными характеристиками, такими как свежесть или сладость, которые в совокупности представляют качество пищи.
Возвращаясь к поиску: релевантность необходима, но качество контента — измеряемое объективно или субъективно — делает результат достаточным.
Измерение качества контента
Вообще говоря, есть две стратегии измерения качества контента. Первый заключается в использовании информации, доступной во время индексации. Во-вторых, использование поведения искателя в качестве источника имплицитных суждений.
Как мы используем информацию, доступную во время индексации? В простейшем случае у нас есть явные суждения о качестве, такие как оценки экспертов или пользователей. Если нет, мы можем получить показатель качества на основе имеющихся у нас данных, таких как измерение качества изображения с использованием его разрешения. Как правило, показатели качества могут исходить из необработанных данных, формул, настроенных вручную, или моделей с машинным обучением.
В качестве альтернативы мы можем использовать поведение искателя в качестве источника имплицитных суждений о качестве. Результаты, с которыми пользователи взаимодействуют или которые пропускают, содержат множество положительных и отрицательных неявных суждений. Но мы должны относиться к таким неявным суждениям с недоверием. Результаты должны быть релевантными, поскольку неприязнь пользователя к нерелевантным результатам может не отражаться на их качестве. Существует также предвзятость представления: пользователи могут взаимодействовать только с результатами, которые они видят, и с большей вероятностью будут взаимодействовать с результатами с самым высоким рейтингом. Тем не менее, поведение пользователей в поиске — отличный экономичный ресурс для измерения качества контента.
Эти две стратегии лучше всего работают вместе. Индекс является лучшим источником объективных данных, а поисковое поведение объединяет предпочтения искателей. Более того, мы можем извлечь то, что мы узнаем из поведения искателя, и внести это в индекс. И наоборот, мы можем обучать модели, используя историческое поведение поиска в качестве меток, а затем применять модели к новому или непросматриваемому контенту.
Сочетание качества с актуальностью
Качество контента должно играть ключевую роль в ранжировании результатов поиска. Как я уже писал в другом месте, рейтинг и релевантность — связанные, но разные понятия. Релевантность измеряет, соответствует ли результат потребностям искателя, а ранжирование сортирует релевантные результаты на основе искателя и бизнес-целей.
В той степени, в которой искатель и бизнес-цели совпадают, это равносильно сортировке релевантных результатов на основе их качества. Как только поисковая система установит релевантность, ранжирование должно быть сосредоточено на сигналах, не зависящих от запроса, а качество контента является фундаментальным сигналом, независимым от запроса. Нам нужно немного больше нюансов, если мы не моделируем релевантность как двоичную. Тем не менее, качество контента должно гарантировать, что более желательные релевантные результаты ранжируются перед менее желательными релевантными результатами. Самое главное, это не должно перевешивать актуальность.
Краткое содержание
Как мы уже говорили во введении, качество контента трудно определить, не прибегая к цикличности. Но это не умаляет его значения. Качество контента измеряет контент независимо от потребностей искателя, дополняя релевантность. Хотя релевантность необходима, качество — это то, что делает результат достаточным, чтобы удовлетворить пользователя. И на практике поисковая система должна ранжировать релевантные результаты по их качеству.
Предыдущая: Структура контента
Следующая: Модерация контента