Я работаю над системой поиска информации, используя MySQL с режимом естественного языка. Имеющиеся у меня данные аннотированы для рассмотрения различных категорий. Например. Обезьяна, кошка, собака будут помечены как «животные», а утка, воробей — как «птицы». Проблема в том, что я извлекаю документы на основе вхождений этих тегов.
Теперь у MySQL есть ограничение: если определенный термин встречается более чем на 50% во всех данных, этот термин не учитывается. Учитывая мое требование, я хочу, чтобы он оценивал все совпадающие термины, даже если конкретный термин встречается более чем на 50% во всех данных.
Я читал несколько вещей о сочетании Sphinx с MySQL для повышения эффективности поиска, но я не уверен, можно ли это применить в моей ситуации.
Пожалуйста, предоставьте решение этой проблемы