WedX - журнал о программировании и компьютерных науках

Странное поведение при сравнении значений класса enum

Я работал над некоторым кодом разбора JSON, используя прекрасный nlohmann::json, и чтобы помочь создавать полезные сообщения об ошибках, я сделал себе функцию для вывода типа объекта JSON. Эта функция принимает json::value_t, который является перечисляемым классом, определенным точно следующим образом в json.hpp:

enum class value_t : std::uint8_t {
    null,
    object,
    array,
    string,
    boolean,
    number_integer,
    number_unsigned,
    number_float,
    discarded
};

Вот моя функция. Я передаю ему json::value_t и ожидаю получить строку, описывающую его.

std::string to_string(json::value_t type){
    static const std::map<json::value_t, std::string> mapping = {
        {json::value_t::null,            "null"},
        {json::value_t::object,          "an object"},
        {json::value_t::array,           "an array"},
        {json::value_t::string,          "a string"},
        {json::value_t::boolean,         "a boolean"},
        {json::value_t::number_integer,  "an integer"},
        {json::value_t::number_unsigned, "an unsigned integer"},
        {json::value_t::number_float,    "a floating point number"}
    };
    auto it = mapping.find(type);
    if (it != mapping.end()){
        return it->second;
    }
    return "a mystery value";
}

Но во время отладки в Visual Studio я был очень напуган, когда эта функция вернула строку "an integer", когда я совершенно точно передал ее json::value_t::number_float.

Опасаясь худшего и желая быстрого исправления, я написал следующую альтернативу, которая идентична за исключением того, что перечисление всегда приводится к своему базовому типу перед его использованием:

std::string to_string_with_cast(json::value_t type){
    using ut = std::underlying_type_t<json::value_t>;
    static const std::map<ut, std::string> mapping = {
        {static_cast<ut>(json::value_t::null),            "null"},
        {static_cast<ut>(json::value_t::object),          "an object"},
        {static_cast<ut>(json::value_t::array),           "an array"},
        {static_cast<ut>(json::value_t::string),          "a string"},
        {static_cast<ut>(json::value_t::boolean),         "a boolean"},
        {static_cast<ut>(json::value_t::number_integer),  "an integer"},
        {static_cast<ut>(json::value_t::number_unsigned), "an unsigned integer"},
        {static_cast<ut>(json::value_t::number_float),    "a floating point number"}
    };
    auto it = mapping.find(static_cast<ut>(type));
    if (it != mapping.end()){
        return it->second;
    }
    return "a mystery value";
}

Это сработало. Прохождение json::value_t::number_float привело к "a floating point number", как я и ожидал.

Все еще любопытно и подозревая, что одна из причуд Microsoft или Undefined Behavior скрывается в другом месте в моей довольно большой базе кода, я провел следующий тест. на g++:

    std::cout << "Without casting enum to underlying type:\n";
    std::cout << "null:   " << to_string(json::value_t::null) << '\n';
    std::cout << "object: " << to_string(json::value_t::object) << '\n';
    std::cout << "array:  " << to_string(json::value_t::array) << '\n';
    std::cout << "string: " << to_string(json::value_t::string) << '\n';
    std::cout << "bool:   " << to_string(json::value_t::boolean) << '\n';
    std::cout << "int:    " << to_string(json::value_t::number_integer) << '\n';
    std::cout << "uint:   " << to_string(json::value_t::number_unsigned) << '\n';
    std::cout << "float:  " << to_string(json::value_t::number_float) << '\n';

    std::cout << "\nWith casting enum to underlying type:\n";
    std::cout << "null:   " << to_string_with_cast(json::value_t::null) << '\n';
    std::cout << "object: " << to_string_with_cast(json::value_t::object) << '\n';
    std::cout << "array:  " << to_string_with_cast(json::value_t::array) << '\n';
    std::cout << "string: " << to_string_with_cast(json::value_t::string) << '\n';
    std::cout << "bool:   " << to_string_with_cast(json::value_t::boolean) << '\n';
    std::cout << "int:    " << to_string_with_cast(json::value_t::number_integer) << '\n';
    std::cout << "uint:   " << to_string_with_cast(json::value_t::number_unsigned) << '\n';
    std::cout << "float:  " << to_string_with_cast(json::value_t::number_float) << '\n';
}

И я был действительно напуган, увидев то же поведение, что и Visual Studio:

Without casting enum to underlying type:
null:   null
object: an object
array:  an array
string: a string
bool:   a boolean
int:    an integer
uint:   an integer
float:  an integer
With casting enum to underlying type:
null:   null
object: an object
array:  an array
string: a string
bool:   a boolean
int:    an integer
uint:   an unsigned integer
float:  a floating point number

Почему это происходит? Похоже, что number_float и number_unsigned считаются равными number_integer. Но, согласно этому ответу, нет ничего особенного в сравнении обычного enum. Есть ли отличия в использовании enum class? Это стандартное поведение?


EDIT: Вот гораздо более простой источник путаницы: кажется, что если я использую < для сравнения любой пары последних трех значений класса enum, он всегда возвращает false. Это, вероятно, сердце моей проблемы выше. Почему такое странное поведение? Следующий вывод взят из этого живого примера.

number_integer  < number_integer  : false
number_integer  < number_unsigned : false
number_integer  < number_float    : false
number_unsigned < number_integer  : false
number_unsigned < number_unsigned : false
number_unsigned < number_float    : false
number_float    < number_integer  : false
number_float    < number_unsigned : false
number_float    < number_float    : false
null            < number_integer  : true
null            < number_unsigned : true
null            < number_float    : true
bool            < number_integer  : true
bool            < number_unsigned : true
bool            < number_float    : true

  • Возможно, вы пропустили бесплатную operator< для value_t. 14.06.2019
  • Было бы лучше, если бы вопрос был опубликован Minimal, Reproducible Example вместо набора фрагментов. 14.06.2019
  • @RetiredNinja Вы правы. Я должен был прокрутить исходный код дальше вниз. 14.06.2019
  • @RetiredNinja ой ... кажется ошибкой из-за того, что обычно считается хорошо спроектированной библиотекой (предоставление operator<, которое не дает строгого слабого порядка) 14.06.2019
  • @MM на самом деле дает строгий слабый порядок, он просто считает эти 3 равными. 14.06.2019
  • @Слава, я вижу. Я подумал, что конструктор map отклонит равные ключи, очевидно, нет :) 14.06.2019
  • Привет, я автор nlohmann/json. Если у вас есть какие-либо предложения по улучшению сообщений об ошибках синтаксического анализа, рассмотрите возможность создания проблемы на github. .com/nlohmann/json/issues/new/choose, чтобы мы могли это обсудить. 30.06.2019
  • @NielsLohmann спасибо, что нашли это и ответили! Моя проблема была связана с моим собственным синтаксическим анализатором, который десериализует правильно сформированный объект JSON в пользовательский тип данных. Я не знаком с сообщениями об ошибках встроенного парсера, но у меня не было с ним проблем. Я понимаю мотивацию такого поведения сравнения. Это просто бросило вызов моим ожиданиям в этом невинном примере. Возможно, в документацию для json::type() можно добавить комментарий о том, что number_* значения сравниваются равными 03.07.2019

Ответы:


1

У вас есть эта проблема, потому что для этого перечисления предусмотрено operator<:

inline bool operator<(const value_t lhs, const value_t rhs) noexcept
{
    static constexpr std::array<std::uint8_t, 8> order = {{
            0 /* null */, 3 /* object */, 4 /* array */, 5 /* string */,
            1 /* boolean */, 2 /* integer */, 2 /* unsigned */, 2 /* float */
        }
    };

    const auto l_index = static_cast<std::size_t>(lhs);
    const auto r_index = static_cast<std::size_t>(rhs);
    return l_index < order.size() and r_index < order.size() and order[l_index] < order[r_index];
}

из здесь

И в соответствии с этим кодом integer, unsigned и float считаются равными, отсюда и ваша проблема.

В качестве решения вы можете использовать свой метод или просто заменить компаратор по умолчанию на лямбду или предоставить специализацию для std::less, которая не использует этот оператор.

14.06.2019
  • Причина такого порядка заключается в том, что точный тип числа может быть определен синтаксическим анализатором и, следовательно, прозрачен для пользователя библиотеки. Таким образом, я хотел, чтобы все числа вели себя одинаково, чтобы избежать сюрпризов в будущем. 30.06.2019
  • Новые материалы

    Объяснение документов 02: BERT
    BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

    Как проанализировать работу вашего классификатора?
    Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

    Работа с цепями Маркова, часть 4 (Машинное обучение)
    Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

    Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
    Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

    Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
    Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

    Учебные заметки: создание моего первого пакета Node.js
    Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

    Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
    Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


    Для любых предложений по сайту: [email protected]