История начинается в марте 2017 года, когда мой начальник сказал, что автоматически распознавать 3D-тела практически невозможно. То, что один считает невозможным, бросает вызов другому.
Итак, проблема заключается в следующем: в качестве входных данных используется трехмерное тело сетки (необработанные треугольники и вершины). Вероятности класса как результат.
Я нашел несколько разных подходов к этой проблеме. Некоторые из них:
- Масштабируйте тело и нарежьте его на воксели. Поток воксели в NN.
- Вычислить огромные дескрипторы. Скормите их классификатору.
- Возьмите проекцию тела с нескольких сторон, попробуйте распознать их с помощью отдельного классификатора, а затем передать метаклассификатору.
Хочу подробно рассказать об относительно простом и эффективном подходе под названием DeepPano. Здесь мы начнем в следующий раз.