1. Асимптотическая эквивалентность алгоритма среднего сдвига и ClusterTree (arXiv)

Автор: Эри Ариас-Кастро, Ваньли Цяо

Аннотация. Два важных непараметрических подхода к кластеризации появились в 1970-х годах: кластеризация по наборам уровней или кластерному дереву, как было предложено Хартиганом, и кластеризация по градиентным линиям или градиентному потоку, как предложили Фукунага и Хостелер. В недавней статье мы аргументируем тезис о том, что эти два подхода принципиально одинаковы, показывая, что градиентный поток обеспечивает способ перемещения по дереву кластеров. В более сильном случае мы сталкиваемся с тем фактом, что дерево кластеров не определяет раздел всей поддержки базовой плотности, в отличие от градиентного потока. В настоящей статье мы разрешим эту загадку, предложив два способа получения разбиения из дерева кластеров — каждый из них очень естественен сам по себе — и показав, что оба они сводятся к разбиению, заданному градиентным потоком при стандартных условиях. предположения о плотности выборки

2. Автоматическая кластеризация многомерных данных с помощью алгоритма средневзвешенного сдвига признаков (arXiv)

Автор: Саптарши Чакраборти, Деболина Пол, Свагатам Дас.

Вывод:средний сдвиг — это простая интерактивная процедура, которая постепенно сдвигает точки данных в сторону режима, который обозначает наибольшую плотность точек данных в регионе. Алгоритмы среднего сдвига эффективно использовались для шумоподавления данных, поиска режима и определения количества кластеров в наборе данных автоматическим способом. Однако достоинства среднего сдвига быстро исчезают по мере увеличения размерности данных, и только несколько функций содержат полезную информацию о кластерной структуре данных. Мы предлагаем простой, но элегантный вариант среднего сдвига, взвешенный по признакам, чтобы эффективно изучить важность признаков и, таким образом, распространить преимущества среднего сдвига на многомерные данные. Полученный алгоритм не только превосходит обычную процедуру кластеризации среднего сдвига, но также сохраняет свою вычислительную простоту. Кроме того, предлагаемый метод имеет строгие теоретические гарантии сходимости и скорость сходимости не менее кубического порядка. Эффективность нашего предложения тщательно оценивается путем экспериментального сравнения с базовыми и современными методами кластеризации как на синтетических, так и на реальных наборах данных.

3. Исследование метода построения ездового цикла транспортного средства на основе кластеризации MeanShift(arXiv)

Автор:Юнцзян Хэ

Аннотация: В этом исследовании предлагается новый метод построения ездового цикла на основе кластеризации среднего смещения для решения проблем, существующих в традиционном методе микропоездок. Во-первых, путем обработки и разделения данных о движении в реальных дорожных условиях получается 1701 кинематический сегмент. Во-вторых, для каждого сегмента рассчитываются 12 кинематических параметров, а размерность параметров снижается посредством анализа главных компонентов (PCA). Для классификации всех циклов на три типа с помощью алгоритма среднего сдвига выбраны три главных компонента. Наконец, согласно принципу минимального отклонения, репрезентативные микропоездки выбираются из каждого типа цикла для завершения построения окончательного ездового цикла. Кроме того, метод построения в этой статье сравнивается с методом построения микропоездок с помощью кластеризации K-средних. Результаты показывают, что метод построения с помощью кластеризации среднего сдвига может более эффективно отражать реальные данные вождения. Это исследование реализует инновации в методе построения микропоездок и обеспечивает предварительную теоретическую основу для формулирования стандартов рабочего состояния автомобилей, управления энергией транспортных средств с новой энергией и оптимального управления динамикой транспортных средств в беспилотных транспортных средствах.

4. Более быстрый средний сдвиг: кластеризация с ускорением на графическом процессоре для сегментации и отслеживания ячеек на основе косинусного встраивания (arXiv)

Автор: Мэнъян Чжао, Аадарш Джа, Куан Лю, Брайан А. Миллис, Анита Махадеван-Джансен, Ле Лу, Беннетт А. Лэндман, Мэттью Дж. Тискац, Юанкай Хо

Аннотация: В последнее время алгоритмы глубокого обучения на основе одноэтапного встраивания привлекают все большее внимание при сегментации и отслеживании клеток. По сравнению с традиционным двухэтапным подходом сегментировать, затем связать, одноэтапный алгоритм не только одновременно обеспечивает согласованную сегментацию и отслеживание ячеек экземпляра, но и обеспечивает более высокую производительность при различении неоднозначных пикселей на границах и перекрытиях. Однако развертывание алгоритма на основе встраивания ограничено низкой скоростью вывода (например, около 1–2 минут на кадр). В этом исследовании мы предлагаем новый алгоритм Faster Mean-shift, который устраняет вычислительное узкое место, связанное с сегментацией и отслеживанием клеток на основе встраивания. В отличие от предыдущих алгоритмов быстрого среднего сдвига с ускорением на графическом процессоре, вводится новая политика онлайн-оптимизации начальных значений (OSOP) для адаптивного определения минимального числа начальных значений, ускорения вычислений и экономии памяти графического процессора. Благодаря моделированию внедрения и эмпирической проверке с помощью четырех когорт из задачи отслеживания ячеек ISBI предложенный алгоритм Faster Mean-shift достиг 7–10-кратного ускорения по сравнению с современным алгоритмом сегментации и отслеживания экземпляров ячеек на основе внедрения. Наш алгоритм Faster Mean-shift также показал самую высокую скорость вычислений по сравнению с другими тестами GPU с оптимизированным потреблением памяти. Faster Mean-shift — это модель plug-and-play, которую можно использовать для других выводов кластеризации на основе встраивания пикселей для анализа медицинских изображений. (Модель plug-and-play общедоступна: https://github.com/masqm/Faster-Mean-Shift)