Как работает хеширование с учетом местоположения, часть 4 (машинное обучение)

BCD: эксперимент с базой данных для сравнения двоичных файлов между различными архитектурами с использованием алгоритмов хэширования с учетом местоположения (arXiv)

Аннотация: Имея двоичный исполняемый файл без исходного кода, трудно определить, что делает каждая функция в двоичном файле путем обратного проектирования, и еще сложнее без предварительного опыта и контекста. В этой статье мы выполнили сравнение эффективности различных функций хеширования при обнаружении похожих расширенных фрагментов кода LLVM IR, а также представили разработку и реализацию платформы для кросс-архитектурной базы данных поиска подобия двоичного кода с использованием MinHash в качестве выбранного алгоритма хеширования. через SimHash, SSDEEP и TLSH. Мотивация состоит в том, чтобы помочь реинжинирингу быстро получить контекст функций в неизвестном двоичном файле, сравнив его с базой данных известных функций. Код для этого проекта с открытым исходным кодом, его можно найти по адресу https://github.com/h4sh5/bcddb.

2. Факторизация агрегированной нелинейной матрицы соседства с учетом местоположения для онлайн-анализа разреженных больших данных (arXiv)

Автор: Zixuan Li, Hao Li, Kenli Li, Fan Wu, Lydia Chen, Keqin Li.

Аннотация: матричная факторизация (MF) может извлекать признаки низкого ранга и интегрировать информацию о распределении многообразия данных из многомерных данных, которые могут учитывать информацию о нелинейной окрестности. Таким образом, MF привлекла широкое внимание к низкоранговому анализу разреженных больших данных, например, рекомендательных систем совместной фильтрации (CF), социальных сетей и качества обслуживания. Однако существуют следующие две проблемы: 1) огромные вычислительные затраты на построение матрицы сходства графов (GSM) и 2) огромные накладные расходы памяти для промежуточной GSM. Следовательно, MF на основе GSM, например, MF ядра, регуляризованный графом MF и т. д., не могут быть непосредственно применены к низкоранговому анализу разреженных больших данных на облачных и пограничных платформах. Чтобы решить эту трудноразрешимую проблему для анализа разреженных больших данных, мы предлагаем агрегированное MF с учетом местоположения (LSH) (LSH-MF), которое может решить следующие проблемы: 1) Предлагаемая вероятностная проекционная стратегия LSH-MF позволяет избежать построения GSM. Кроме того, LSH-MF может удовлетворить требования точной проекции разреженных больших данных. 2) Для запуска LSH-MF для тонкого распараллеливания и онлайн-обучения на графических процессорах мы также предлагаем CULSH-MF, который работает с распараллеливанием CUDA. Экспериментальные результаты показывают, что CULSH-MF может не только сократить время вычислений и объем памяти, но и получить более высокую точность. По сравнению с моделями глубокого обучения, CULSH-MF может не только сэкономить время обучения, но и добиться такой же точности.

смотрите также:

Новые материалы

Как создать диаграмму градиентной кисти с помощью D3.js

Резюме: Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…

Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей

В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning