Использование хэш-карты

В программировании нам часто приходится брать набор данных и проходить его, чтобы найти заданное значение или выполнить действие. Нам, новичкам, первое, что обычно приходит на ум, — это использование цикла; мы просматриваем каждый элемент наших данных, пока не получим решение, соответствующее нашим условиям. Это отлично работает для большинства мелкомасштабных поисков и базовых вычислений, но когда набор данных становится слишком большим или нам нужно вернуться к значениям, которые мы уже передали в нашем цикле, мы можем увидеть некоторые недостатки традиционного цикла.

Если вы изучали программирование, вы, скорее всего, когда-то видели или слышали о хеш-картах, они повсюду. Когда я впервые начал изучать, я был сбит с толку тем, что такое хэш-карта, как будто это был какой-то мистический тип данных, который я еще не открыл, или что-то, что существует только в определенных языках. Я был смущен этим и, казалось, не нуждался в этом, поэтому я просто продолжал работать. Я написал еще один пост здесь о построении структуры данных двоичного дерева и о том, как мы можем использовать ее для управления большими наборами данных; оказывается, бинарное дерево — это реализация хеш-карты!

Так что же такое хэш-карта? Короче говоря, это структура данных, которая использует пары ключ-значение для отслеживания значений, которые были переданы в нашей итерации. Вот простой пример, чтобы показать концепцию.

const arrayToMap = [3,6,4,12,1,23,8,10,26]
//I am manually entering the elements here for the hash map
//the key will be the valueand the value is the index
const hashMap = {3:0, 6:1, 4:2, 12:3, 1:4, 23:5, 8:6, 10:7, 26:8}

Выше у нас есть неупорядоченный массив и хеш-карта значений массива. Мы можем видеть значение, за которым следует соответствующий индекс из исходного массива. Теперь мы можем упорядочить хеш-карту по значениям и при этом сохранить позицию в исходном массиве. Это избавляет нас от необходимости управлять тем, как добавлять новые значения в нужное место. Мы просто помещаем их в массив и можем управлять положением в хэше. Ниже приведен тот же хеш, но упорядоченный по значению, а не по индексу.

const hashMap = {1:4, 3:0, 4:2, 6:1, 8:6, 12:3, 10:7, 23:5, 26:8}

Это может быть действительно мощно! Теперь у нас есть исходные данные в массиве, полностью нетронутые, и вся информация, необходимая нам для выполнения наших действий, И, поскольку мы сохранили исходные индексы в качестве ключей в нашем хэше, мы МОЖЕМ очень легко манипулировать исходным массивом. Нам просто нужно найти значение в нашем хеше и использовать его ключ для доступа к этому значению в исходном массиве.

arrayToMap[0] //this returns 3 since our value at index 0 is 3
arrayToMap[0] = 20 //changes the value from 3 to 20

Довольно просто, верно!?

Теперь мы можем использовать эту структуру, чтобы попытаться решить проблему. Давайте рассмотрим проблему TwoSums. В этой задаче нам предлагается взять массив чисел и найти ДВА значения, которые в сумме дают заданное целевое число. Когда я посмотрел на эту проблему, я сразу же начал использовать циклы и настроил решение методом грубой силы.

const twoSum = (array, target) => {
    let indexes = []

    for(let i = 0; i < array.length; i++){
       for(let j = i + 1; j < array.length; j++){
          if (array[i] + array[j] === target) {
            indexes.push(i);
            indexes.push(j);
          }
       }
    }
    return indexes;
}

Это берет первое значение массива и добавляет его ко всем остальным значениям в массиве, а затем проверяет, равно ли оно целевому числу. Это прекрасное решение, и оно хорошо работает, если набор данных не слишком велик, но есть способ получше. Ниже мы реализуем хеш-карту для отслеживания уже переданных значений, и я объясню, почему это важно, после того, как мы рассмотрим функцию.

const twoSum = (array, target) => {
  const hashMap = {}
  for (let i = 0; i < array.length; i++) {
     hashMap[array[i]] = i;
    }
  for (let i = 0; i < array.length; i++) {
    let diff = target - array[i]
    if (hashMap[diff] !== undefined && hashMap[diff] !== i) {
      return [hashMap[diff], i]
    }
  }
}

В этой функции мы сначала создаем нашу хеш-карту, перебирая массив и назначая пары ключ-значение переменной hashMap. Поскольку у нас есть ВСЕ наши значения внутри этой хеш-карты, мы можем легко просто проверить число, которое нам нужно. Мы определяем необходимое число, вычитая текущее значение из целевого числа, затем проверяем, есть ли это значение в нашей хеш-карте. Мы можем искать значение в хеш-карте, используя тот же синтаксис, что и для доступа к индексу массива, и нам не нужно перебирать каждый элемент, чтобы найти его.

hashMap[x] //x = the number you are searching for

Мы можем сделать это, так как мы установили все ключи в фактические значения, а значение в индекс!

Внедряя метод хеширования, мы значительно сокращаем наши накладные расходы. Теперь вместо того, чтобы сравнивать каждый элемент массива с одним числом за раз и проверять, соответствует ли оно нашему условию, вместо этого мы просто выясняем, какое число необходимо для выполнения условия, и проверяем, есть ли это число в нашем наборе данных с помощью хэш-карты. . Это означает гораздо меньше итераций, но все же очень читаемый код. Понимание различных структур данных может дать нам больше возможностей для эффективного управления нашими данными, и многие структуры основаны на этой концепции хэш-карты, теперь нам просто нужно попрактиковаться в ее использовании.

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning