В моем последнем обзоре кода я сделал прогнозы продаж Walmart, используя алгоритм RandomForestregressor sklearn, и добился очень хороших результатов, используя эту модель. Сообщение в блоге с этими прогнозами можно найти здесь: https://medium.com/mlearning-ai/use-random-forest-to-predict-on-walmart-sales-ae6ebadb569b

В этом посте я собираюсь просмотреть код, в котором я снова прогнозировал продажи, но на этот раз я использовал искусственную нейронную сеть Keras Tensorflow, или ANN. Хорошо использовать несколько алгоритмов и выбрать тот, который лучше всего работает с предоставленными данными. При использовании этой методологии станет очевидно, что некоторые модели будут работать лучше, чем другие, для каждого набора данных, но неизвестно, какая модель работает лучше, пока они не будут использованы.

В этом сообщении блога я использовал набор данных из конкурса сообщества Kaggle, который можно найти здесь: https://www.kaggle.com/competitions/predicting-sales-quantity-in-our-dynamic-gridworld.

Я написал программу на Python, используя бесплатный онлайн-блокнот Jupyter Notebook от Kaggle.

Создав программу, я импортировал библиотеки, которые мне понадобятся для ее выполнения, а именно:

  1. Numpy для создания массивов numpy и выполнения числовых вычислений,
  2. Pandas для создания фреймов данных и серий, а также обработки данных.
  3. Чтобы войти в операционную систему и получить файлы, которые будут использоваться в программе,
  4. Sklearn для обеспечения функций машинного обучения,
  5. Tensorflow для создания нейронной сети,
  6. Matplotlib для визуализации данных и
  7. Сиборн для статистической визуализации данных.

Я установил начальное значение для генератора псевдослучайных чисел, используя библиотеки tensorflow и numpy.

Затем я использовал библиотеку os для получения файлов из операционной системы, которые будут использоваться в программе: