Потребление электроэнергии зданиями является важным фактором в использовании энергии и управлении затратами. Прогнозирование потребления электроэнергии может помочь оптимизировать использование энергии и минимизировать затраты. Это также может помочь выявить потенциальные проблемы с использованием энергии и дать возможность управляющим зданиями принять корректирующие меры.

I. Сбор данных:

Сбор данных является важным шагом в прогнозировании потребления электроэнергии в здании. Цель состоит в том, чтобы определить и собрать соответствующие данные из различных источников, таких как системы управления энергопотреблением зданий, счета за коммунальные услуги, данные о погоде и данные о занятости.

Мы собираемся использовать некоторые характеристики здания в качестве входных данных, чтобы иметь возможность прогнозировать их потребление. Вот пример:

Данные должны быть предварительно обработаны, чтобы гарантировать их точность и актуальность. Это включает в себя очистку и фильтрацию данных, обработку отсутствующих значений и обеспечение того, чтобы данные были в формате, пригодном для анализа. Качество данных имеет решающее значение для точных прогнозов.

II. Разработка функций:

Разработка функций включает в себя определение соответствующих функций, которые могут повлиять на потребление электроэнергии, таких как температура, влажность, время суток, день недели, занятость и использование оборудования. Цель состоит в том, чтобы извлекать, преобразовывать и выбирать функции с использованием статистических методов, таких как анализ основных компонентов (PCA) или алгоритмы выбора функций. Этот шаг важен для обеспечения того, чтобы модель могла фиксировать соответствующие закономерности и тенденции в данных. Нормализация также важна для обеспечения того, чтобы функции находились в одном масштабе.

III. Выбор модели:

Выбор модели включает определение подходящего алгоритма для прогнозирования потребления электроэнергии, такого как линейная регрессия, деревья решений или нейронные сети. Цель состоит в том, чтобы обучить и протестировать различные модели, чтобы определить наиболее точную и эффективную модель для задачи прогнозирования. Точность модели можно оценить с помощью различных показателей производительности, таких как среднеквадратическая ошибка (MSE) или коэффициент детерминации (R-квадрат). Точная настройка параметров модели может оптимизировать ее производительность.

Иногда есть наборы данных, к которым мы не можем применить модели машинного обучения, потому что данные не отражают ничего конкретного. Чтобы узнать, полезно это или нет, мы вычисляем базовый уровень набора данных и его метрику R2. Если R2 ‹ 0 или R2 ‹‹ 1, было бы неплохо обучить разные модели машинного обучения и посмотреть, какая из них лучше всего подходит.

На основе сравнения моделей линейной регрессии, K-ближайших соседей (KNN) и XGBoost для прогнозирования энергопотребления здания модель XGBoost оказалась наиболее эффективной моделью.

XGBoost — это мощный алгоритм машинного обучения, который особенно эффективен при обработке сложных и многомерных наборов данных. Это тип алгоритма повышения градиента, который использует комбинацию деревьев решений для прогнозирования. Этот алгоритм может фиксировать нелинейные отношения между переменными и эффективно обрабатывать пропущенные значения.

Напротив, линейная регрессия — это простая модель, которая предполагает линейную связь между входными и выходными переменными. Он может работать плохо, когда между переменными существуют нелинейные отношения, а также может быть чувствителен к выбросам в данных.

KNN — это непараметрический алгоритм, который делает прогнозы на основе подобия входных данных обучающим данным. Однако он может работать плохо, если набор данных многомерный и страдает от «проклятия размерности».

Заключение:

Таким образом, модель XGBoost превзошла линейную регрессию и KNN в прогнозировании энергопотребления здания, поскольку это мощный алгоритм, который может обрабатывать сложные и многомерные наборы данных, фиксировать нелинейные отношения между переменными и эффективно обрабатывать пропущенные значения.