Машинное обучение — не новое слово в этом мире, но оно очень популярно. Итак, почему он так популярен? Один из ответов заключается в том, что алгоритм машинного обучения может делать прогнозы и принимать решения самостоятельно.

Эта статья даст вам общее представление о том, как вы можете написать собственный код ML, используя Python и его модули.

Мы собираемся использовать образец музыкального набора данных и сделать некоторые прогнозы. Большое спасибо программированию с Mosh. Посмотрите его видео на YouTube.

Предварительные условия

  1. набор музыкальных данных Нажмите, чтобы скачать
  2. Блокнот Jupyter (Анаконда)
  3. Базовые знания Python

Основное правило, которому нужно следовать при анализе ML:

  1. Импорт данных
  2. Проверить нулевые данные и очистить данные
  3. Попробуйте преобразовать в числовые данные (хорошо для ML)
  4. Разделите набор данных на обучение и тестирование
  5. Создать модель
  6. Делать предсказания
  7. Оценить и улучшить

Давайте начнем наше ML путешествие!

Откройте приложение Anaconda и запустите Jupyter Notebook.

Запустите новую записную книжку Python

Импорт некоторых модулей Python ML

импортировать панд как pd

Используйте pandas для чтения музыкальных CSV-файлов в Jupyter Notebook

df = pd.read_csv («путь к музыкальному файлу»)

#Проверить наличие нулевых данных

df.isnull().sum() #0 указывает, что в наборе данных нет нулевых значений

# Разделить набор данных для тестирования и обучения

x = df.drop(columns =["жанр"])
y = df["жанр"]

из sklearn.model_selection импорта train_test_split

x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 0,2)

#Хорошо, так что у нас все хорошо до сих пор. Мы проверили нулевые значения и разделили набор данных для обучения и тестирования.

#Примечание. Чем больше набор обучающих данных, тем точнее будут прогнозы.

#Выберите алгоритм машинного обучения

из sklearn.tree импортировать DecisionTreeClassifier

модель = DecisionTreeClassifier()

model.fit(x_train,y_train)

# Теперь, чтобы предсказать значения, следуйте приведенной ниже команде.

прогнозы = model.predict([[21,1]])

#[21,1] представляет возраст 21 год с полом Мужской, поскольку 1 = мужчина и 0 = женщина

предсказания

#Чтобы проверить точность вашего алгоритма машинного обучения -

из sklearn.metrics импорта precision_score

#вычисление точности
#score = показатель_точности(y_test,прогнозы)
#score

# Если оценка = 1, модель имеет точность 100%, 0,75 означает точность 75% и так далее.

# Актуальный скрипт для справки

импортировать pandas как pd
из sklearn.tree import DecisionTreeClassifier
из sklearn.model_selection MYPCDELLPC\\Desktop\\Python\\Project\\music\\music.csv")
x= df.drop(columns = ["жанр"])
y = df["жанр"]

x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 0,2)

model = DecisionTreeClassifier()
model.fit(x_train,y_tra#расчет точности
#score = precision_score(y_test,predictions)
#scorei
Predicts = model.predict(x_test)
предсказания

#Примечание — замените значение x_test на [Age,Gender].