Машинное обучение — не новое слово в этом мире, но оно очень популярно. Итак, почему он так популярен? Один из ответов заключается в том, что алгоритм машинного обучения может делать прогнозы и принимать решения самостоятельно.
Эта статья даст вам общее представление о том, как вы можете написать собственный код ML, используя Python и его модули.
Мы собираемся использовать образец музыкального набора данных и сделать некоторые прогнозы. Большое спасибо программированию с Mosh. Посмотрите его видео на YouTube.
Предварительные условия
- набор музыкальных данных Нажмите, чтобы скачать
- Блокнот Jupyter (Анаконда)
- Базовые знания Python
Основное правило, которому нужно следовать при анализе ML:
- Импорт данных
- Проверить нулевые данные и очистить данные
- Попробуйте преобразовать в числовые данные (хорошо для ML)
- Разделите набор данных на обучение и тестирование
- Создать модель
- Делать предсказания
- Оценить и улучшить
Давайте начнем наше ML путешествие!
Откройте приложение Anaconda и запустите Jupyter Notebook.
Запустите новую записную книжку Python
Импорт некоторых модулей Python ML
импортировать панд как pd
Используйте pandas для чтения музыкальных CSV-файлов в Jupyter Notebook
df = pd.read_csv («путь к музыкальному файлу»)
#Проверить наличие нулевых данных
df.isnull().sum() #0 указывает, что в наборе данных нет нулевых значений
# Разделить набор данных для тестирования и обучения
x = df.drop(columns =["жанр"])
y = df["жанр"]
из sklearn.model_selection импорта train_test_split
x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 0,2)
#Хорошо, так что у нас все хорошо до сих пор. Мы проверили нулевые значения и разделили набор данных для обучения и тестирования.
#Примечание. Чем больше набор обучающих данных, тем точнее будут прогнозы.
#Выберите алгоритм машинного обучения
из sklearn.tree импортировать DecisionTreeClassifier
модель = DecisionTreeClassifier()
model.fit(x_train,y_train)
# Теперь, чтобы предсказать значения, следуйте приведенной ниже команде.
прогнозы = model.predict([[21,1]])
#[21,1] представляет возраст 21 год с полом Мужской, поскольку 1 = мужчина и 0 = женщина
предсказания
#Чтобы проверить точность вашего алгоритма машинного обучения -
из sklearn.metrics импорта precision_score
#вычисление точности
#score = показатель_точности(y_test,прогнозы)
#score
# Если оценка = 1, модель имеет точность 100%, 0,75 означает точность 75% и так далее.
# Актуальный скрипт для справки
импортировать pandas как pd
из sklearn.tree import DecisionTreeClassifier
из sklearn.model_selection MYPCDELLPC\\Desktop\\Python\\Project\\music\\music.csv")
x= df.drop(columns = ["жанр"])
y = df["жанр"]
x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 0,2)
model = DecisionTreeClassifier()
model.fit(x_train,y_tra#расчет точности
#score = precision_score(y_test,predictions)
#scorei
Predicts = model.predict(x_test)
предсказания
#Примечание — замените значение x_test на [Age,Gender].