R - наиболее широко используемый язык программирования для анализа и интеллектуального анализа данных. Когда вы впервые начинаете работать с R, это может показаться немного, но пугающим, если вы новичок, а иногда даже для профессионалов в области статистики, поскольку синтаксис может быть немного новым.

Есть несколько способов получить доступ к R. Вы можете установить его на свой Mac, ПК или Linux и запустить с терминала. Вы также можете установить различные клиенты, которые помогут вам улучшить взаимодействие с пользователем.

Datazar, с другой стороны, предлагает облачный клиент для R. Это означает, что вы можете использовать R прямо в браузере и анализировать данные, создавать диаграммы, использовать пакеты и делиться своими результатами.

Создание проекта

После входа в Datazar нажмите кнопку «Новый проект» в правом верхнем углу и заполните всплывающее окно названием своего проекта. Когда закончите, нажмите «Создать проект», и все готово! Вы создали свой проект.

Выбор интерфейса R

Теперь у вас есть выбор между двумя интерфейсами R: консоль R и ноутбук R. Оба одинаково полезны, и на самом деле все сводится к предпочтениям.

Пойдем пока с консолью R. Щелкните по кнопке «R Console». Вы попадете в только что созданную консоль R. Он немного напоминает терминал и имеет поле ввода текста внизу.

Консоль R

Вот и все. Это ваш портал в R, и у него безумно потрясающая функциональность. Давайте проверим это с помощью быстрой команды hello world message.

> message("Hello World")

R поставляется с наборами данных, уже включенными в основную программу. Итак, давайте воспользуемся знаменитым набором данных iris и поэкспериментируем с ним. Мы запустим две команды, как показано ниже:

> iris
> head(iris)

Первая команда вернет весь набор данных, а вторая команда вернет первую часть набора данных.

Консоль R поддерживает историю команд, поэтому вы можете использовать стрелки на клавиатуре для перехода к предыдущим командам.

Теперь посмотрим на графику. Консоль R вернет графику вместе с текстом вместо отдельного окна, как в терминале. Использование консоли дает вам более естественное ощущение с некоторыми дополнительными вещами.

Импорт внешних наборов данных

Иметь очень сложный интерфейс бесполезно, если вы не можете использовать данные, которые вы собрали или собрали. Давайте посмотрим, как вы можете использовать CSV в своей консоли.

Над консолью есть кнопка с названием «Файл». Он покажет вам список файлов, которые у вас есть в вашем проекте. Установите флажок рядом с файлом, который вы хотите импортировать в консоль R, и нажмите «Загрузить выбранные файлы». Это гарантирует, что загружаются только те файлы, которые вы хотите использовать в своем сеансе, и сохраняет ваше рабочее пространство в чистоте.

Давайте сохраним набор данных в переменной под названием набор данных:

> dataset<-read.csv("Dataset.csv")

Поскольку этот набор данных довольно длинный, давайте возьмем его часть и сохраним в другой переменной с именем sample:

> sample<-dataset[1:100,]

И, наконец, постройте образец набора данных:

> with(sample,plot(exper,wage,col=union))

Импорт внешних функций

Метод импорта внешних функций в рабочую область R точно такой же, как метод импорта наборов данных. После того, как вы импортировали нужную функцию из своего проекта, используйте следующую функцию, чтобы использовать ее:

> source("customFunction.r")

Этот файл R может быть сценарием R, содержащим все ваши настраиваемые повторно используемые функции. Или даже функции, которые вы скопировали откуда-то еще.

Использовать внешние библиотеки

Если вы хотите наполнить свое рабочее пространство R дополнительными пакетами, все, что вам нужно сделать, - запустить эту функцию:

> library("someLibrary")

R имеет бесконечное количество пакетов R, которые регулярно вносятся сообществом. Такие пакеты, как ggplot2, оживят ваш опыт работы с R.

Ноутбук R

Хотя мы использовали консоль R на протяжении всего руководства, вот как она выглядела бы, если бы была сделана с интерфейсом ноутбука R.

Блокноты R очень полезны, когда вы хотите вернуться и отредактировать код, особенно если вы работаете в команде и вам нужен более презентабельный формат. С другой стороны, консоли R отлично подходят для быстрых и грязных исследований. Грязно, потому что будут показаны все ваши ошибки и команды. Опять же, это все личные предпочтения.

Ссылки

Не стесняйтесь копировать мой файл и экспериментировать с ним:

Консоль R: https://www.datazar.com/file/f3cc3548b-7aa5-419c-83af-03139317ccae

Ноутбук R: https://www.datazar.com/file/f4e42b36f-944a-4f81-b1eb-688fc7ae9bf5

Ресурсы

Полезные ресурсы и документация при использовании R:

CRAN Инструкции



R-блогеры



Блог Datazar: R Language



R Репетитор: Знакомство