R - наиболее широко используемый язык программирования для анализа и интеллектуального анализа данных. Когда вы впервые начинаете работать с R, это может показаться немного, но пугающим, если вы новичок, а иногда даже для профессионалов в области статистики, поскольку синтаксис может быть немного новым.
Есть несколько способов получить доступ к R. Вы можете установить его на свой Mac, ПК или Linux и запустить с терминала. Вы также можете установить различные клиенты, которые помогут вам улучшить взаимодействие с пользователем.
Datazar, с другой стороны, предлагает облачный клиент для R. Это означает, что вы можете использовать R прямо в браузере и анализировать данные, создавать диаграммы, использовать пакеты и делиться своими результатами.
Создание проекта
После входа в Datazar нажмите кнопку «Новый проект» в правом верхнем углу и заполните всплывающее окно названием своего проекта. Когда закончите, нажмите «Создать проект», и все готово! Вы создали свой проект.
Выбор интерфейса R
Теперь у вас есть выбор между двумя интерфейсами R: консоль R и ноутбук R. Оба одинаково полезны, и на самом деле все сводится к предпочтениям.
Пойдем пока с консолью R. Щелкните по кнопке «R Console». Вы попадете в только что созданную консоль R. Он немного напоминает терминал и имеет поле ввода текста внизу.
Консоль R
Вот и все. Это ваш портал в R, и у него безумно потрясающая функциональность. Давайте проверим это с помощью быстрой команды hello world message.
> message("Hello World")
R поставляется с наборами данных, уже включенными в основную программу. Итак, давайте воспользуемся знаменитым набором данных iris и поэкспериментируем с ним. Мы запустим две команды, как показано ниже:
> iris > head(iris)
Первая команда вернет весь набор данных, а вторая команда вернет первую часть набора данных.
Консоль R поддерживает историю команд, поэтому вы можете использовать стрелки на клавиатуре для перехода к предыдущим командам.
Теперь посмотрим на графику. Консоль R вернет графику вместе с текстом вместо отдельного окна, как в терминале. Использование консоли дает вам более естественное ощущение с некоторыми дополнительными вещами.
Импорт внешних наборов данных
Иметь очень сложный интерфейс бесполезно, если вы не можете использовать данные, которые вы собрали или собрали. Давайте посмотрим, как вы можете использовать CSV в своей консоли.
Над консолью есть кнопка с названием «Файл». Он покажет вам список файлов, которые у вас есть в вашем проекте. Установите флажок рядом с файлом, который вы хотите импортировать в консоль R, и нажмите «Загрузить выбранные файлы». Это гарантирует, что загружаются только те файлы, которые вы хотите использовать в своем сеансе, и сохраняет ваше рабочее пространство в чистоте.
Давайте сохраним набор данных в переменной под названием набор данных:
> dataset<-read.csv("Dataset.csv")
Поскольку этот набор данных довольно длинный, давайте возьмем его часть и сохраним в другой переменной с именем sample:
> sample<-dataset[1:100,]
И, наконец, постройте образец набора данных:
> with(sample,plot(exper,wage,col=union))
Импорт внешних функций
Метод импорта внешних функций в рабочую область R точно такой же, как метод импорта наборов данных. После того, как вы импортировали нужную функцию из своего проекта, используйте следующую функцию, чтобы использовать ее:
> source("customFunction.r")
Этот файл R может быть сценарием R, содержащим все ваши настраиваемые повторно используемые функции. Или даже функции, которые вы скопировали откуда-то еще.
Использовать внешние библиотеки
Если вы хотите наполнить свое рабочее пространство R дополнительными пакетами, все, что вам нужно сделать, - запустить эту функцию:
> library("someLibrary")
R имеет бесконечное количество пакетов R, которые регулярно вносятся сообществом. Такие пакеты, как ggplot2, оживят ваш опыт работы с R.
Ноутбук R
Хотя мы использовали консоль R на протяжении всего руководства, вот как она выглядела бы, если бы была сделана с интерфейсом ноутбука R.
Блокноты R очень полезны, когда вы хотите вернуться и отредактировать код, особенно если вы работаете в команде и вам нужен более презентабельный формат. С другой стороны, консоли R отлично подходят для быстрых и грязных исследований. Грязно, потому что будут показаны все ваши ошибки и команды. Опять же, это все личные предпочтения.
Ссылки
Не стесняйтесь копировать мой файл и экспериментировать с ним:
Консоль R: https://www.datazar.com/file/f3cc3548b-7aa5-419c-83af-03139317ccae
Ноутбук R: https://www.datazar.com/file/f4e42b36f-944a-4f81-b1eb-688fc7ae9bf5
Ресурсы
Полезные ресурсы и документация при использовании R:
CRAN Инструкции
R-блогеры
Блог Datazar: R Language
R Репетитор: Знакомство