WedX - журнал о программировании и компьютерных науках

Сортировка вывода tally / count (dplyr)

Это должно быть легко, но я не могу найти прямой способ добиться этого. Мой набор данных выглядит следующим образом:

                DisplayName Nationality Gender Startyear
1           Alfred H. Barr, Jr.    American   Male      1929
2               Paul C\216zanne      French   Male      1929
3                  Paul Gauguin      French   Male      1929
4              Vincent van Gogh       Dutch   Male      1929
5         Georges-Pierre Seurat      French   Male      1929
6            Charles Burchfield    American   Male      1929
7                Charles Demuth    American   Male      1929
8             Preston Dickinson    American   Male      1929
9              Lyonel Feininger    American   Male      1929
10 George Overbury ("Pop") Hart    American   Male      1929
...

Я хочу сгруппировать по DisplayName и Gender и получить количество для каждого из имен (они повторяются в списке несколько раз с разной информацией о годе).

Следующие 2 команды дают мне один и тот же результат, но они не отсортированы по количеству выходных данных «n». Любые идеи о том, как этого добиться?

artists <- data %>%
  filter(!is.na(Gender) & Gender != "NULL") %>%
  group_by(DisplayName, Gender) %>%
  tally(sort = T) %>%
  arrange(desc(n))


artists <- data %>%
  filter(!is.na(Gender) & Gender != "NULL") %>%
  count(DisplayName, Gender, sort = T)


                 DisplayName Gender     n
                       (chr)  (chr) (int)
1              A. F. Sherman   Male     1
2             A. G. Fronzoni   Male     2
3         A. Lawrence Kocher   Male     3
4            A. M. Cassandre   Male    21
5             A. R. De Ycaza Female     1
6  A.R. Penck (Ralf Winkler)   Male    20
7              Aaron Siskind   Male    25
8         Abigail Perlmutter Female     1
9            Abraham Rattner   Male     5
10         Abraham Walkowitz   Male    17
..                       ...    ...   ...
06.03.2016

Ответы:


1

Ваши данные сгруппированы по двум переменным. Таким образом, после tally ваш фрейм данных по-прежнему группируется по отображаемому имени. Итак, arrange(desc(n)) сортирует, но по отображаемому имени. Если вы хотите отсортировать весь фрейм данных по столбцу n, просто разгруппируйте перед сортировкой. попробуй это :

artists <- data %>%
  filter(!is.na(Gender) & Gender != "NULL") %>%
  group_by(DisplayName, Gender) %>%
  tally(sort = T) %>%
  ungroup() %>%
  arrange(desc(n))
06.03.2016
Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]