У меня есть data.frame категориальных переменных, которые я разделил на группы, и я получил счетчики для каждой группы.
My original data nyD looks like:
Source: local data frame [7 x 3]
Groups: v1, v2, v3
v1 v2 v3
1 a plus yes
2 a plus yes
3 a minus no
4 b minus yes
5 b x yes
6 c x notk
7 c x notk
I performed the following operations using dplyr:
ny1 <- nyD %>% group_by(v1,v2,v3)%>%
summarise(count=n()) %>%
mutate(prop = count/sum(count))
My data "ny1" looks like:
Source: local data frame [5 x 5]
Groups: v1, v2
v1 v2 v3 count prop
1 a minus no 1 1
2 a plus yes 2 1
3 b minus yes 1 1
4 b x yes 1 1
5 c x notk 2 1
Я хочу рассчитать относительную частоту по отношению к группам V1 в переменной prop. Переменная prop должна быть соответствующим счетчиком, деленным на «сумму счетчиков для группы V1». В группе V1 всего 3 «a», 2 «b» и 1 «c». То есть ny1 $ prop [1] ‹- 1/3, ny1 $ prop [2]‹ - 2/3 .... Операция изменения, когда использование count / sum (count) неверно. Уточняю, что сумма должна быть переведена только на группу V1. Есть ли способ использовать dplyr для этого?
count(df, v1, v2) %>% mutate(prop = n/sum(n))
01.01.2015group()
также важен и определяет способ вычисления относительных пропорций. 19.12.2016