Во-первых, мои извинения, если мой вопрос был сформулирован не лучшим образом.
Я буду использовать образец данных, чтобы проиллюстрировать свой вопрос.
medals = pd.DataFrame({'Year':[2010,2010,2010,2010,2010,2010,2014,2014,2014,2014,2014,2014,2018,2018,2018,2018,2018,2018],'Country': ['Canada','Canada','USA','USA','Germany','Germany','Canada','Canada','USA','USA','Germany','Germany','Canada','Canada','USA','USA','Germany','Germany'],'Sex': ['female','male','female','male','female','male','female','male','female','male','female','male','female','male','female','male','female','male'],
'No. of medals': [2,4,2,0,3,0,1,1,3,2,4,4,1,3,2,2,1,3]})
Предположим, у меня есть этот кадр данных стран и количество медалей, которые они выиграли на Олимпийских играх:
Year Country Sex No. of medals
0 2010 Canada female 2
1 2010 Canada male 4
2 2010 USA female 2
3 2010 USA male 0
4 2010 Germany female 3
5 2010 Germany male 0
6 2014 Canada female 1
7 2014 Canada male 1
8 2014 USA female 3
9 2014 USA male 2
10 2014 Germany female 4
11 2014 Germany male 4
12 2018 Canada female 1
13 2018 Canada male 3
14 2018 USA female 2
15 2018 USA male 2
16 2018 Germany female 1
17 2018 Germany male 3
допустим, я хочу добавить столбец, показывающий общее количество медалей, выигранных страной в этом году:
Year Country Sex No. of medals Total medals
0 2010 Canada female 2 6
1 2010 Canada male 4 6
2 2010 USA female 2 2
3 2010 USA male 0 2
4 2010 Germany female 3 3
5 2010 Germany male 0 3
6 2014 Canada female 1 2
7 2014 Canada male 1 2
8 2014 USA female 3 5
9 2014 USA male 2 5
10 2014 Germany female 4 8
11 2014 Germany male 4 8
12 2018 Canada female 1 4
13 2018 Canada male 3 4
14 2018 USA female 2 4
15 2018 USA male 2 4
16 2018 Germany female 1 4
17 2018 Germany male 3 4
Как мне это сделать? Я дошел до группировки по стране и году и получения суммы, но я не уверен, как сопоставить ее со столбцом «Год и страна».
medals.groupby(['Year','Country'])['No. of medals'].sum()
дает мне это:
Year Country
2010 Canada 6
Germany 3
USA 2
2014 Canada 2
Germany 8
USA 5
2018 Canada 4
Germany 4
USA 4
Name: No. of medals, dtype: int64
Был бы очень признателен за любые советы и указатели. Спасибо!