Этот вопрос тесно связан с тем, который я задал здесь, но это не так. такой же.
Мой вопрос: предположим, у меня есть сложенные данные, и я хочу повернуть эту таблицу по дате и имени. Мой вопрос: когда есть неоднозначные значения (более одного значения для одной и той же даты и имени), как я могу выбрать между ними?
Name Date Value
a 2016-05-01 5
b 2016-05-01 7
c 2016-05-01 7
c 2016-05-01 8
a 2016-06-01 4
b 2016-06-01 3
c 2016-06-01 2
d 2016-06-01 2
В идеале я хотел бы «выбрать» окончательное значение на основе другого столбца. Например, предположим, что мой набор данных:
Name Date Value PublishDate
a 2016-05-01 5 2016-04-01
b 2016-05-01 7 2016-04-01
c 2016-05-01 7 2016-03-01
c 2016-05-01 8 2016-04-01
a 2016-06-01 4 2016-04-01
b 2016-06-01 3 2016-04-01
c 2016-06-01 2 2016-04-01
d 2016-06-01 2 2016-04-01
Затем между дубликатами [c,2016-05-01] я бы хотел, чтобы тот, который был опубликован последним, остался (PublishDate=2016-04-01), а другой был удален.
Возможно ли?
В конечном итоге мне нужен этот вывод, чтобы я мог выполнять над ним матричные операции.
Data/Name a b c d
2016-05-01 5 7 8 NaN
2016-06-01 4 3 2 2
Я рассмотрел этот вопрос, но это не так. совершенно то же самое, так как я хочу, чтобы одно значение было отброшено на основе своего рода «правила».
Но этот вопрос дает представление о том, что может быть какое-то использование pandas.pivot_table, чтобы помочь ее выполнить. Но я не мог найти его.
Спасибо !
Stock
иDate
. Является ли это возможным ? 11.04.2016Date
иStock
, а сами значения. Я обновил вопрос, чтобы подчеркнуть, что в конечном итоге мне нужна матрица для выполнения матричных операций над Это. Если бы вы могли решить эти вопросы в своем ответе, я был бы очень благодарен 11.04.2016