Это мой начальный кадр данных:
продажиDf
itemName | sales_quantity |
---|---|
Apple | 200 |
Apple | 400 |
Pear | 300 |
Pear | 500 |
Banana | 300 |
salesDf.where(col('sales_quantity') > 300)\
.groupBy(col('itemName')).agg(sum(col('sales_quantity')))
itemName | sales_quantity |
---|---|
Apple | 400 |
Pear | 500 |
но я хотел бы что-то вроде этого
itemName | sales_quantity |
---|---|
Apple | 400 |
Pear | 500 |
Banana | 0 |
или даже лучше
itemName | sales_quantity |
---|---|
Apple | 400 |
Pear | 500 |
Banana | 0 |
Pineapple | 0 |
Могу ли я указать в сгруппированном столбце значения, которые я хочу показать? Спасибо