Это мой начальный кадр данных:
продажиDf
| itemName | sales_quantity |
|---|---|
| Apple | 200 |
| Apple | 400 |
| Pear | 300 |
| Pear | 500 |
| Banana | 300 |
salesDf.where(col('sales_quantity') > 300)\
.groupBy(col('itemName')).agg(sum(col('sales_quantity')))
| itemName | sales_quantity |
|---|---|
| Apple | 400 |
| Pear | 500 |
но я хотел бы что-то вроде этого
| itemName | sales_quantity |
|---|---|
| Apple | 400 |
| Pear | 500 |
| Banana | 0 |
или даже лучше
| itemName | sales_quantity |
|---|---|
| Apple | 400 |
| Pear | 500 |
| Banana | 0 |
| Pineapple | 0 |
Могу ли я указать в сгруппированном столбце значения, которые я хочу показать? Спасибо