Использовать Scrapy с Amazon S3 довольно просто, вы устанавливаете:
- FEED_URI = 's3: // MYBUCKET / feeds /% (имя) s /% (время) s.jl'
- FEED_FORMAT = 'jsonlines'
- AWS_ACCESS_KEY_ID = [ключ доступа]
- AWS_SECRET_ACCESS_KEY = [секретный ключ]
и все работает нормально.
Но Scrapyd, похоже, отменяет этот параметр и сохраняет элементы на сервере (со ссылкой на веб-сайте).
Добавление параметра "items_dir =", похоже, ничего не меняет.
Какие настройки заставляют его работать?
РЕДАКТИРОВАТЬ: Дополнительная информация, которая может быть актуальной - мы используем Scrapy-Heroku.