Первая глава: Введение в хранилище AWS

Отказ от ответственности: эта статья является частью серии статей.

1. Дорога к специалисту по архитектору решений AWS: обзор

2. Путь к AWS SAA: S3, простая служба хранения Amazon

3. Путь к AWS SAA: безопасность и бессерверность

4. Путь к AWS SAA: управление доступом к удостоверениям (IAM)

5. Путь к AWS SAA: EC2, Elastic Compute Cloud (1/2)

6. Путь к AWS SAA: EC2, Elastic Compute Cloud (2/2)

7. Путь к AWS SAA: базы данных

8. Путь к AWS SAA: Route53

9. Путь к AWS SAA: виртуальные частные облака, виртуальные частные облака

10. Путь к AWS SAA: архитектура высокой доступности

11. Путь к AWS SAA: приложения

Это… пара ведер? Да да это. Не волнуйтесь - это немного обретет смысл. Мы собираемся поговорить о сервисе хранения AWS. Хотя официальное название - Simple Storage Service, оно широко известно как S3. Цитата из официальной документации:

Amazon Simple Storage Service (Amazon S3) - это сервис объектного хранилища, который предлагает лучшую в отрасли масштабируемость, доступность данных, безопасность и производительность. Это означает, что клиенты всех размеров и отраслей могут использовать его для хранения и защиты любого объема данных для различных сценариев использования, таких как озера данных, веб-сайты, мобильные приложения, резервное копирование и восстановление, архивирование, корпоративные приложения, устройства IoT и большие аналитика данных. Amazon S3 предоставляет простые в использовании функции управления, позволяющие систематизировать данные и настраивать точно настроенные средства управления доступом в соответствии с конкретными бизнес-требованиями, требованиями организации и нормативными требованиями. Amazon S3 рассчитан на надежность 99,999999999% (11 9) и хранит данные для миллионов приложений для компаний по всему миру.

Это файловая служба. Сохраненные объекты, размер которых может составлять от 0 байтов до 5 ТБ, помещаются в структуры, называемые корзинами (отсюда и изображение статьи - извините). Каждая учетная запись имеет ограничение в 100 сегментов, хотя по запросу оно может быть увеличено.

S3 - универсальное пространство имен, что означает, что все имена должны быть уникальными в глобальном масштабе. Каждый загруженный объект имеет:

  • Ключ: Название объекта.
  • Значение: сам объект.
  • Идентификатор версии: совершенно очевидно, что используется для управления версиями.
  • Метаданные.

S3 имеет согласованность чтения после записи для PUT новых объектов - однако PUT существующих объектов (т. Е. Обновлений) и DELETE имеют конечную согласованность, что означает, что для распространения может потребоваться некоторое время.

По умолчанию все новые сегменты являются частными, и существует три основных способа обмена сегментами между учетными записями: если нам нужно разделить весь сегмент, мы можем использовать политики сегментов и IAM. Если нам нужно поделиться отдельными объектами, мы можем использовать списки управления доступом к ведру или ACL. Если нам нужно совместно использовать отдельные объекты и по какой-либо причине нам нужен консольный доступ, мы можем использовать роли IAM для нескольких учетных записей.

S3 имеет ограничение на количество запросов на префикс в секунду. префикс - это любая строка без фиксированного количества символов между именем сегмента и именем объекта:

  • ведро / папка1 / подпапка1 / файл
  • ведро / 1 / файл

Распределение операций чтения по префиксам приводит к повышению производительности.

Для межрегиональной репликации управление версиями должно быть включено как для источника, так и для пункта назначения. Существующие файлы не реплицируются автоматически, но все последующие обновления реплицируются. Обратите внимание, что удаление маркеров или отдельных версий не повторяется.

Функции

  • Управление версиями: отлично подходит для резервного копирования и отката.
  • Шифрование: может быть выполнено при передаче (SSL / TLS), на стороне сервера (как с управляемыми ключами S3, так и с ключами, предоставленными клиентом) и на стороне клиента, локально перед загрузкой.
  • Удаление MFA: чтобы ничего не было удалено по ошибке.
  • Управление жизненным циклом: для автоматического управления действиями с файлом с течением времени. Например, мы можем захотеть переместить все в более глубокое (и более дешевое) хранилище после некоторого времени простоя.
  • Многоуровневое хранилище. Для данных существует несколько уровней. Сама служба S3 имеет доступность 99,9% и надежность 99,999999999%. Данные (не сервис!) Обладают такой же надежностью, но доступность различается. Стандартное и Интеллектуальное многоуровневое распределение имеет 99,9%, тогда как зона IA-One - 99,5%. Glacier и Deep Glacier, последние уровни, являются самыми дешевыми, поскольку для восстановления файлов может потребоваться больше времени или даже часов.
  • Блокировка: предотвращает удаление и / или изменение файлов на определенный период времени. В режиме управления пользователю потребуются особые разрешения для удаления файла - в режиме соответствия их нельзя удалить, даже root.
  • Многокомпонентная загрузка и выборка из диапазона байтов S3. Во-первых, большие файлы загружаются партиями, чтобы на них не повлиял сбой подключения. Второй точно так же, но для скачиваний.
  • S3 Select: извлекает из объекта только подмножество данных с помощью запросов, подобных SQL, что может обеспечить высокую производительность.

Инструменты

На S3 можно использовать множество встроенных инструментов.

  • Amazon S3 Transfer Acceleration: для передачи файлов на большие расстояния - использует CloudFront, см. ниже.
  • DataSync: копирует данные из / в помещение в / из S3, требуется установка агента DataSync. Автоматически шифрует и выполняет проверки целостности. Он используется для перемещения больших объемов данных - репликация может выполняться ежечасно, ежедневно или еженедельно и может использоваться для репликации EFS в EFS.
  • Snowball (и даже больше!): Решение для транспортировки данных петабайтного масштаба, по сути, это очень большой жесткий диск. 50 ТБ, 80 ТБ или Snowball Edge, устройство емкостью 100 ТБ со встроенным хранилищем и вычислительными возможностями. Если вам нужно больше, есть AWS Snowmobile, который в буквальном смысле представляет собой грузовик с емкостью до 100 ПБ.
  • Athena: служба интерактивных запросов, которая позволяет анализировать данные с помощью стандартного SQL без необходимости настраивать конвейер ETL. Оплата по запросу / сканированию ТБ.
  • Macie: Служба безопасности, которая использует ML и NLP для обнаружения, классификации и защиты конфиденциальных данных, хранящихся в S3, таких как личная информация, позволяющая установить личность. Он также используется для анализа журналов CloudTrail на предмет подозрительной информации API.

Помимо этих, есть два таких больших инструмента, которым требуется отдельное место в этой статье: CloudFront и Storage Gateway.

CloudFront

Сеть доставки контента: доставляет веб-контент пользователю в зависимости от его географического положения, происхождения и сервера доставки контента.

  • Происхождение: источник файлов; может быть сегмент S3, EC2, ELB или Route53.
  • Расположение края: где будет кэшироваться контент.
  • Распространение: набор крайних локаций.

CloudFront может кэшировать весь веб-сайт: динамический, статический, потоковый и / или интерактивный контент. Распространение может быть веб-распространением для веб-сайтов или RTMP для потоковой передачи мультимедиа. Некоторые примечания по этому поводу: местоположения краев не только для чтения - их можно записать, а объекты кэшируются на время жизни или TTL. Очистить кешированное содержимое можно, но за это взимается плата.

Есть два основных варианта ограничения доступа для определенных людей: подписанные URL-адреса, которые действительны для одного файла, и файлы cookie, которые действительны для нескольких файлов. Оба имеют прикрепленную политику, которая может включать дату истечения срока действия или диапазон IP-адресов.

Шлюз хранения

Соединяет локальное программное обеспечение с облачным хранилищем. Программное обеспечение можно загрузить как виртуальную машину (ESXi или Hyper-V) для установки на хост.

Выделяют четыре типа:

  • Файловый шлюз: файлы хранятся как объекты в корзине S3 и доступны через точку монтирования NFS. Право собственности, разрешения и временные метки хранятся в метаданных.
  • Volume Gateway. Представляет приложение, использующее блочный протокол iSCSI, а записанные данные асинхронно копируются в AWS в виде инкрементного моментального снимка на определенный момент времени, хранящегося в EBS. Этот вариант обеспечивает низкую задержку, поскольку данные сначала хранятся локально, и надежные резервные копии за пределами площадки.
  • Cached Volume Gateway: буквально наоборот, данные сначала сохраняются в AWS, а наиболее часто используемые в шлюзе хранилища сохраняются в качестве кеша. Это обеспечивает низкую задержку и устраняет необходимость масштабирования локальной инфраструктуры.
  • Виртуальная ленточная библиотека шлюза: устаревший вариант с лентами.

Вот и все, ребята! Очень краткое изложение всего, что связано с S3, что необходимо для экзамена SAA, согласно отличному курсу Крооненбурга и Рихмана.

Будьте на связи!

использованная литература

Райан Крооненбург и Марк Ричман, Партнер по архитектуре решений, сертифицированный AWS, SAA-C02, 2021 г.

Бен Пайпер и Дэвид Клинтон, Учебное пособие для сертифицированных архитекторов решений, Sybex, 2019.

Больше контента на plainenglish.io