Доклад

Внутри метастора S3: эволюция современного хранилища метаданных

Метастор в S3-совместимом хранилище — это сердце системы: он хранит все данные кроме содержания объектов, проводит через себя как объемную клиентскую нагрузку, так и тяжелые асинхронные фоновые операции по сбору статистики, выполнению правил жизненного цикла или обслуживанию внутренних структур. Мы прошли несколько итераций в развитии нашего метастора на базе Cassandra и готовы поделиться опытом разработки производительной распределенной системы на примере хранилища метаданных для S3.

В докладе обсудим:

  • Как эффективно сканировать миллиарды версий объектов, не перегружая систему.
  • Как собирать статистику по бакетам в реальном времени.
  • Как быстро искать пустые директории в метаданных с помощью фильтра Блума.
  • Почему использовать Cassandra как очередь — плохая идея.

Доклад будет полезен другим разработчикам S3-совместимых хранилищ и всем, кто проектирует высоконагруженные системы с большим объемом метаданных и асинхронной обработкой.

Спикеры

Доклады